Data Science at the Command Line: Obtain, Scrub, Explore, and Model Data with Unix Power Tools

This thoroughly revised guide demonstrates how the flexibility of the command line can help you become a more efficient and productive data scientist

Data Science at the Command Line: Obtain, Scrub, Explore, and Model Data with Unix Power Tools

Janssens, Jeroen

O'Reilly Media

2021

Abstract

This thoroughly revised guide demonstrates how the flexibility of the command line can help you become a more efficient and productive data scientist. You'll learn how to combine small yet powerful command-line tools to quickly obtain, scrub, explore, and model your data. To get you started, author Jeroen Janssens provides a Docker image packed with over 100 Unix power tools - useful whether you work with Windows, macOS, or Linux.You'll quickly discover why the command line is an agile, scalable, and extensible technology. Even if you're comfortable processing data with Python or R, you'll learn how to greatly improve your data science workflow by leveraging the command line's power. This book is ideal for data scientists, analysts, engineers, system administrators, and researchers. - Obtain data from websites, APIs, databases, and spreadsheets; - Perform scrub operations on text, CSV, HTML, XML, and JSON files; - Explore data, compute descriptive statistics, and create visualizations; - Manage your data science workflow; - Create your own tools from one-liners and existing Python or R code; - Parallelize and distribute data-intensive pipelines; - Model data with dimensionality reduction, regression, and classification algorithms; - Leverage the command line from Python, Jupyter, R, RStudio, and Apache Spark.

Citation

Janssens, Jeroen. Data Science at the Command Line: Obtain, Scrub, Explore, and Model Data with Unix Power Tools. O'Reilly Media, 2021

Collection

Lĩnh vực Công nghệ thông tin

Related document

Data Science at the Command Line: Obtain, Scrub, Explore, and Model Data with Unix Power ToolsInternet of Things (IoT) for Automated and Smart ApplicationsMạng nơ-rôn và ứng dụng trong xử lý tín hiệu
Data Science at the Command Line: Obtain, Scrub, Explore, and Model Data with Unix Power ToolsInternet of Things (IoT) for Automated and Smart ApplicationsMạng nơ-rôn và ứng dụng trong xử lý tín hiệu

QR code

Data Science at the Command Line: Obtain, Scrub, Explore, and Model Data with Unix Power Tools

Content

  • Thứ Hai, 13:45 11/11/2024

Tin tiêu điểm

Hướng dẫn khai thác và sử dụng Thư viện Đại học Công nghiệp Hà Nội năm 2024

Hướng dẫn khai thác và sử dụng Thư viện Đại học Công nghiệp Hà Nội năm 2024

Thứ Ba, 14:33 17/09/2024

PGS.TS Nguyễn Thị Hồng Nga, Giám đốc - Trung tâm Đào tạo Sau đại học trao tặng 02 đầu sách ngoại văn cho Trung tâm Thông tin - Thư viện

Thứ Sáu, 07:37 24/05/2024
Hướng dẫn khai thác Bộ sưu tập tài nguyên giáo dục mở (OER)

Hướng dẫn khai thác Bộ sưu tập tài nguyên giáo dục mở (OER)

Thứ Bảy, 15:58 04/05/2024

Truy cập hàng triệu sách điện tử miễn phí với The Online Books Page

Thứ Hai, 08:38 22/01/2024
5 khóa học miễn phí về thiết kế đồ họa

5 khóa học miễn phí về thiết kế đồ họa

Thứ Tư, 09:33 13/12/2023

Các bài đã đăng

Philosophy of Computer Science: An Introductory Course

Philosophy of Computer Science: An Introductory Course

Thứ Năm, 14:08 21/11/2024
Our Extractive Age: Expressions of Violence and Resistance

Our Extractive Age: Expressions of Violence and Resistance

Thứ Năm, 14:03 21/11/2024
Understanding the DOM: Document Object Model

Understanding the DOM: Document Object Model

Thứ Năm, 13:58 21/11/2024
Heat Treatment Conventional and Novel Applications

Heat Treatment Conventional and Novel Applications

Thứ Năm, 13:51 21/11/2024
Swift Notes for Professionals

Swift Notes for Professionals

Thứ Năm, 13:42 21/11/2024

Creative Scala

Thứ Hai, 13:38 11/11/2024

Computer Graphics from Scratch: A Programmer's Introduction to 3D Rendering

Thứ Hai, 13:25 11/11/2024

Introduction to Autonomous Robots

Thứ Hai, 13:16 11/11/2024

Aerial Robots Aerodynamics, Control and Applications

Thứ Hai, 13:10 11/11/2024

Advances in Gas Turbine Technology

Thứ Hai, 10:29 04/11/2024