توضیحات
Think big about your data! PySpark brings the powerful Spark big data processing engine to the Python ecosystem, letting you seamlessly scale up your data tasks and create lightning-fast pipelines.
In Data Analysis with Python and PySpark you will learn how to:
Manage your data as it scales across multiple machines
Scale up your data programs with full confidence
Read and write data to and from a variety of sources and formats
Deal with messy data with PySparks data manipulation functionality
Discover new data sets and perform exploratory data analysis
Build automated data pipelines that transform, summarize, and get insights from data
Troubleshoot common PySpark errors
Creating reliable long-running jobs
Data Analysis with Python and PySpark is your guide to delivering successful Python-driven data projects. Packed with relevant examples and essential techniques, this practical book teaches you to build pipelines for reporting, machine learning, and other data-centric tasks. Quick exercises in every chapter help you practice what youve learned, and rapidly start implementing PySpark into your data systems. No previous knowledge of Spark is required.
About the technology
The Spark data processing engine is an amazing analytics factory: raw data comes in, insight comes out. PySpark wraps Sparks core engine with a Python-based API. It helps simplify Sparks steep learning curve and makes this powerful tool available to anyone working in the Python data ecosystem.
About the book
Data Analysis with Python and PySpark helps you solve the daily challenges of data science with PySpark. Youll learn how to scale your processing capabilities across multiple machines while ingesting data from any sourcewhether thats Hadoop clusters, cloud data storage, or local data files. Once youve covered the fundamentals, youll explore the full versatility of PySpark by building machine learning pipelines, and blending Python, pandas, and PySpark code.
What’s inside
Organizing your PySpark code
Managing your data, no matter the size
Scale up your data programs with full confidence
Troubleshooting common data pipeline problems
Creating reliable long-running jobs
About the reader
Written for data scientists and data engineers comfortable with Python.
About the author
As a ML director for a data-driven software company, Jonathan Rioux uses PySpark daily. He teaches the software to data scientists, engineers, and data-savvy business analysts.
————————————————————–
ترجمه ماشینی :
در مورد داده های خود بزرگ فکر کنید! PySpark موتور قدرتمند پردازش دادههای بزرگ Spark را به اکوسیستم پایتون میآورد و به شما این امکان را میدهد تا وظایف دادهتان را بهطور یکپارچه افزایش دهید و خطوط لولهای سریع ایجاد کنید. \ در تجزیه و تحلیل داده ها با پایتون و PySpark شما یاد خواهید گرفت که چگونه: داده های خود را در چند ماشین مدیریت کنید برنامه های داده خود را با اطمینان کامل بزرگ کنید داده ها را از منابع و قالب های مختلف بخوانید و بنویسید Deal با داده های آشفته با قابلیت دستکاری داده PySparks کشف مجموعه داده های جدید و انجام تجزیه و تحلیل داده های اکتشافی ساخت خطوط لوله داده خودکار که تبدیل، خلاصه و بینش از داده ها می شود عیب یابی خطاهای رایج PySpark ایجاد مشاغل طولانی مدت قابل اعتماد تجزیه و تحلیل داده با Python و PySpark راهنمای شما برای ارائه پروژههای داده موفق پایتون هستند. این کتاب کاربردی با نمونههای مرتبط و تکنیکهای ضروری، به شما میآموزد که خطوط لوله را برای گزارشدهی، یادگیری ماشین و سایر وظایف داده محور بسازید. تمرینات سریع در هر فصل به شما کمک می کند تا آنچه را که آموخته اید تمرین کنید و به سرعت PySpark را در سیستم های داده خود پیاده سازی کنید. هیچ دانش قبلی در مورد Spark مورد نیاز نیست. درباره فناوری موتور پردازش داده Spark یک کارخانه تجزیه و تحلیل شگفت انگیز است: داده های خام وارد می شوند، بینش ظاهر می شود. PySpark موتور هسته Sparks را با یک API مبتنی بر پایتون میپیچد. این به سادهسازی منحنی یادگیری پرشیب Sparks کمک میکند و این ابزار قدرتمند را برای هر کسی که در اکوسیستم داده پایتون کار میکند در دسترس قرار میدهد. درباره کتاب تجزیه و تحلیل داده با پایتون و PySpark به شما کمک می کند تا چالش های روزانه علم داده را با PySpark حل کنید. شما یاد خواهید گرفت که چگونه قابلیتهای پردازشی خود را در چندین ماشین در حین دریافت دادهها از هر منبعی اعم از خوشههای Hadoop، ذخیرهسازی دادههای ابری یا فایلهای داده محلی مقیاس کنید. هنگامی که اصول اولیه را پوشش دادید، تطبیق پذیری کامل PySpark را با ساخت خطوط لوله یادگیری ماشین و ترکیب Python، پانداها و کد PySpark کشف خواهید کرد. داخلش سازماندهی کد PySpark مدیریت داده های خود بدون توجه به اندازه برنامه های داده خود را با اطمینان کامل بزرگ کنید عیب یابی مشکلات رایج خط لوله داده ایجاد مشاغل طولانی مدت قابل اعتماد درباره خواننده برای دانشمندان داده نوشته شده است و مهندسان داده با پایتون راحت هستند. درباره نویسنده به عنوان مدیر ML برای یک شرکت نرم افزاری مبتنی بر داده، جاناتان ریوکس روزانه از PySpark استفاده می کند. او این نرم افزار را به دانشمندان داده، مهندسان و تحلیلگران کسب و کار باهوش داده آموزش می دهد.
tag : دانلود کتاب تجزیه و تحلیل داده ها با پایتون و پای اسپارک , Download تجزیه و تحلیل داده ها با پایتون و پای اسپارک , دانلود تجزیه و تحلیل داده ها با پایتون و پای اسپارک , Download Data Analysis with Python and PySpark Book , تجزیه و تحلیل داده ها با پایتون و پای اسپارک دانلود , buy تجزیه و تحلیل داده ها با پایتون و پای اسپارک , خرید کتاب تجزیه و تحلیل داده ها با پایتون و پای اسپارک , دانلود کتاب Data Analysis with Python and PySpark , کتاب Data Analysis with Python and PySpark , دانلود Data Analysis with Python and PySpark , خرید Data Analysis with Python and PySpark , خرید کتاب Data Analysis with Python and PySpark ,

نقد و بررسیها
هنوز بررسیای ثبت نشده است.