توضیحات
Data is bigger, arrives faster, and comes in a variety of formatsand it all needs to be processed at scale for analytics or machine learning. But how can you process such varied workloads efficiently? Enter Apache Spark.
Updated to include Spark 3.0, this second edition shows data engineers and data scientists why structure and unification in Spark matters. Specifically, this book explains how to perform simple and complex data analytics and employ machine learning algorithms. Through step-by-step walk-throughs, code snippets, and notebooks, youll be able to:
- Learn Python, SQL, Scala, or Java high-level Structured APIs
- Understand Spark operations and SQL Engine
- Inspect, tune, and debug Spark operations with Spark configurations and Spark UI
- Connect to data sources: JSON, Parquet, CSV, Avro, ORC, Hive, S3, or Kafka
- Perform analytics on batch and streaming data using Structured Streaming
- Build reliable data pipelines with open source Delta Lake and Spark
- Develop machine learning pipelines with MLlib and productionize models using MLflow
————————————————————–
ترجمه ماشینی :
دادهها بزرگتر هستند، سریعتر به دست میآیند، و در قالبهای مختلف ارائه میشوند و همه آنها باید در مقیاس برای تجزیه و تحلیل یا یادگیری ماشین پردازش شوند. اما چگونه می توانید چنین بارهای کاری متنوعی را به طور موثر پردازش کنید؟ وارد آپاچی اسپارک شوید.
این ویرایش دوم که برای گنجاندن Spark 3.0 بهروزرسانی شده است، به مهندسان داده و دانشمندان داده نشان میدهد که چرا ساختار و یکپارچگی در Spark مهم است. به طور خاص، این کتاب نحوه انجام تجزیه و تحلیل داده های ساده و پیچیده و استفاده از الگوریتم های یادگیری ماشین را توضیح می دهد. از طریق مراحل گام به گام، تکه کدها و نوت بوک ها، می توانید:
- آی پیتون، SQL، Scala یا جاوا را با ساختار بالا بیاموزید
- بازرسی، تنظیم و اشکال زدایی عملیات Spark با تنظیمات Spark و Spark UI
- اتصال به منابع داده: JSON، Parquet، CSV، Avro، ORC , Hive, S3, یا Kafka
- انجام تجزیه و تحلیل داده های دسته ای و جریانی با استفاده از جریان ساخت یافته
- ایجاد خطوط لوله داده قابل اعتماد با منبع باز Delta Lake و Spark
- Develop خطوط لوله یادگیری ماشین با MLlib و تولید مدل ها با استفاده از MLflow
<. li>درک عملیات Spark و SQL Engine
tag : دانلود کتاب Learning Spark: Lightning-Fast Data Analytics , Download Learning Spark: Lightning-Fast Data Analytics , دانلود Learning Spark: Lightning-Fast Data Analytics , Download Learning Spark: Lightning-Fast Data Analytics Book , Learning Spark: Lightning-Fast Data Analytics دانلود , buy Learning Spark: Lightning-Fast Data Analytics , خرید کتاب Learning Spark: Lightning-Fast Data Analytics , دانلود کتاب Learning Spark: Lightning-Fast Data Analytics , کتاب Learning Spark: Lightning-Fast Data Analytics , دانلود Learning Spark: Lightning-Fast Data Analytics , خرید Learning Spark: Lightning-Fast Data Analytics , خرید کتاب Learning Spark: Lightning-Fast Data Analytics ,

نقد و بررسیها
هنوز بررسیای ثبت نشده است.