توضیحات
The Web is getting faster, and the data it delivers is getting bigger. How can you handle everything efficiently? This book introduces Spark, an open source cluster computing system that makes data analytics fast to run and fast to write. Youll learn how to run programs faster, using primitives for in-memory cluster computing. With Spark, your job can load data into memory and query it repeatedly much quicker than with disk-based systems like Hadoop MapReduce.
Written by the developers of Spark, this book will have you up and running in no time. Youll learn how to express MapReduce jobs with just a few simple lines of Spark code, instead of spending extra time and effort working with Hadoops raw Java API.
Quickly dive into Spark capabilities such as collect, count, reduce, and save
Use one programming paradigm instead of mixing and matching tools such as Hive, Hadoop, Mahout, and S4/Storm
Learn how to run interactive, iterative, and incremental analyses
Integrate with Scala to manipulate distributed datasets like local collections
Tackle partitioning issues, data locality, default hash partitioning, user-defined partitioners, and custom serialization
Use other languages by means of pipe() to achieve the equivalent of Hadoop streaming
————————————————————–
ترجمه ماشینی :
وب سریعتر می شود و داده هایی که ارائه می دهد بزرگتر می شود. چگونه می توانید همه چیز را به طور موثر اداره کنید؟ این کتاب Spark را معرفی میکند، یک سیستم محاسباتی خوشهای منبع باز که باعث میشود تجزیه و تحلیل دادهها سریع اجرا شود و سریع بنویسد. شما یاد خواهید گرفت که چگونه برنامه ها را سریعتر اجرا کنید، با استفاده از اولیه ها برای محاسبات خوشه ای در حافظه. با Spark، کار شما میتواند دادهها را در حافظه بارگیری کند و به طور مکرر آن را جستجو کند، بسیار سریعتر از سیستمهای مبتنی بر دیسک مانند Hadoop MapReduce.
این کتاب توسط توسعهدهندگان Spark نوشته شده است. هیچ وقت شما یاد خواهید گرفت که چگونه کارهای MapReduce را تنها با چند خط ساده کد Spark بیان کنید، به جای صرف زمان و تلاش اضافی برای کار با Hadoops raw Java API.
به سرعت در قابلیت های Spark مانند جمع آوری، شمارش، کاهش و ذخیره
استفاده از یک الگوی برنامه نویسی به جای ترکیب و تطبیق ابزارهایی مانند Hive، Hadoop، Mahout، و S4/Storm
یادگیری نحوه اجرای تحلیل های تعاملی، تکراری و افزایشی< br /> برای دستکاری مجموعه داده های توزیع شده مانند مجموعه های محلی با Scala ادغام کنید
برطرف کردن مسائل پارتیشن بندی، محل داده ها، پارتیشن بندی پیش فرض هش، پارتیشن بندی های تعریف شده توسط کاربر، و سریال سازی سفارشی
از زبان های دیگر با استفاده از pipe() استفاده کنید. معادل استریم Hadoop را بدست آورید
tag : دانلود کتاب Spark یادگیری , Download Spark یادگیری , دانلود Spark یادگیری , Download Learning Spark Book , Spark یادگیری دانلود , buy Spark یادگیری , خرید کتاب Spark یادگیری , دانلود کتاب Learning Spark , کتاب Learning Spark , دانلود Learning Spark , خرید Learning Spark , خرید کتاب Learning Spark ,

نقد و بررسیها
هنوز بررسیای ثبت نشده است.