توضیحات
Massive modern datasets make traditional data structures and algorithms grind to a halt. This fun and practical guide introduces cutting-edge techniques that can reliably handle even the largest distributed datasets.
In Algorithms and Data Structures for Massive Datasets you will learn:
Probabilistic sketching data structures for practical problems
Choosing the right database engine for your application
Evaluating and designing efficient on-disk data structures and algorithms
Understanding the algorithmic trade-offs involved in massive-scale systems
Deriving basic statistics from streaming data
Correctly sampling streaming data
Computing percentiles with limited space resources
Algorithms and Data Structures for Massive Datasets reveals a toolbox of new methods that are perfect for handling modern big data applications. Youll explore the novel data structures and algorithms that underpin Google, Facebook, and other enterprise applications that work with truly massive amounts of data. These effective techniques can be applied to any discipline, from finance to text analysis. Graphics, illustrations, and hands-on industry examples make complex ideas practical to implement in your projectsand theres no mathematical proofs to puzzle over. Work through this one-of-a-kind guide, and youll find the sweet spot of saving space without sacrificing your datas accuracy.
About the technology
Standard algorithms and data structures may become slowor fail altogetherwhen applied to large distributed datasets. Choosing algorithms designed for big data saves time, increases accuracy, and reduces processing cost. This unique book distills cutting-edge research papers into practical techniques for sketching, streaming, and organizing massive datasets on-disk and in the cloud.
About the book
Algorithms and Data Structures for Massive Datasets introduces processing and analytics techniques for large distributed data. Packed with industry stories and entertaining illustrations, this friendly guide makes even complex concepts easy to understand. Youll explore real-world examples as you learn to map powerful algorithms like Bloom filters, Count-min sketch, HyperLogLog, and LSM-trees to your own use cases.
What’s inside
Probabilistic sketching data structures
Choosing the right database engine
Designing efficient on-disk data structures and algorithms
Algorithmic tradeoffs in massive-scale systems
Computing percentiles with limited space resources
About the reader
Examples in Python, R, and pseudocode.
About the author
Dzejla Medjedovic earned her PhD in the Applied Algorithms Lab at Stony Brook University, New York. Emin Tahirovic earned his PhD in biostatistics from University of Pennsylvania. Illustrator Ines Dedovic earned her PhD at the Institute for Imaging and Computer Vision at RWTH Aachen University, Germany.
————————————————————–
ترجمه ماشینی :
مجموعه دادههای مدرن عظیم، ساختارهای داده سنتی و الگوریتمها را متوقف میکند. این راهنمای سرگرمکننده و کاربردی، تکنیکهای پیشرفتهای را معرفی میکند که میتوانند بهطور قابل اعتمادی حتی بزرگترین مجموعه دادههای توزیعشده را مدیریت کنند. \ در الگوریتمها و ساختارهای داده برای مجموعههای داده عظیم یاد میگیرید: \ ترسیم احتمالی ساختارهای داده برای مسائل عملی انتخاب موتور پایگاه داده مناسب برای برنامه شما ارزیابی و طراحی ساختارها و الگوریتمهای داده کارآمد روی دیسک درک تجارت الگوریتمی اشکالات درگیر در سیستمهای مقیاس عظیم استخراج آمار اولیه از جریان داده نمونهبرداری صحیح از دادههای جریان صدکهای محاسباتی با منابع فضایی محدود \ الگوریتمها و ساختارهای داده برای مجموعههای داده عظیم جعبه ابزاری از روشهای جدید را نشان میدهد که برای مدیریت برنامههای مدرن کلان داده عالی هستند. . شما ساختارهای داده جدید و الگوریتمهایی را که زیربنای Google، Facebook، و سایر برنامههای کاربردی سازمانی هستند که با مقادیر واقعاً عظیمی از داده کار میکنند، بررسی خواهید کرد. این تکنیک های موثر را می توان در هر رشته ای، از امور مالی گرفته تا تجزیه و تحلیل متن، به کار برد. گرافیک، تصاویر، و مثالهای کاربردی صنعت، ایدههای پیچیده را برای پیادهسازی در پروژههای شما کاربردی میسازد و هیچ دلیل ریاضی برای معما وجود ندارد. از طریق این راهنمای منحصر به فرد کار کنید، و نقطه شیرین صرفه جویی در فضا را بدون به خطر انداختن دقت داده های خود خواهید یافت. درباره فناوری الگوریتمهای استاندارد و ساختارهای داده ممکن است در صورت اعمال به مجموعه دادههای توزیعشده بزرگ، به طور کلی کندتر شوند. انتخاب الگوریتم های طراحی شده برای داده های بزرگ باعث صرفه جویی در زمان، افزایش دقت و کاهش هزینه پردازش می شود. این کتاب منحصر به فرد، مقالات تحقیقاتی پیشرفته را به تکنیک های عملی برای ترسیم، پخش جریانی، و سازماندهی مجموعه داده های عظیم روی دیسک و در فضای ابری تقطیر می کند. \ درباره کتاب \ الگوریتمها و ساختارهای داده برای مجموعههای داده عظیم، تکنیکهای پردازش و تحلیل را برای دادههای توزیعشده بزرگ معرفی میکند. این راهنمای دوستانه که مملو از داستانهای صنعتی و تصاویر سرگرمکننده است، حتی مفاهیم پیچیده را به راحتی درک میکند. وقتی یاد می گیرید الگوریتم های قدرتمندی مانند فیلترهای بلوم، طرح شمارش دقیقه، HyperLogLog و درختان LSM را به موارد استفاده خود نگاشت کنید، نمونه های دنیای واقعی را کاوش خواهید کرد. داخل چه چیزی ترسیم احتمالی ساختارهای داده انتخاب موتور پایگاه داده مناسب طراحی ساختارها و الگوریتم های داده کارآمد روی دیسک معاوضه الگوریتمی در سیستم های مقیاس عظیم صدک های محاسباتی با منابع فضایی محدود درباره خواننده \ مثال هایی در پایتون، R و شبه کد. درباره نویسنده ژیلا مدجدوویچ دکترای خود را در آزمایشگاه الگوریتم های کاربردی در دانشگاه استونی بروک نیویورک گرفت. امین طاهیروویچ دکترای خود را در رشته آمار زیستی از دانشگاه پنسیلوانیا دریافت کرد. اینس دد
tag : دانلود کتاب الگوریتم ها و ساختارهای داده برای مجموعه داده های عظیم , Download الگوریتم ها و ساختارهای داده برای مجموعه داده های عظیم , دانلود الگوریتم ها و ساختارهای داده برای مجموعه داده های عظیم , Download Algorithms and Data Structures for Massive Datasets Book , الگوریتم ها و ساختارهای داده برای مجموعه داده های عظیم دانلود , buy الگوریتم ها و ساختارهای داده برای مجموعه داده های عظیم , خرید کتاب الگوریتم ها و ساختارهای داده برای مجموعه داده های عظیم , دانلود کتاب Algorithms and Data Structures for Massive Datasets , کتاب Algorithms and Data Structures for Massive Datasets , دانلود Algorithms and Data Structures for Massive Datasets , خرید Algorithms and Data Structures for Massive Datasets , خرید کتاب Algorithms and Data Structures for Massive Datasets ,

نقد و بررسیها
هنوز بررسیای ثبت نشده است.