توضیحات
This book contains a fast-paced introduction to data-related tasks in preparation for training models on datasets. It presents a step-by-step, Python-based code sample that uses the kNN algorithm to manage a model on a dataset. Next, you will see other classification algorithms (on the same dataset), such as decision trees, random forests, SVMs (support vector machines), and Naive Bayes simply by modifying three lines of code. Chapter One begins with an introduction to datasets and issues that can arise, followed by Chapter Two on outliers and anomaly detection. The next chapter explores ways for handling missing data and invalid data, and Chapter Four demonstrates how to train models with classification algorithms. Chapter 5 introduces visualization toolkits, such as Sweetviz, Skimpy, Matplotlib, and Seaborn, along with some simple Python-based code samples that render charts and graphs. An appendix includes some basics on using Awk.
What do i need to know for this book?
The minimum programming requirement is a basic knowledge of Python 3.x because all the code samples are in Python. In some cases, you need a rudimentary understanding of the awk utility, which you can learn through free online tutorials. In addition, you need ta basic understanding of Pandas data frames and the Pandas methods for extracting information from data frames.
Features:
– Covers extensive topics related to cleaning datasets and working with models
– Includes Python-based code samples and a separate chapter on Matplotlib and Seaborn
– Features companion files with source code, datasets, and figures from the book
————————————————————–
ترجمه ماشینی :
این کتاب شامل مقدمه ای سریع برای وظایف مرتبط با داده در آماده سازی برای مدل های آموزشی در مجموعه داده ها است. این یک نمونه کد گام به گام مبتنی بر پایتون را ارائه می دهد که از الگوریتم kNN برای مدیریت یک مدل بر روی یک مجموعه داده استفاده می کند. در مرحله بعد، سایر الگوریتمهای طبقهبندی (در همان مجموعه داده)، مانند درختهای تصمیم، جنگلهای تصادفی، SVM (ماشینهای بردار پشتیبانی) و Naive Bayes را به سادگی با اصلاح سه خط کد مشاهده خواهید کرد. فصل اول با مقدمهای بر مجموعه دادهها و مسائلی که ممکن است پیش بیاید آغاز میشود، سپس فصل دوم در مورد موارد پرت و تشخیص ناهنجاریها میآید. فصل بعدی راههای مدیریت دادههای از دست رفته و دادههای نامعتبر را بررسی میکند و فصل چهارم نحوه آموزش مدلها با الگوریتمهای طبقهبندی را نشان میدهد. فصل 5 ابزارهای تجسم، مانند Sweetviz، Skimpy، Matplotlib و Seaborn را به همراه چند نمونه کد ساده مبتنی بر پا
tag : دانلود کتاب مدیریت مجموعه داده ها و مدل ها , Download مدیریت مجموعه داده ها و مدل ها , دانلود مدیریت مجموعه داده ها و مدل ها , Download Managing Datasets and Models Book , مدیریت مجموعه داده ها و مدل ها دانلود , buy مدیریت مجموعه داده ها و مدل ها , خرید کتاب مدیریت مجموعه داده ها و مدل ها , دانلود کتاب Managing Datasets and Models , کتاب Managing Datasets and Models , دانلود Managing Datasets and Models , خرید Managing Datasets and Models , خرید کتاب Managing Datasets and Models ,

نقد و بررسیها
هنوز بررسیای ثبت نشده است.