توضیحات
As an aspiring data scientist, you appreciate why organizations rely on data for important decisions–whether it’s for companies designing websites, cities deciding how to improve services, or scientists discovering how to stop the spread of disease. And you want the skills required to distill a messy pile of data into actionable insights. We call this the Data Science lifecycle: the process of collecting, wrangling, analyzing, and drawing conclusions from data.
Learning Data Science is the first book to cover foundational skills in both programming and statistics that encompass this entire lifecycle. It’s aimed at those who wish to become data scientists or who already work with data scientists, and at data analysts who wish to cross the ‘technical/nontechnical’ divide. If you have a basic knowledge of Python programming, you’ll learn how to work with data using industry-standard tools like Pandas.
This book covers fundamental principles and skills that data scientists need to help make all sorts of important decisions. With both technical skills and conceptual understanding we can work on data-centric problems to, say, assess whether a vaccine works, filter out fake news automatically, calibrate air quality sensors, and advise analysts on policy changes. To help you keep track of the bigger picture, weve organized topics around a workflow that we call the data science lifecycle. In this chapter, we introduce this lifecycle. Unlike other data science books that tend to focus on one part of the lifecycle or address only computational or statistical topics, we cover the entire cycle from start to finish and consider both statistical and computational aspects together.
Data scientists work with data stored in tables. The Chapter 3 introduces dataframes, one of the most widely used ways to represent data tables. Well also introduce Pandas, the standard Python package for working with dataframes. Data types in a programming sense refers to how a computer stores data internally. For instance, the size column has a string data type in Python. But from a statistical point of view, the size column stores ordered categorical data (ordinal data). We talk more about this specific distinction in the next chapter. In this chapter, well show you how to do common dataframe operations using pandas. Data scientists use the Pandas library when working with dataframes in Python. First, well explain the main objects that pandas provides: the DataFrame and Series classes. Then, well show you how to use pandas to perform common data manipulation tasks, like slicing, filtering, sorting, grouping, and joining.
Refine a question of interest to one that can be studied with data
Pursue data collection that may involve text processing, web scraping, etc.
Glean valuable insights about data through data cleaning, exploration, and visualization
Learn how to use modeling to describe the data
Generalize findings beyond the data
————————————————————–
ترجمه ماشینی :
به عنوان یک دانشمند مشتاق داده، شما قدردانی می کنید که چرا سازمان ها برای تصمیم گیری های مهم به داده ها اعتماد می کنند – چه برای شرکت هایی که وب سایت طراحی می کنند، چه شهرهایی که تصمیم می گیرند چگونه خدمات را بهبود بخشند، یا دانشمندانی که کشف می کنند چگونه از گسترش بیماری جلوگیری کنند. و شما مهارت های مورد نیاز برای تقطیر انبوهی از داده های نامرتب را به بینش های عملی می خواهید. ما این را چرخه حیات علم داده می نامیم: فرآیند جمع آوری، بحث، تجزیه و تحلیل و نتیجه گیری از داده ها. یادگیری علم داده اولین کتابی است که مهارت های اساسی در برنامه نویسی و آمار را پوشش می دهد که کل این چرخه عمر را در بر می گیرد. هدف آن کسانی است که میخواهند دانشمند داده شوند یا قبلاً با دانشمندان داده کار میکنند و تحلیلگران دادهای که میخواهند از شکاف «فنی/غیر فنی» عبور کنند. اگر دانش اولیه برنامه نویسی پایتون دارید، نحوه کار با داده ها را با استفاده از ابزارهای استاندارد صنعتی مانند پانداها یاد خواهید گرفت. این کتاب اصول و مهارتهایی را پوشش میدهد که دانشمندان داده برای کمک به گرفتن انواع تصمیمات مهم به آن نیاز دارند. با مهارتهای فنی و درک مفهومی، میتوانیم روی مشکلات دادهمحور کار کنیم تا مثلاً ارزیابی کنیم که آیا یک واکسن کار میکند یا خیر، اخبار جعلی را بهطور خودکار فیلتر کنیم، سنسورهای کیفیت هوا را کالیبره کنیم، و به تحلیلگران در مورد تغییرات سیاستها توصیه کنیم. برای کمک به شما در پیگیری تصویر بزرگتر، موضوعاتی را پیرامون جریان کاری سازماندهی کرده ایم که آن را چرخه حیات علم داده می نامیم. در این فصل به معرفی این چرخه حیات می پردازیم. برخلاف سایر کتابهای علم داده که تمایل دارند بر روی بخشی از چرخه حیات تمرکز کنند یا فقط به موضوعات محاسباتی یا آماری میپردازند، ما کل چرخه را از ابتدا تا انتها پوشش میدهیم و هر دو جنبه آماری و محاسباتی را با هم در نظر میگیریم. دانشمندان داده با داده های ذخیره شده در جداول کار می کنند. فصل 3 چارچوب های داده را معرفی می کند که یکی از پرکاربردترین روش ها برای نمایش جداول داده است. همچنین Pandas را معرفی کنید، بسته استاندارد پایتون برای کار با دیتافریم. انواع داده در مفهوم برنامه نویسی به نحوه ذخیره سازی داده ها توسط کامپیوتر در داخل اشاره دارد. به عنوان مثال، ستون اندازه دارای یک نوع داده رشته ای در پایتون است. اما از نقطه نظر آماری، ستون اندازه داده های طبقه بندی شده (داده های ترتیبی) را ذخیره می کند. در فصل بعدی بیشتر در مورد این تمایز خاص صحبت می کنیم. در این فصل، به خوبی به شما نشان می دهیم که چگونه با استفاده از پانداها، عملیات رایج دیتافریم را انجام دهید. دانشمندان داده هنگام کار با دیتافریم در پایتون از کتابخانه پانداها استفاده می کنند. ابتدا، اشیاء اصلی را که پانداها ارائه میدهند به خوبی توضیح دهید: کلاسهای DataFrame و Series. سپس، به شما نشان دهید که چگونه از پانداها برای انجام کارهای معمول دستکاری داده ها، مانند برش، فیلتر کردن، مرتب سازی، گروه بندی و پیوستن استفاده کنید. یک سوال مورد علاقه را که میتوان با دادهها مطالعه کرد اصلاح کنید جمعآوری دادهها را دنبال کنید که ممکن است شامل پردازش متن، حذف وب و غیره باشد. برای توصیف داده ها تعمیم یافته ها فراتر از داده ها
tag : دانلود کتاب یادگیری علم داده: مبانی برنامه نویسی و آمار با استفاده از پایتون (نسخه اولیه ششم) , Download یادگیری علم داده: مبانی برنامه نویسی و آمار با استفاده از پایتون (نسخه اولیه ششم) , دانلود یادگیری علم داده: مبانی برنامه نویسی و آمار با استفاده از پایتون (نسخه اولیه ششم) , Download Learning Data Science: Programming and Statistics Fundamentals Using Python (Sixth Early Release) Book , یادگیری علم داده: مبانی برنامه نویسی و آمار با استفاده از پایتون (نسخه اولیه ششم) دانلود , buy یادگیری علم داده: مبانی برنامه نویسی و آمار با استفاده از پایتون (نسخه اولیه ششم) , خرید کتاب یادگیری علم داده: مبانی برنامه نویسی و آمار با استفاده از پایتون (نسخه اولیه ششم) , دانلود کتاب Learning Data Science: Programming and Statistics Fundamentals Using Python (Sixth Early Release) , کتاب Learning Data Science: Programming and Statistics Fundamentals Using Python (Sixth Early Release) , دانلود Learning Data Science: Programming and Statistics Fundamentals Using Python (Sixth Early Release) , خرید Learning Data Science: Programming and Statistics Fundamentals Using Python (Sixth Early Release) , خرید کتاب Learning Data Science: Programming and Statistics Fundamentals Using Python (Sixth Early Release) ,

نقد و بررسیها
هنوز بررسیای ثبت نشده است.