توضیحات
Clustering is the usual starting point for unsupervised machine learning. This lesson introduces the k-means and hierarchical clustering algorithms, implemented in Python code. Why is it important? Whenever you look at a data source, it’s likely that the data will somehow form clusters. Datasets with higher dimensions become increasingly more difficult to ‘eyeball’ based on human perception and intuition. These clustering algorithms allow you to discover similarities within data at scale, without first having to label a large training dataset. What you’ll learnand how you can apply it Understand how the k-means and hierarchical clustering algorithms work. Create classes in Python to implement these algorithms, and learn how to apply them in example applications. Identify clusters of similar inputs, and find a representative value for each cluster. Prepare to use your own implementations or reuse algorithms implemented in scikit-learn. This lesson is for you because People interested in data science need to learn how to implement k-means and bottom-up hierarchical clustering algorithms Prerequisites Some experience writing code in Python Experience working with data in vector or matrix format Materials or downloads needed in advance Download this code , where you’ll find this lesson’s code in Chapter 19, plus you’ll need the linear_algebra functions from Chapter 4. This lesson is taken from Data Science from Scratch by Joel Grus. Read more…
Abstract: Clustering is the usual starting point for unsupervised machine learning. This lesson introduces the k-means and hierarchical clustering algorithms, implemented in Python code. Why is it important? Whenever you look at a data source, it’s likely that the data will somehow form clusters. Datasets with higher dimensions become increasingly more difficult to ‘eyeball’ based on human perception and intuition. These clustering algorithms allow you to discover similarities within data at scale, without first having to label a large training dataset. What you’ll learnand how you can apply it Understand how the k-means and hierarchical clustering algorithms work. Create classes in Python to implement these algorithms, and learn how to apply them in example applications. Identify clusters of similar inputs, and find a representative value for each cluster. Prepare to use your own implementations or reuse algorithms implemented in scikit-learn. This lesson is for you because People interested in data science need to learn how to implement k-means and bottom-up hierarchical clustering algorithms Prerequisites Some experience writing code in Python Experience working with data in vector or matrix format Materials or downloads needed in advance Download this code , where you’ll find this lesson’s code in Chapter 19, plus you’ll need the linear_algebra functions from Chapter 4. This lesson is taken from Data Science from Scratch by Joel Grus
خوشه بندی نقطه شروع معمول برای یادگیری ماشینی بدون نظارت است. این درس به معرفی k-means و الگوریتم های خوشه بندی سلسله مراتبی، پیاده سازی شده در کد پایتون می پردازد. چرا مهم است؟ هر زمان که به یک منبع داده نگاه می کنید، این احتمال وجود دارد که داده ها به نوعی خوشه ها را تشکیل دهند. مجموعههای دادهای با ابعاد بالاتر بر اساس ادراک و شهود انسان به طور فزایندهای برای «کاه چشم» دشوارتر میشوند. این الگوریتمهای خوشهبندی به شما امکان میدهند شباهتهای موجود در دادهها را در مقیاس کشف کنید، بدون اینکه ابتدا یک مجموعه داده آموزشی بزرگ را برچسبگذاری کنید. آنچه یاد خواهید گرفت و چگونه می توانید آن را به کار ببرید درک کنید که k-means و الگوریتم های خوشه بندی سلسله مراتبی چگونه کار می کنند. برای پیاده سازی این الگوریتم ها کلاس هایی در پایتون ایجاد کنید و یاد بگیرید که چگونه آنها را در برنامه های کاربردی مثال اعمال کنید. خوشه هایی از ورودی های مشابه را شناسایی کنید و یک مقدار معرف برای هر خوشه پیدا کنید. برای استفاده از پیاده سازی های خود یا استفاده مجدد از الگوریتم های پیاده سازی شده در scikit-learn آماده شوید. این درس برای شما مناسب است، زیرا افراد علاقه مند به علم داده باید یاد بگیرند که چگونه الگوریتم های خوشه بندی سلسله مراتبی k-means و پایین به بالا را پیاده سازی کنند. این کد، جایی که کد این درس را در فصل 19 پیدا خواهید کرد، به علاوه به توابع linear_algebra از فصل 4 نیاز دارید. این درس از علم داده ها از ابتدا توسط جوئل گروس گرفته شده است. ادامه مطلب…
نقد و بررسیها
هنوز بررسیای ثبت نشده است.