توضیحات
Machine learning methods are now an important tool for scientists, researchers,
engineers, and students in a wide range of areas. Many years ago, one could publish
papers introducing (say) classifiers to one of the many fields that hadnt heard of
them. Now, you need to know what a classifier is to get started in most fields. This
book is written for people who want to adopt and use the main tools of machine
learning but arent necessarily going to want to be machine learning researchersas
of writing, this seems like almost everyone. There is no new fact about machine
learning here, but the selection of topics is my own. I think its different from what
one sees in other books.
The book is revised and corrected from class notes written for a course Ive
taught on numerous occasions to very broad audiences. Most students were at the
final year undergraduate/first year graduate student level in a US university. About
half of each class consisted of students who werent computer science students but
still needed a background in learning methods. The course stressed applying a wide
range of methods to real datasets, and the book does so, too.
The key principle in choosing what to write about was to cover the ideas in
machine learning that I thought everyone who was going to use learning tools should
have seen, whatever their chosen specialty or career. Although its never a good
thing to be ignorant of anything, an author must choose. Most people will find a
broad shallow grasp of this field more useful than a deep and narrow grasp, so this
book is broad, and coverage of many areas is shallow. I think thats fine, because
my purpose is to ensure that all have seen enough to know that, say, firing up a
classification package will make many problems go away. So Ive covered enough to
get you started and to get you to realize that its worth knowing more.
The notes I wrote have been useful to more experienced students as well. In
my experience, many learned some or all of this material without realizing how
useful it was and then forgot it. If this happened to you, I hope the book is a
stimulus to your memory. You really should have a grasp of all of this material.
You might need to know more, but you certainly shouldnt know less.
This Book
I wrote this book to be taught, or read, by starting at the beginning and proceeding
to the end. In a 15-week semester, I cover a lot and usually set 12 assignments, always programming assignments. Different instructors or readers may have different
needs, and so I sketch some pointers to what can be omitted below.
What You Need to Know Before You Start
This book assumes you have a moderate background in probability and statistics
before you start. I wrote a companion book, Probability and Statistics for Computer Science, which covers this background. There is a little overlap, because not
everyone will read both books cover to cover (a mistakeyou should!). But Ive
kept the overlap small (about 40 pp.) and confined to material that is better repeated anyway. Heres what you should know from that book (or some other, if
you insist):
Various descriptive statistics (mean, standard deviation, variance) and visualization methods for 1D datasets
Scatter plots, correlation, and prediction for 2D datasets
A little discrete probability
A very little continuous probability (rough grasp of probability density functions and how to interpret them)
Random variables and expectations
A little about samples and populations
Maximum likelihood
Simple Bayesian inference
A selection of facts about an assortment of useful probability distributions,
or where to look them up
General Background: Your linear algebra should be reasonably fluent at
a practical level. Fairly soon, we will see matrices, vectors, orthonormal matrices,
eigenvalues, eigenvectors, and the singular value decomposition. All of these ideas
will be used without too much comment.
Programming Background: You should be able to pick up a practical
grasp of a programming environment without too much fuss. I use either R or
MATLAB for this sort of thing, depending on how reliable I think a particular
package is. You should, too. In some places, its a good idea to use Python.
Survival Skills: Most simple questions about programming can be answered
by searching. I usually use a web search to supply details of syntax, particular
packages, etc. which I forget easily. You should, too. When someone asks me, say,
how do I write a loop in R? in office hours, I very often answer by searching for
R loop (or whatever) and then pointing out that Im not actually needed. The
questioner is often embarrassed at this point. You could save everyone trouble and
embarrassment by cutting out the middleman in this transaction.
Datasets and Broken Links
I think using real datasets is an important feature of this book. But real life is
messy, and datasets I refer to here may have been moved by the time you read
this. Generally, a little poking around using a web search engine will find datasets
or items that have been moved. I will also try to provide pointers to missing or
moved datasets on a webpage which will also depend from my home page. Its easy
to find me on the Internet by searching for my name, and ignoring the soap opera
star (thats really not me).
Citations
Generally, I have followed the natural style of a textbook and tried not to cite papers
in the text. Im not up to providing a complete bibliography of modern machine
learning and didnt want to provide an incomplete one. However, I have mentioned
papers in some places and have done so when it seemed very important for users
to be aware of the paper or when I was using a dataset whose compilers asked for
a citation. I will try to correct errors or omissions in citation on a webpage, which
will depend from my home page.
What Has Been Omitted
A list of everything omitted would be impractically too long. There are three
topics I most regret omitting: kernel methods, reinforcement learning, and neural
sequence models like LSTM. I omitted each because I thought that, while each is
an important part of the toolbox of a practitioner, there are other topics with more
claim on space. I may well write additional chapters on these topics after I recover
from finishing this book. When theyre in a reasonable shape, Ill put them on a
webpage that depends from my home page.
There is very little learning theory here. While learning theory is very important (and I put in a brief chapter to sketch whats there and give readers a flavor), it
doesnt directly change what practitioners do. And theres quite a lot of machinery
with weak theoretical underpinnings that is extremely useful.
————————————————————–
ترجمه ماشینی :
روشهای یادگیری ماشین اکنون ابزار مهمی برای دانشمندان، محققان، مهندسان و دانشجویان در طیف وسیعی از زمینهها هستند. سالها پیش، میتوان مقالههایی را منتشر کرد که (مثلاً) طبقهبندیکنندهها را به یکی از زمینههایی که نام آنها را نشنیده بودند، معرفی کرد. اکنون، برای شروع در بیشتر زمینه ها باید بدانید که طبقه بندی کننده چیست. این کتاب برای افرادی نوشته شده است که می خواهند ابزارهای اصلی یادگیری ماشینی را بپذیرند و از آنها استفاده کنند اما لزوماً نمی خواهند بخواهند محقق یادگیری ماشینی مانند نوشتن باشند، به نظر می رسد تقریباً همه اینها هستند. هیچ واقعیت جدیدی در مورد یادگیری ماشینی در اینجا وجود ندارد، اما انتخاب موضوعات مربوط به من است. من فکر می کنم با آنچه در کتاب های دیگر می بیند متفاوت است. کتاب از یادداشتهای کلاسی که برای دورهای نوشته شده است، اصلاح و تصحیح شده است. اکثر دانشجویان در مقطع کارشناسی / سال اول در مقطع کارشناسی در یکی از دانشگاه های ایالات متحده بودند. حدود نیمی از هر کلاس را دانشآموزانی تشکیل میدادند که دانشجوی علوم کامپیوتر نبودند اما هنوز به پیشزمینهای در روشهای یادگیری نیاز داشتند. این دوره بر استفاده از طیف وسیعی از روشها برای مجموعه دادههای واقعی تأکید داشت، و کتاب نیز این کار را انجام میدهد. اصل کلیدی در انتخاب مطالبی که درباره آن بنویسید، پوشش ایدههایی در یادگیری ماشینی بود که فکر میکردم همه کسانی که میخواهند از ابزارهای یادگیری استفاده کنند، فارغ از تخصص یا شغلی که انتخاب کردهاند، باید آنها را ببینند. اگرچه نادانی از چیزی هرگز خوب نیست، نویسنده باید انتخاب کند. بیشتر مردم درک سطحی وسیع از این زمینه را مفیدتر از درک عمیق و باریک می دانند، بنابراین این کتاب گسترده است و پوشش بسیاری از مناطق کم عمق است. من فکر می کنم خوب است، زیرا هدف من این است که اطمینان حاصل کنم که همه به اندازه کافی دیده اند تا بدانند که مثلاً راه اندازی یک بسته طبقه بندی بسیاری از مشکلات را برطرف می کند. بنابراین به اندازه کافی پوشش داده ام تا شما را شروع کنم و متوجه شوید که ارزش دانستن بیشتر دارد. یادداشت هایی که نوشتم برای دانش آموزان با تجربه تر نیز مفید بوده است. در تجربه من، بسیاری از آنها برخی یا همه این مطالب را بدون اینکه بدانند چقدر مفید است یاد گرفتند و سپس آن را فراموش کردند. اگر این اتفاق برای شما افتاده است، امیدوارم کتاب محرکی برای حافظه شما باشد. شما واقعاً باید همه این مطالب را درک کنید. شاید لازم باشد بیشتر بدانید، اما مطمئناً نباید کمتر بدانید. این کتاب من این کتاب را نوشتم تا با شروع از ابتدا و ادامه تا انتها آموزش داده شود یا خوانده شود. در یک ترم 15 هفته ای، من خیلی چیزها را پوشش می دهم و معمولاً 12 تکلیف می گذارم، همیشه تکالیف برنامه نویسی. مربیان یا خوانندگان مختلف ممکن است نیازهای متفاوتی داشته باشند، بنابراین من برخی از نکات را برای مواردی که در زیر می توان حذف کرد، ترسیم می کنم. آنچه باید قبل از شروع بدانید این کتاب فرض می کند که پیش از شروع، پیشینه متوسطی در احتمالات و آمار دارید. من یک کتاب همراه با عنوان احتمال و آمار برای علوم کامپیوتر نوشتم که این پیشینه را پوشش می دهد. کمی همپوشانی وجود دارد، زیرا همه هر دو کتاب را روی جلد نمیخوانند (اشتباهی که باید!). اما Ive همپوشانی را کوچک نگه داشت (حدود 40 صفحه) و محدود به مطالبی بود که به هر حال بهتر است تکرار شوند. این چیزی است که باید از آن کتاب (یا کتاب دیگر، اگر اصرار دارید) بدانید: آمار توصیفی مختلف (میانگین، انحراف استاندارد، واریانس) و روشهای تجسم برای مجموعه دادههای 1 بعدی نمودار پراکندگی، همبستگی و پیشبینی برای مجموعه دادههای دو بعدی A احتمال گسسته اندک احتمال پیوسته بسیار کمی (درک کلی از توابع چگالی احتمال و نحوه تفسیر آنها) متغیرهای تصادفی و انتظارات کمی در مورد نمونه ها و جمعیت ها حداکثر احتمال استنتاج ساده بیزی مجموعه ای از حقایق در مورد مجموعه ای از توزیعهای احتمال مفید، یا کجا باید آنها را جستجو کرد سابقه عمومی: جبر خطی شما باید در سطح عملی به طور منطقی روان باشد. به زودی، ماتریسها، بردارها، ماتریسهای متعارف، مقادیر ویژه، بردارهای ویژه و تجزیه مقدار منفرد را خواهیم دید. همه این ایده ها بدون نظر زیاد مورد استفاده قرار خواهند گرفت. پیشینه برنامه نویسی: شما باید بتوانید بدون سر و صدای زیاد محیط برنامه نویسی را به طور عملی درک کنید. من از R یا MATLAB برای این نوع چیزها استفاده می کنم، بسته به اینکه یک بسته خاص چقدر قابل اعتماد است. شما هم باید. در بعضی جاها، استفاده از پایتون ایده خوبی است. مهارت های بقا: اکثر سوالات ساده در مورد برنامه نویسی را می توان با جستجو پاسخ داد. من معمولاً از جستجوی وب برای ارائه جزئیات نحو، بسته های خاص و غیره استفاده می کنم که به راحتی فراموش می کنم. شما هم باید. وقتی کسی از من می پرسد، بگویید چگونه یک حلقه در R بنویسم؟ در ساعات اداری، من اغلب با جستجوی حلقه R (یا هر چیز دیگری) پاسخ میدهم و سپس اشاره میکنم که واقعاً مورد نیاز نیستم. پرسشگر اغلب در این مرحله خجالت می کشد. شما می توانید با حذف واسطه در این معامله، همه را از دردسر و شرم نجات دهید. Datasets and Broken Links من فکر می کنم استفاده از مجموعه داده های واقعی یکی از ویژگی های مهم این کتاب است. اما زندگی واقعی درهم و برهم است، و مجموعه داده هایی که در اینجا به آنها اشاره می کنم ممکن است با خواندن این جابجا شده باشند. به طور کلی، کمی جستجو با استفاده از یک موتور جستجوی وب، مجموعه دادهها یا مواردی را که منتقل شدهاند پیدا میکند. من همچنین سعی خواهم کرد نشانگرهایی را برای مجموعه داده های گمشده یا منتقل شده در یک صفحه وب ارائه کنم که به صفحه اصلی من نیز بستگی دارد. پیدا کردن من در اینترنت با جستجوی نامم و نادیده گرفتن ستاره ستاره سریال (این واقعاً من نیستم) آسان است. استنادها به طور کلی، من از سبک طبیعی یک کتاب درسی پیروی کردهام و سعی کردهام از مقالهها در متن استفاده نکنم. من نمیخواهم کتابشناسی کاملی از یاد
tag : دانلود کتاب یادگیری ماشین کاربردی , Download یادگیری ماشین کاربردی , دانلود یادگیری ماشین کاربردی , Download Applied Machine Learning Book , یادگیری ماشین کاربردی دانلود , buy یادگیری ماشین کاربردی , خرید کتاب یادگیری ماشین کاربردی , دانلود کتاب Applied Machine Learning , کتاب Applied Machine Learning , دانلود Applied Machine Learning , خرید Applied Machine Learning , خرید کتاب Applied Machine Learning ,

نقد و بررسیها
هنوز بررسیای ثبت نشده است.