توضیحات
This book presents some post-estimation and predictions strategies for the host of useful statistical models with applications in Data Science. It combines statistical learning and Machine Learning techniques in a unique and optimal way. It is well-known that Machine Learning methods are subject to many issues relating to bias, and consequently the mean squared error and prediction error may explode. For this reason, we suggest shrinkage strategies to control the bias by combining a submodel selected by a penalized method with a model with many features. Further, the suggested shrinkage methodology can be successfully implemented for high dimensional data analysis. Many researchers in statistics and medical sciences work with Big Data. They need to analyse this data through statistical modelling. Estimating the model parameters accurately is an important part of the data analysis. This book may be a repository for developing improve estimation strategies for statisticians. This book will help researchers and practitioners for their teaching and advanced research, and is an excellent textbook for advanced undergraduate and graduate courses involving shrinkage, statistical, and Machine Learning.
The term learning in Computer Science is referred to as a branch of Artificial Intelligence (AI) the design and development of algorithms that allows computers to evolve based on empirical data. The type of algorithm is what dictates the success of the Machine Learning (ML) system. Recently, Machine Learning has also been referred to as statistical learning because these algorithms have foundations in statistics. There are two main classes of algorithms, supervised and unsupervised learning. Models that people have most likely encountered are usually supervised learning, for example, prediction via logistic or multinomial regression. The differentiating factor between these two classes, is that supervised learning is concerned
with data that has labels and the researcher has an idea of what they are looking to predict.
In contrast, unsupervised learning is used when the researcher does not necessarily know what the data entails. In current times, people are overloaded with excessive data and simply figuring out what we are looking at can be a daunting task. Unsupervised learning techniques aids in exploring data, where no assumptions can be made. For example, survey data or medical data can be multidimensional and difficult to interpret; unsupervised algorithms can provide guidance on which variables are pertinent by providing representative variable identification. Unsupervised learning looks at how the data is grouped naturally based on where the data points exist in its multidimensional space. Unsupervised learning used with supervised learning can be a very powerful tool. One can input variables found via unsupervised methods into supervised prediction models, creating a stronger prediction model if such variables are found significant.
To provide a clear guide, this chapter will investigate popular classification and regression Machine Learning techniques. Classification methods range from the simplest of models to black-box learning. Regression models will build up from the basics and grow in complexity. Logistic regression, multivariate adaptive regression spline (MARS), k-nearest neighbours (kNN), neural nets, support vector machine, random forest, and gradient boosting machine will be discussed in the Chapter 2.
R has been a saving grace for many data scientists and statisticians alike. As research progresses, so have the computing packages. Table 2.1 is a list of R packages available that can perform the aforementioned Machine Learning techniques.
– The book succinctly reveals the bias inherited in Machine Learning method and successfully provides tools, tricks and tips to deal with the bias issue.
– Expertly sheds light on the fundamental reasoning for model selection and post estimation using shrinkage and related strategies.
– This presentation is fundamental, because shrinkage and other methods appropriate for model selection and estimation problems and there is a growing interest in this area to fill the gap between competitive strategies.
– Application of these strategies to real life data set from many walks of life.
– Analytical results are fully corroborated by numerical work and numerous worked examples are included in each chapter with numerous graphs for data visualization.
– The presentation and style of the book clearly makes it accessible to a broad audience. It offers rich, concise expositions of each strategy and clearly describes how to use each estimation strategy for the problem at hand.
– This book emphasizes that statistics/statisticians can play a dominant role in solving Big Data problems, and will put them on the precipice of scientific discovery.
– The book contributes novel methodologies for HDDA and will open a door for continued research in this hot area.
– The practical impact of the proposed work stems from wide applications. The developed computational packages will aid in analyzing a broad range of applications in many walks of life.
————————————————————–
ترجمه ماشینی :
این کتاب برخی از استراتژیهای پس از تخمین و پیشبینی را برای میزبان مدلهای آماری مفید با کاربرد در علم داده ارائه میکند. این تکنیک های یادگیری آماری و یادگیری ماشین را به روشی منحصر به فرد و بهینه ترکیب می کند. به خوبی شناخته شده است که روش های یادگیری ماشین در معرض بسیاری از مسائل مربوط به سوگیری هستند و در نتیجه میانگین مربعات خطا و خطای پیش بینی ممکن است منفجر شود. به همین دلیل، ما استراتژیهای انقباض را برای کنترل تعصب با ترکیب یک مدل فرعی انتخاب شده با روش جریمهشده با مدلی با ویژگیهای زیاد پیشنهاد میکنیم. علاوه بر این، روش انقباض پیشنهادی می تواند با موفقیت برای تجزیه و تحلیل داده های با ابعاد بالا اجرا شود. بسیاری از محققان در زمینه آمار و علوم پزشکی با داده های بزرگ کار می کنند. آنها باید این داده ها را از طریق مدل سازی آماری تجزیه و تحلیل کنند. برآورد دقیق پارامترهای مدل بخش مهمی از تجزیه و تحلیل داده ها است. این کتاب ممکن است مخزنی برای توسعه استراتژی های تخمین بهبود یافته برای آماردانان باشد. این کتاب به محققان و پزشکان برای آموزش و تحقیقات پیشرفته کمک می کند و یک کتاب درسی عالی برای دوره های پیشرفته کارشناسی و کارشناسی ارشد است که شامل کاهش، آمار و یادگیری ماشین است. اصطلاح یادگیری در علوم کامپیوتر به عنوان شاخه ای از هوش مصنوعی (AI) نامیده می شود که طراحی و توسعه الگوریتم هایی است که به رایانه ها اجازه می دهد بر اساس داده های تجربی تکامل یابند. نوع الگوریتم چیزی است که موفقیت سیستم یادگیری ماشینی (ML) را تعیین می کند. اخیراً از یادگیری ماشینی به عنوان یادگیری آماری نیز یاد می شود زیرا این الگوریتم ها پایه هایی در آمار دارند. دو دسته اصلی از الگوریتم ها وجود دارد، یادگیری تحت نظارت و بدون نظارت. مدل هایی که افراد به احتمال زیاد با آنها مواجه شده اند معمولاً یادگیری تحت نظارت هستند، به عنوان مثال، پیش بینی از طریق رگرسیون لجستیک یا چند جمله ای. عامل تمایز بین این دو کلاس، این است که یادگیری نظارت شده به داده هایی مربوط می شود که دارای برچسب هستند و محقق ایده ای از آنچه به دنبال پیش بینی آن است دارد. در مقابل، یادگیری بدون نظارت زمانی استفاده می شود که محقق لزوماً نمی داند داده ها مستلزم چیست. در زمانهای کنونی، مردم با دادههای بیش از حد پر شدهاند و به سادگی فهمیدن آنچه ما به آن نگاه میکنیم میتواند کار دلهرهآوری باشد. تکنیک های یادگیری بدون نظارت به کاوش در داده ها کمک می کند، جایی که هیچ فرضی نمی توان داشت. برای مثال، دادههای نظرسنجی یا دادههای پزشکی میتواند چند بعدی باشد و تفسیر آن دشوار باشد. الگوریتمهای بدون نظارت میتوانند با ارائه شناسایی متغیر نماینده، راهنمایی ارائه دهند که کدام متغیرها مرتبط هستند. یادگیری بدون نظارت به نحوه گروه بندی داده ها به طور طبیعی بر اساس مکان هایی که نقاط داده در فضای چند بعدی آن وجود دارد، می پردازد. یادگیری بدون نظارت که با یادگیری نظارت شده استفاده می شود می تواند ابزار بسیار قدرتمندی باشد. میتوان متغیرهایی را که از طریق روشهای بدون نظارت یافت میشوند در مدلهای پیشبینی نظارتشده وارد کرد و در صورت معنادار یافتن چنین متغیرهایی، یک مدل پیشبینی قویتر ایجاد کرد. \ برای ارائه یک راهنمای واضح، این فصل به بررسی تکنیک های رایج طبقه بندی و رگرسیون یادگیری ماشین می پردازد. روش های طبقه بندی از ساده ترین مدل ها تا یادگیری جعبه سیاه را شامل می شود. مدلهای رگرسیون از اصول اولیه ساخته میشوند و پیچیدگی بیشتری خواهند داشت. رگرسیون لجستیک، اسپلاین رگرسیون تطبیقی چند متغیره (MARS)، k-نزدیکترین همسایه (kNN)، شبکه های عصبی، ماشین بردار پشتیبان، جنگل تصادفی، و ماشین تقویت گرادیان در فصل 2 مورد بحث قرار خواهند گرفت. بسیاری از دانشمندان داده و آماردانان به طور یکسان. با پیشرفت تحقیقات، بسته های محاسباتی نیز پیشرفت می کنند. جدول 2.1 فهرستی از بستههای R موجود است که میتوانند تکنیکهای یادگیری ماشینی فوقالذکر را انجام دهند. – این کتاب به طور مختصر سوگیری به ارث رسیده در روش یادگیری ماشین را نشان می دهد و با موفقیت ابزارها، ترفندها و نکاتی را برای مقابله با موضوع سوگیری ارائه می دهد. – با استفاده از انقباض و استراتژی های مرتبط، استدلال اساسی برای انتخاب مدل و تخمین پس از آن را به طور ماهرانه روشن می کند. – این ارائه اساسی است، زیرا انقباض و روش های دیگر مناسب برای انتخاب مدل و مشکلات برآورد است و علاقه فزاینده ای در این زمینه برای پر کردن شکاف بین استراتژی های رقابتی وجود دارد. – کاربرد این استراتژی ها در مجموعه داده های زندگی واقعی از بسیاری از جنبه های زندگی. – نتایج تحلیلی به طور کامل با کار عددی تأیید می شود و نمونه های کار شده متعدد در هر فصل با نمودارهای متعدد برای تجسم داده ها گنجانده شده است. – ارائه و سبک کتاب به وضوح آن را در دسترس مخاطبان گسترده قرار می دهد. این توضیحات غنی و مختصر از هر استراتژی ارائه می دهد و به وضوح نحوه استفاده از هر استراتژی تخمینی را برای مشکل در دست توضیح می دهد. – این کتاب تاکید می کند که آمار/آمار می توانند نقش غالبی در حل مسائل کلان داده ایفا کنند و آنها را در پرتگاه اکتشافات علمی قرار دهند. – این کتاب روشهای جدیدی را برای HDDA ارائه میکند و دری را برای ادامه تحقیقات در این منطقه داغ باز میکند. – تأثیر عملی کار پیشنهادی از کاربردهای گسترده ناشی می شود. بستههای محاسباتی توسعهیافته به تجزیه و تحلیل طیف گستردهای از کاربردها در بسیاری از جنبههای زندگی کمک میکنند.
tag : دانلود کتاب استراتژی های پس از انقباض در یادگیری آماری و ماشینی برای داده های با ابعاد بالا , Download استراتژی های پس از انقباض در یادگیری آماری و ماشینی برای داده های با ابعاد بالا , دانلود استراتژی های پس از انقباض در یادگیری آماری و ماشینی برای داده های با ابعاد بالا , Download Post-Shrinkage Strategies in Statistical and Machine Learning for High Dimensional Dat Book , استراتژی های پس از انقباض در یادگیری آماری و ماشینی برای داده های با ابعاد بالا دانلود , buy استراتژی های پس از انقباض در یادگیری آماری و ماشینی برای داده های با ابعاد بالا , خرید کتاب استراتژی های پس از انقباض در یادگیری آماری و ماشینی برای داده های با ابعاد بالا , دانلود کتاب Post-Shrinkage Strategies in Statistical and Machine Learning for High Dimensional Dat , کتاب Post-Shrinkage Strategies in Statistical and Machine Learning for High Dimensional Dat , دانلود Post-Shrinkage Strategies in Statistical and Machine Learning for High Dimensional Dat , خرید Post-Shrinkage Strategies in Statistical and Machine Learning for High Dimensional Dat , خرید کتاب Post-Shrinkage Strategies in Statistical and Machine Learning for High Dimensional Dat ,

نقد و بررسیها
هنوز بررسیای ثبت نشده است.