توضیحات
This book presents a fresh, new approach in that it provides a comprehensive recent review of challenging problems caused by imbalanced data in prediction and classification, and also in that it introduces several of the latest statistical methods of dealing with these problems. The book discusses the property of the imbalance of data from two points of view. The first is quantitative imbalance, meaning that the sample size in one population highly outnumbers that in another population. It includes presence-only data as an extreme case, where the presence of a species is confirmed, whereas the information on its absence is uncertain, which is especially common in ecology in predicting habitat distribution. The second is qualitative imbalance, meaning that the data distribution of one population can be well specified whereas that of the other one shows a highly heterogeneous property. A typical case is the existence of outliers commonly observed in gene expression data, and another is heterogeneous characteristics often observed in a case group in case-control studies. The extension of the logistic regression model, maxent, and AdaBoost for imbalanced data is discussed, providing a new framework for improvement of prediction, classification, and performance of variable selection. Weights functions introduced in the methods play an important role in alleviating the imbalance of data. This book also furnishes a new perspective on these problem and shows some applications of the recently developed statistical methods to real data sets.
————————————————————–
ترجمه ماشینی :
این کتاب یک رویکرد جدید و جدید را ارائه میکند، زیرا مروری جامع از مشکلات چالشبرانگیز ناشی از دادههای نامتعادل در پیشبینی و طبقهبندی ارائه میکند، و همچنین چندین مورد از آخرین روشهای آماری برای مقابله با این مشکلات را معرفی میکند. این کتاب ویژگی عدم تعادل داده ها را از دو دیدگاه مورد بحث قرار می دهد. اولین مورد عدم تعادل کمی است، به این معنی که حجم نمونه در یک جامعه بسیار بیشتر از جمعیت دیگر است. این شامل دادههای فقط حضور به عنوان یک مورد شدید است، که در آن وجود یک گونه تأیید میشود، در حالی که اطلاعات مربوط به عدم وجود آن نامشخص است، که به ویژه در بومشناسی در پیشبینی توزیع زیستگاه رایج است. دوم عدم تعادل کیفی است، به این معنی که توزیع دادههای یک جمعیت را میتوان به خوبی مشخص کرد، در حالی که توزیع دادههای دیگری ویژگی بسیار ناهمگن را نشان میدهد. یک مورد معمولی وجود موارد پرت است که معمولاً در دادههای بیان ژن مشاهده میشود، و مورد دیگر ویژگیهای ناهمگن است که اغلب در یک گروه مورد در مطالعات مورد-شاهدی مشاهده میشود. گسترش مدل رگرسیون لجستیک، maxent و AdaBoost برای دادههای نامتعادل مورد بحث قرار میگیرد و چارچوب جدیدی برای بهبود پیشبینی، طبقهبندی و عملکرد انتخاب متغیر ارائه میکند. توابع وزن معرفی شده در روش ها نقش مهمی در کاهش عدم تعادل داده ها دارند. این کتاب همچنین دیدگاه جدیدی در مورد این مشکل ارائه می دهد و برخی از کاربردهای روش های آماری اخیراً توسعه یافته را در مجموعه داده های واقعی نشان می دهد.
tag : دانلود کتاب روش های آماری برای داده های نامتعادل در مطالعات اکولوژیکی و بیولوژیکی , Download روش های آماری برای داده های نامتعادل در مطالعات اکولوژیکی و بیولوژیکی , دانلود روش های آماری برای داده های نامتعادل در مطالعات اکولوژیکی و بیولوژیکی , Download Statistical Methods for Imbalanced Data in Ecological and Biological Studies Book , روش های آماری برای داده های نامتعادل در مطالعات اکولوژیکی و بیولوژیکی دانلود , buy روش های آماری برای داده های نامتعادل در مطالعات اکولوژیکی و بیولوژیکی , خرید کتاب روش های آماری برای داده های نامتعادل در مطالعات اکولوژیکی و بیولوژیکی , دانلود کتاب Statistical Methods for Imbalanced Data in Ecological and Biological Studies , کتاب Statistical Methods for Imbalanced Data in Ecological and Biological Studies , دانلود Statistical Methods for Imbalanced Data in Ecological and Biological Studies , خرید Statistical Methods for Imbalanced Data in Ecological and Biological Studies , خرید کتاب Statistical Methods for Imbalanced Data in Ecological and Biological Studies ,

نقد و بررسیها
هنوز بررسیای ثبت نشده است.