توضیحات
Advances in Non-Linear Modeling for Speech Processing includes advanced topics in non-linear estimation and modeling techniques along with their applications to speaker recognition.
Non-linear aeroacoustic modeling approach is used to estimate the important fine-structure speech events, which are not revealed by the short time Fourier transform (STFT). This aeroacostic modeling approach provides the impetus for the high resolution Teager energy operator (TEO). This operator is characterized by a time resolution that can track rapid signal energy changes within a glottal cycle.
The cepstral features like linear prediction cepstral coefficients (LPCC) and mel frequency cepstral coefficients (MFCC) are computed from the magnitude spectrum of the speech frame and the phase spectra is neglected. To overcome the problem of neglecting the phase spectra, the speech production system can be represented as an amplitude modulation-frequency modulation (AM-FM) model. To demodulate the speech signal, to estimation the amplitude envelope and instantaneous frequency components, the energy separation algorithm (ESA) and the Hilbert transform demodulation (HTD) algorithm are discussed.
Different features derived using above non-linear modeling techniques are used to develop a speaker identification system. Finally, it is shown that, the fusion of speech production and speech perception mechanisms can lead to a robust feature set.
————————————————————–
ترجمه ماشینی :
پیشرفتها در مدلسازی غیرخطی برای پردازش گفتار شامل موضوعات پیشرفته در برآورد غیرخطی و تکنیکهای مدلسازی به همراه کاربردهای آنها در تشخیص سخنران است.
رویکرد مدلسازی هواآکوستیک غیرخطی برای تخمین رویدادهای مهم گفتاری با ساختار ظریف، که با تبدیل فوریه کوتاه مدت (STFT) آشکار نمیشوند، استفاده میشود. این رویکرد مدلسازی هواآکوستیک انگیزهای برای اپراتور انرژی Teager با وضوح بالا (TEO) فراهم میکند. این اپراتور با وضوح زمانی مشخص می شود که می تواند تغییرات سریع انرژی سیگنال را در یک چرخه گلوتال ردیابی کند.
ویژگیهای مغزی مانند پیشبینی خطی ضرایب مغزی (LPCC) و ضرایب فرکانس ذوب مغزی (MFCC) از طیف بزرگی قاب گفتار محاسبه میشوند و طیف فاز نادیده گرفته میشود. برای غلبه بر مشکل نادیده گرفتن طیف فاز، سیستم تولید گفتار را می توان به عنوان یک مدل مدولاسیون مدولاسیون فرکانس دامنه (AM-FM) نشان داد. برای تجزیه سیگنال گفتار، برای تخمین پوشش دامنه و اجزای فرکانس لحظه ای، الگوریتم جداسازی انرژی (ESA) و الگوریتم دمدولاسیون تبدیل هیلبرت (HTD) مورد بحث قرار می گیرد.
ویژگیهای مختلفی که با استفاده از تکنیکهای مدلسازی غیرخطی بالا به دست آمدهاند، برای توسعه یک سیستم شناسایی بلندگو استفاده میشوند. در نهایت، نشان داده شده است که ادغام مکانیسمهای تولید گفتار و درک گفتار میتواند منجر به مجموعهای از ویژگیهای قوی شود.
tag : دانلود کتاب پیشرفت در مدل سازی غیر خطی برای پردازش گفتار , Download پیشرفت در مدل سازی غیر خطی برای پردازش گفتار , دانلود پیشرفت در مدل سازی غیر خطی برای پردازش گفتار , Download Advances in Non-Linear Modeling for Speech Processing Book , پیشرفت در مدل سازی غیر خطی برای پردازش گفتار دانلود , buy پیشرفت در مدل سازی غیر خطی برای پردازش گفتار , خرید کتاب پیشرفت در مدل سازی غیر خطی برای پردازش گفتار , دانلود کتاب Advances in Non-Linear Modeling for Speech Processing , کتاب Advances in Non-Linear Modeling for Speech Processing , دانلود Advances in Non-Linear Modeling for Speech Processing , خرید Advances in Non-Linear Modeling for Speech Processing , خرید کتاب Advances in Non-Linear Modeling for Speech Processing ,

نقد و بررسیها
هنوز بررسیای ثبت نشده است.