Acoustic data-driven grapheme-to-phoneme conversion

شما اینجا هستید

سیستم‌‌های امروزی بازشناسی گفتار و تبدیل گفتار به متن از واج به عنوان واحد آوایی استفاده می‌کنند. این امر مستلزم دردسترس بودن  واژگان آوایی است که نگاشتی از هر کلمه به دنباله ای از واحد‌های آوایی فراهم کند. تولید واژگان آوایی نیازمند دسترسی به متخصصین و دانش زبان شناسی در زبان هدف است که لزوما برای تمامی زبان‌‌های موجود به ویژه زبان‌‌های کم‌استفاده (که معمولا دچار فقر منابع زبان شناسی هستند) فراهم نیست. در این ارائه یک روش داده محور مبتنی بر مدل مخفی مارکوف برای استخراج خودکار واحد‌‌های آوایی و تولید واژگان آوایی با استفاده از منابع آکوستیک ارائه می‌شود. به طور خلاصه، در این روش واحد‌های آوایی به طور خودکار از طریق خوشه بندی واحد نوشتاری وابسته به متن با استفاده از داده‌‌های صوتی استخراج می‌شود. پس از آن، تلفظ مرتبط به هر کلمه از طریق چارچوب مدل مخفی مارکوف مبتنی بر معیار فاصله کولبک لیبلر یاد گرفته می‌شود. این ارائه همچنین کاربرد این روش برای تولید واژگان و بازشناسی گفتار در زبان انگلیسی و زبان گالیک اسکاتلند (که یک زبان اروپایی کم استفاده و در معرض انقراض است) نشان می‌دهد.

ردیف نام سخنران فایل تصویری
۱ دکتر مرضیه رضوی Segment1.mp4 Segment2.mp4

 

نوع: 
کارگاه آموزشی
زبان: 
فارسی
برگزاری در درون پژوهشگاه: 
زمان برگزاری: 
سه شنبه, ۱۱ خرداد, ۱۳۹۵ - ۰۹:۰۰ الی ۱۱:۰۰
ارائه دهنده: