زمان مطالعه: 2 دقیقه

به گزارش پیوست علی آجودانیان بنیان‌گذار و مدیر عامل ویرگول با اشاره به رشد صنعت صوت در سال‌های اخیر، از دلایل ورود ویرگول به آن سخن گفت. ویرگول که بیش از یک سال است به جز محتوای متنی امکان انتشار محتوای صوتی را برای کاربران فراهم کرده است، حالا به تقویت بخش‌ها و سرویس‌های صوتی ویرگول در سال 1401 فکر می‌کند. اضافه کردن سرویس تبدل گفتار به نوشتار یکی از این موارد است.

سرویس تبدیل گفتار به نوشتار یا آنچه که در جهان به فناوری Speech Recognition شناخته می‌شود، جزء مهمی از ارتقای صوتی در سایت‌ها و اپ‌هاست. علی آجودانیان با اشاره به چنین نکته‌ای اظهار می‌کند که توانایی پست محتوای صوتی هم به دلیل چنین چیزی در ویرگول ممکن شد و قصد داشتیم از پتانسیل ویرگول که ما را به یکی از قوی‌ترین پلتفرم‌های اجتماعی داخل ایران تبدیل کرده بود استفاده‌های بیشتری بکنیم. در واقع به گفته او، فعالیت و ورود به حوزه صوتی از ابتدا یکی از اهداف ویرگول بوده است. احتمالا اضافه شدن چنین قابلیتی به ویرگول خبر خوشی برای پادکسترها محسوب شود.

آجودانیان در رابطه با سطح کیفیت سیستم تبدیل گفتار به متن در ویرگول به این اشاره کرد که مشخصا آنقدری ایده‌آل که ما از آن انتظار داریم نخواهد بود. چنین چیزی به دلیل فارسی بودن زبان گفتار است چرا که دیتاست مناسبی از واژگان و ساختارهای سجاوندی از زبان ما وجود ندارد. او گفت که هم‌اکنون کیفیت تبدیل در این سرویس 60 درصد است و انتظار می‌رود تا 85 الی 90 درصد ارتقا پیدا کند. او به کوشش مداوم ویرگول در پنج سال اخیر برای ساخت دیتاست‌های مناسبی از زبان فارسی برای هوش مصنوعی اشاره کرد تا نهایتا تبدیل گفتار به متن در ویرگول در بهترین کیفیت خود رخ بدهد.

ویرگول یک پلتفرم انتشار محتوای متنی فارسی است که پنج سال پیش برای اولین بار کار خود را آغاز کرد.

منبع: پیوست

دیدگاهتان را بنویسید