منبع: روزنامه جامجم
رایانه سخنگو
برای تلفظ هوشمند عبارات، رایانه را وادار میکنیم تا صدای مورد نظر ما را تولید نماید. زمانی تصور اینکه انسان بتواند با رایانه خود صحبت کند و آن ماشین نیز صحبت او را متوجه شده و به او پاسخی از جنس صوت بدهد، غیر قابل باور بود؛ اما امروز با این که این امر به طور کامل محقق نشده است رسیدن به این پیشرفت دیگر غیر قابل باور نیست. در حال حاضر نرمافزارهای بسیاری وجود دارند که میتوان متن تایپ شده را تلفظ کند یا به عبارت دیگر متنی را بخواند. به این فناوری اصطلاحاً TTS یا text to speech گویند. نرمافزارهایی چون Babylon, Encarta, talkit و ... از این فناوری بهره گرفتهاند.
روش چیدن اصوات
این امر به دو طریق قابل انجام است. یکی آنکه یک سری لغت و عبارت پایه را توسط میکروفن در رایانه ضبط کنیم. سپس از طریق برنامهنویسی این اصوات را در جای مناسب خود و به ترتیب خاصی پخش کنیم. به عنوان مثال برای اعلام ساعت در یک برنامه می توان کلماتی مثل «یک»، «دو» و ...«یازده»، «دوازده» و ...«سی»، «چهل» و .. به همراه صدای «و» را ضبط کرد. سپس در زمان 32/11 به ترتیب 7 قطعه صوت «ساعت»- «یازده»- «و»-«سی»- «و»- «دو»- «دقیقه» را پخش کرد. این همان کاری است که در نرمافزارهای ساعت گویا انجام میشود.
روش تولید صوت
اما روش دیگری نیز وجود دارد که کمی هوشمندانهتر است. در روش اول در صورتی که بخواهیم برنامهای بنویسیم متن یک نامه را بخواند باید حجم زیادی از لغات را تلفظ کرده و در رایانه ضبط کنیم و با فرایندی زمانگیر یه ترتیب این لغات را پخش نمود. این کار برای کاری مشابه ساعت منطقی به نظر میرسد؛ اما برای کار اخیر بسیار وقتگیر، حجیم و پیچیده خواهد شد و در عین حال دیگر حالت طبیعی نخواهد داشت. به همین منظور از تکنیکهای تولید صوت استفاده میشود. در اینگونه تکنیکها صدای هر حرف توسط دستورالعملهای پیچیده توسط کارت صوتی ساخته میشود. میتوان گفت که با برنامه نویسی، کارت صدا را وادار به تلفظ حروف میکنیم. یکسری استثنائات قواعد تلفظ را نیز جداگانه بهد این برنامه میآموزیم. مثلاً تلفظ "ch" در انگلیسی با "c" و "h" به طور جداگانه متفاوت است و یا در فارسی بعضی کلمات همچون «خواندن» یا «خواهر» و... «خوا» به صورت «خا» تلفظ میشود. با در نظر گرفتن این موارد نرمافزاری تهیه میشود که هر لغتی را اعم از با معنا یا بیمعنا و یا اسامی را میتوان تلفظ کند.
لهجه و نوع تلفظ
با اینکه تلفظ حرف «ب» در فارسی یا انگلیسی تفاوت ندارد اما حروف و کلماتی هستند که تلفظ آنها در زبانهای دیگر با زبان اصلی تفاوت دارد. به عنوان مثال کلمه «Math» در انگلیسی تلفظ خاصی دارد که معادل آن تلفظ در زبان فارسی وجود ندارد و آن مربوط به «th» است که تلفظی بین «ت» و «ث» است. البته این بدان معنا نیست که فارسی زبانان قادر به تلفظ آنها نیستند. یا تلفظ کلمهای همچون «مخلوق» برای افراد انگلیسی زبان کمی مشکل و متفاوت است. وظیفه طراح این برنامهها آن است که به این نکات توجه کنند. به همین دلیل نمی توان یک برنامه برای تلفظ کلیه متون در زبانهای مختلف تهیه کرد.
تکیهها و شیوه بیان
اگر نرمافزاری به خواندن یک متن میپردازد، میبایست تا حد امکان به تکههای کلمات و جملات هم توجه داشته باشد. گاهی اوقات تأکید روی یک کلمه از جمله معنای آنرا عوض می کند و یا تکیه نادرست بر روی یک حرف از کلمه آنرا دچار گویش کرده و درک آنرا مشکل میسازد. در ضمن برنامه باید با دیدن کلمات پرسشی یا علامت سؤال، جمله را به صورت سؤالی تلفظ کند. مشاهده میشود که پرداختن به تمامی این جوانب کاری آسان نیست اما از لحاظ سرعت و انعطافپذیری در صورتی که برنامهای با این قابلیتها طراحی شد، از نوع اول بسیار کاراتر خواهد بود. زیرا اولاً هر عبارتی را میتوان تلفظ کند ثانیاً به علت استفاده از روشهای تلفظ بجای استفاده از تکههای تلفظ شده، سرعت بالاتری خواهد داشت. به این معنا که در ادای کلمات وقفهای نخواهیم داشت مگر آنکه لازم باشد.
نرمافزارهایی با یان قابلیت به موتورهای متن به سخن معروفند. برای نمونه میتوان موتورهای متن به سخن شرکت مایکروسافت و IBM یا موتورهای ACUVOICE, DECTALK, AT&T و... اشاره کرد که می توان با استفاده از آنها به نرمافزارهای کاربردی خصوصیت تلفظ داد.
پارسا ستودهنیا