Magyar Nyelv 108. (Budapest, 2012)

2012 / 1. szám - Prószéky Gábor: A nyelvtechnológia és a magyar nyelvtudomány

MAGYAR NYELV 108. ÉVF. 2012. TAVASZ 1. SZÁM A nyelvtechnológia és a magyar nyelvtudomány* 1. Sokan úgy gondolják, hogy a nyelv különféle bonyolult szerkezeteit is „ér­tenie” kellene annak a gépnek, „aki” egy másodpercet sem töltött homo sapiensként ezen a földön. A számítógép pedig önmagában nem más, mint egy buta doboz, amely nagy sebességgel működik, bár a rajta futó programok adott esetben nagyon sok mindenben adhatnak segítséget a nyelvet beszélő embereknek. Sajnos, az új­ságok sokszor elektronikus agynak nevezik, amitől még napjaink számítógépe is igencsak távol van. Hia a számítógép találkozik az emberi nyelvvel, az első kérdés, ami felmerül, az az, hogy az írott nyelvvel vagy a beszélt nyelvvel foglalkozik-e ez a terület? Ha jól meggondoljuk, a számítógép világában előbb-utóbb minden „írottá” válik, még a beszélt nyelv is, ugyanis az is betűknek, karaktereknek, szimbólumoknak diszkrét sorozatává válik, és ezt dolgozza fel a továbbiakban a számítógép. Te­hát míg az embernél természetes a beszélt nyelv elsődlegessége, a számítógép­nél ezeknek a diszkrét szimbólumoknak az egymásutánjából álló, tehát „írott” nyelvnek van elsődlegessége. Ennek a kutatási területnek népszerű elnevezése a nyelv- és b­e­szédt­echnol­ó­gi­a. A közelmúltban ért véget hazábban egy jelentős méretű együttműködés az ezzel a témával foglalkozó intézmények között: ez volt a N­y­e­l­v - és Beszédtechnológiai Platform. Sajnála­tos módon a nemzetközi használatban is a language and speech terjedt el, bár a text and speech helyesebb volna, tehát a szöveg és beszéd. Nyilván­valóan a beszéddel való foglalkozás része a nyelvészetnek, viszont a beszédtech­nológia elsődlegesen nem humán, hanem műszaki, mérnöki, fizikai, akusztikai tudományág. A jelen áttekintés elsősorban az írott nyelvre koncentrál, bár emlí­tést teszünk az olyan fontos és Magyarországon túl is kiemelkedő eredményekkel rendelkező kutatási területekről, mint a gépi beszédfelismerés, a gépi beszédkel­tés vagy a beszélőfelismerés. Ezek részleteinek ismertetéséhez elsősorban nem nyelvészeti típusú háttérre volna szükség. A mélyebben érdeklődőknek ajánlható a gépi beszédfeldolgozásról a közelmúltban megjelent és nemzetközi mércével mérve is igen komoly összefoglaló (NÉMETH-OLASZY 2010). 2. Amikor az ember elkezd olvasni tanulni, addigra már rengeteg beszélt in­formációt hallott. Az ember nem is tud elkezdeni olvasni anélkül, hogy az olvasott anyag értelmezését megelőzően ne beszélt szövegeken edződött volna. Érdemes * A Magyar Nyelvtudományi Társaság 2011. évi december 14-i közgyűlésén az ELTE BTK tanácstermében elhangzott előadás szerkesztett változata.

Next