Magyar Nyelv 108. (Budapest, 2012)
2012 / 1. szám - Prószéky Gábor: A nyelvtechnológia és a magyar nyelvtudomány
MAGYAR NYELV 108. ÉVF. 2012. TAVASZ 1. SZÁM A nyelvtechnológia és a magyar nyelvtudomány* 1. Sokan úgy gondolják, hogy a nyelv különféle bonyolult szerkezeteit is „értenie” kellene annak a gépnek, „aki” egy másodpercet sem töltött homo sapiensként ezen a földön. A számítógép pedig önmagában nem más, mint egy buta doboz, amely nagy sebességgel működik, bár a rajta futó programok adott esetben nagyon sok mindenben adhatnak segítséget a nyelvet beszélő embereknek. Sajnos, az újságok sokszor elektronikus agynak nevezik, amitől még napjaink számítógépe is igencsak távol van. Hia a számítógép találkozik az emberi nyelvvel, az első kérdés, ami felmerül, az az, hogy az írott nyelvvel vagy a beszélt nyelvvel foglalkozik-e ez a terület? Ha jól meggondoljuk, a számítógép világában előbb-utóbb minden „írottá” válik, még a beszélt nyelv is, ugyanis az is betűknek, karaktereknek, szimbólumoknak diszkrét sorozatává válik, és ezt dolgozza fel a továbbiakban a számítógép. Tehát míg az embernél természetes a beszélt nyelv elsődlegessége, a számítógépnél ezeknek a diszkrét szimbólumoknak az egymásutánjából álló, tehát „írott” nyelvnek van elsődlegessége. Ennek a kutatási területnek népszerű elnevezése a nyelv- és beszédtechnológia. A közelmúltban ért véget hazábban egy jelentős méretű együttműködés az ezzel a témával foglalkozó intézmények között: ez volt a Nyelv - és Beszédtechnológiai Platform. Sajnálatos módon a nemzetközi használatban is a language and speech terjedt el, bár a text and speech helyesebb volna, tehát a szöveg és beszéd. Nyilvánvalóan a beszéddel való foglalkozás része a nyelvészetnek, viszont a beszédtechnológia elsődlegesen nem humán, hanem műszaki, mérnöki, fizikai, akusztikai tudományág. A jelen áttekintés elsősorban az írott nyelvre koncentrál, bár említést teszünk az olyan fontos és Magyarországon túl is kiemelkedő eredményekkel rendelkező kutatási területekről, mint a gépi beszédfelismerés, a gépi beszédkeltés vagy a beszélőfelismerés. Ezek részleteinek ismertetéséhez elsősorban nem nyelvészeti típusú háttérre volna szükség. A mélyebben érdeklődőknek ajánlható a gépi beszédfeldolgozásról a közelmúltban megjelent és nemzetközi mércével mérve is igen komoly összefoglaló (NÉMETH-OLASZY 2010). 2. Amikor az ember elkezd olvasni tanulni, addigra már rengeteg beszélt információt hallott. Az ember nem is tud elkezdeni olvasni anélkül, hogy az olvasott anyag értelmezését megelőzően ne beszélt szövegeken edződött volna. Érdemes * A Magyar Nyelvtudományi Társaság 2011. évi december 14-i közgyűlésén az ELTE BTK tanácstermében elhangzott előadás szerkesztett változata.