Új szint a magyar nyelvi mesterségesintelligencia-kutatásban

2022. 11. 22., 18:19
programajánló
426
By

A magyar nyelvre elkészült első GPT-3 típusú mesterséges intelligencia, a HILANCO-GPTX a Nyelvtudományi Kutatóközpont és a Pécsi Tudományegyetem közös fejlesztéseként született meg. Az angol és magyar nyelven egyaránt folyékony kommunikációra és szövegelőállításra is alkalmas rendszer akár még programkódot is képes generálni. Ennek a kétnyelvű rendszernek a betanításához a fejlesztők egy 102 milliárd szavas angol és egy 25 milliárd szavas magyar szövegkorpuszt használtak fel. A három hónapon át tartó gépi tanulás eredményeképpen létrejött nyelvi mesterséges intelligencia mindkét nyelven jól szerkesztett mondatokat képes alkotni, sőt akár még fordítani is tud a két nyelv között.

[cikkbanner]

A Nyelvtudományi Kutatóközpont munkatársai a fenti technológiát és szuperszámítógép-rendszert használva elkészítettek egy az előzőnél is nagyobb magyar nyelvű anyagon tanított nyelvmodellt, a PULI GPT-3SX-et. Ez egy 32 milliárd szóból álló, csak magyar nyelvű szövegeket tartalmazó anyagon tanult magyarul.

Nonprofit kutatás-fejlesztési célokra mindkét nyelvmodell ingyenesen elérhető, demó változatuk kipróbálható:
a HILANCO-GPTX itt;
a PULI GPT-3SX itt.

Az NYTK kutatói e két rendszerről és más új kutatási eredményeikről Mesterséges intelligencia és a magyar nyelv címmel rendezvényt szerveznek 2022. november 23-án 16 órakor az MTA Székház Dísztermében. A Magyar Tudomány Ünnepe programsorozat keretében tartandó eseményen a kutatók a témához kapcsolódó előadásokkal és bemutatóval készülnek. Az eseményről bővebb információ található annak hivatalos weboldalán.

ELKH