„Гугл транслејт“ се проширува со 110 нови јазици, меѓу кои и ромскиот

„Гугл транслејт“ со помош на јазичниот модел „PaLM 2“ додава 110 нови јазици за превод, меѓу кои е и ромскиот, пренесува „The Verge“.

„Јазичниот модел на Гугл, ‘PaLM 2’ му помогна на сервисот да ги научи овие нови јазици. Беше особено добар во учењето на оние јазици кои се поврзани еден со друг“, вели Исак Касвел од Гугл.

Списокот на новоподдржани јазици вклучува и кантонски, кој според Касвел долго време бил еден од најбараните јазици на „Гугл транслејт“, потоа келтски, пенџаби, тамазит и други африкански јазици.

„Јазиците имаат огромни варијации, регионални сорти, дијалекти, различни стандарди на правопис. Всушност, многу јазици немаат една стандардна форма, па затоа е невозможно да се избере ‘вистинската’. Нашиот пристап беше да се даде приоритет на најчесто користените форми на секој јазик. На пример, ромскиот јазик е јазик кој има многу дијалекти низ цела Европа. Нашите модели произведуваат текст што е најблизок до јужниот влашки ромски јазик, најчесто користена форма на интернет. Но, се меша и во елементи од други, како северновлашки и балкански ромски“, се вели во соопштението на Гугл.

Со ова се отвора можност за преводи за повеќе од 8% од светското население.

Инаку, досега „Гугл транслејт“ поддржуваше 133 јазици.