У Google Translate з'являться 110 рідкісних мов, серед яких кримськотатарська
Для перекладу компанія використовувала свою модель штучного інтелекту PaLM 2, передає Tech Crunch.
Серед нових мов: афарська, кантонська, мансійська, нко, пенджабська, кримськотатарська, тамазітська і ток пісін.
Google оголосив, що додані мови представляють понад 614 мільйонів носіїв, або приблизно 8% населення світу.
В компанії зазначили, що ці мови перебувають на різних стадіях використання.
Так, деякі з них налічують 100 мільйонів носіїв, а деякі не мають жодного активного носія, проте люди працюють над збереженням цих мов.
Google врахує такі елементи, як регіональні різновиди, діалекти та різні стандарти правопису, додаючи підтримку тієї чи іншої мови.
"Наш підхід полягає в тому, щоб надати пріоритет найбільш часто використовуваним різновидам кожної мови. Наприклад, ромська мова має багато діалектів по всій Європі. Наші моделі створюють текст, найбільш близький до південного варіанту ромської мови (Southern Vlax Romani), який часто використовується в Інтернеті. Але в ньому також змішуються елементи з інших мов, таких як північний влакс і балканська ромська", - сказав інженер-програміст Google Іссак Касвелл.
Додавання сотні мов до Google Translate - це частина ініціативи з підтримки 1 000 мов за допомогою штучного інтелекту, про яку було оголошено ще в 2022 році.
Того ж року компанія додала підтримку 24 мов, якими розмовляють понад 300 мільйонів людей. З останніми оновленнями Google Translate тепер матиме 243 мови.