Корпорация Meta разработала систему искусственного интеллекта для перевода хоккиенского языка, не имеющего собственного письма. Хоккиен распространен в странах Юго-Восточной Азии и насчитывает около 49 миллионов носителей. Его особенность – отсутствие унифицированной структурированной письменности. В общей сложности таких языков в мире насчитали около 3500.
Исследователи Meta сосредоточились на разработке системы speech-to-speech – они превратили образцы языка в последовательность акустических звуков, которые использовались для создания волновых форм речи. Затем эти сигналы объединили с мандаринским китайским языком для создания псевдометок. То, что получилось, в Meta назвали «родственным языком» для хоккиена.
«Мы сначала переводили английский (или хоккиенский) язык на мандаринский, позже то, что получилось, переводили на хоккиенский (или английский) и добавляли к учебным данным», — рассказал гендиректор Meta Марк Цукерберг.
Система все еще находится в разработке, поскольку искусственный интеллект пока может переводить только одно предложение за один раз. Однако Цукерберг уверен, что технология сможет применяться и к другим схожим между собой языкам.