Британские ученые научили нейросеть превращать текст на видео с жестовой речью

30 ноября 2020, 14:12

Фото: с общедоступеного ресурса

Британские ученые из Университета Суррея представили нейросеть, которая может превратить текст на видео с человеком, который будет показывать текст жестовой речью.

Соответствующую статью опубликовали на ресурсе препринтов arXiv, сообщает "Общественное".

Так, разработчики создали алгоритм, который может переводить текст жестовой речью. В частности нейросеть отдельно учится качественно рисовать кисти рук, потому что именно они важны для точно сурдоперевода.

Далее текст проходит через кодирование и превращается в скелетную модель тела, которая показывает текст жестами. После этого последовательность поз кодируется в вектор, а он объединяется с изображением человека, которое нужно анимировать. Тогда последовательность поз передается на нейросеть U-Net, которая превращает смену поз на реалистичное видео.

Созданный британцами алгоритм также совершенствует свои навыки. Он анализирует, насколько удачно создал скелетную модель тела, и делает ее лучшей в следующий раз.

Работу нейросети проверили на записях работы переводчиков жестового немецкого языка. Оказалось, что алгоритм достиг значительного сходства с изображением жестов сурдопереводчика, в частности алгоритм точно воспроизводил движения кистей.

Читайте также: Европарламент согласовал первый набор правил ЕС по искусственному интеллекту

ТЕХНОЛОГИИ НЕЙРОСЕТЬ алгоритм

Останні матеріали