Британские ученые научили нейросеть превращать текст на видео с жестовой речью
Соответствующую статью опубликовали на ресурсе препринтов arXiv, сообщает "Общественное".
Так, разработчики создали алгоритм, который может переводить текст жестовой речью. В частности нейросеть отдельно учится качественно рисовать кисти рук, потому что именно они важны для точно сурдоперевода.
Далее текст проходит через кодирование и превращается в скелетную модель тела, которая показывает текст жестами. После этого последовательность поз кодируется в вектор, а он объединяется с изображением человека, которое нужно анимировать. Тогда последовательность поз передается на нейросеть U-Net, которая превращает смену поз на реалистичное видео.
Созданный британцами алгоритм также совершенствует свои навыки. Он анализирует, насколько удачно создал скелетную модель тела, и делает ее лучшей в следующий раз.
Работу нейросети проверили на записях работы переводчиков жестового немецкого языка. Оказалось, что алгоритм достиг значительного сходства с изображением жестов сурдопереводчика, в частности алгоритм точно воспроизводил движения кистей.
Читайте также: Европарламент согласовал первый набор правил ЕС по искусственному интеллекту