Как сообщает сетевое издание ToDay News Ufa, исследователи разработали программу глубокого обучения, которая превзошла профессиональных чтецов по губам.
К работе были подключены ученые из компании Google DeepMind и Оксфордского университета. Каждая команда ученых разработала свою собственную модель, которую тренировали на текстах программ Би-бм-си. Всего было использовано более 100 тысяч предложений и затрачено почти 5000 часов. Всматриваясь в динамику губ, система училась расшифровывать всю ключевые слова.
Затем систему научили распознавать сразу фразы, типа таких, как «мы знаем, что сотни журналистов здесь» и «согласно последним данным Управления Национальной статистики». Таким образом, ученые доказали, что система лучше распознавала слова и фразы, нежели люди.
Например, 50 процентов слов система произвела без единой ошибки, когда как профессиональные чтецы губ смогли воспроизвести только более 12 процентов.
Как рассказал один из участников проекта Яннис Ассаэль, «ученые уверены, что машины для чтения по губам имеют огромный практический потенциал».