Компания «Яндекс» усовершенствовала перевод текста с изображений, используя нейросеть YandexGPT, как сообщается в пресс-релизе, распространённом RBC. Специально для этого была разработана специальная версия YandexGPT, сохраняющая изначальный стиль оригинала, словесную игру и макет картинки, включая размеры букв и шрифт.
«Эта технология будет полезна, к примеру, во время путешествий для быстрого перевода меню блюд в кафе или в рабочей обстановке для понимания особенностей определённых документов с терминологией на незнакомом языке», — отмечается в сообщении.
Функция уже работает в «Яндекс Переводчике» в браузере и поддерживает множество языков. В будущем разработчики также планируют внедрить в приложение функцию «Умная камера». В Яндексе подчеркнули, что они были одними из первых в мире, кто использовал большую языковую модель для совершенствования технологии перевода.
Большая языковая модель — это искусственный интеллект, обученный воспринимать большие объёмы текста и генерировать текстовые ответы самостоятельно, без вмешательства разработчиков. Подобные алгоритмы используются во многих популярных нейросетях, включая ChatGPT и YandexGPT.
Для разработки модели YandexGPT, предназначенной для перевода с изображений, использовались оригинальные и переведённые тексты. Нейросеть обучалась на высококачественных примерах, чтобы исключить добавление ненадёжной информации.