Вчера компания OpenAI выпустила новую версию своей нейросети GPT-4o. Она уже доступна как на платной, так и на бесплатной основе. Однако при превышении определённого лимита для категории пользователей будет перекидывать на GPT-3,5 для бесплатных и GPT-4 для платных пользователей соответственно. Модель может анализировать и генерировать звуки, графические изображения, фото и тексты по задачам пользователя.
В названии нейросети буква «о» означает «omni», что переводится как «всесторонний». Сами OpenAI заявляют, что это указывает на мультимодальность новой модели. С GPT-4 эту версию роднит уровень интеллекта, однако способности в работе с картинками, текстовыми и звуковыми файлами улучшены. Размер контекста увеличился до 128 000 токенов.
Благодаря новым разработкам с чат-ботом ChatGPT можно будет разговаривать как с настоящим человеком. Например, есть возможность перебить его во время разговора. Также он будет реагировать на смену интонации собеседника, его эмоции в режиме реального времени. В OpenAI также говорят о том, что в скором времени ChatGPT даже сможет объяснять правила пользователю во время совместного просмотра спортивной игры.
Стоит отметить, что в новой версии улучшены визуальные возможно. При демонстрации изображения напрямую с камеры GPT-4o сможет анализировать объекты на ней и отвечать пользователю на вопросы о них. Это также делает разговором с искусственным интеллектом более реалистичным и естественным. При этом предыдущая версия могла воспринимать только загруженные фото и картинки.
Другое преимущество новой модели — то, что она переводит речь пользователя в режиме реального времени на более чем 50 языков. При этом у ChatGPT есть собственное чувство юмора, он способен генерировать шутки сам и воспринимать чужие.
В течение двух следующих месяцев версия будет улучшаться, станет доступно больше функций. И совсем скоро ChatGPT-4o будет доступен для всех пользователей.