Поддержать команду Зеркала
Беларусы на войне
  1. Последние инициативы Трампа заставили Кремль вспомнить старые нарративы. Но озвучивают их уже с новой целью — рассказываем подробности
  2. Силовики расширили географию поиска участников протестов 2020 года. Их интересуют выходившие на марши в еще одном городе
  3. ГУБОПиК случайно раскрыл новую базу «политических», по которой проверяет беларусов. Вот что о ней узнало «Зеркало»
  4. На БелАЭС сработала сигнализация — второй энергоблок отключили от сети
  5. Санкции ЕС против Беларуси: Эмбарго на импорт вооружений, четыре банка и восемь предприятий ВПК — «в бан»
  6. Люди танцевали, не подозревая о нависшей над ними смерти. Одна из крупнейших инженерных катастроф убила 114 человек — вот ее история
  7. Мобильные операторы вводят изменения. Клиентам дали несколько дней, чтобы перейти на новые услуги
  8. «Приходят десятки сообщений, что ужесточается контроль на границе». Узнали, как сейчас силовики ищут участников протестов 2020 года
  9. Поймали таинственного зверя, пугавшего жителей Сеницы и Прилук
  10. «А мне воняет не гарью, а кошачьим туалетом». Беларусы возмущаются, что пакеты в магазинах неприятно пахнут. Объясняем почему
  11. «Однозначно установить запрет на использование». Нацбанк объявил, что хочет ввести очередное ограничение — какое на этот раз
  12. Из России приходят новости, которые способны ударить по валютному рынку Беларуси. Но это далеко не все возможные проблемы для Минска
  13. «Почему он у вас с наручниками не ходит». На совещании у Лукашенко произошла перепалка с участием чиновников и самого Лукашенко
  14. У Николая Лукашенко увеличился один из бюджетных источников дохода — его отец подписал указ
  15. Евросоюз согласовал 18-й пакет санкций против России и Беларуси


/

На прошлой неделе американская технологическая компания OpenAI представила новейшие большие языковые модели искусственного интеллекта, получившие названия o3 и o4-mini. Однако, как показали тесты, обе модели, по-видимому, сделали значительный шаг назад: они склонны придумывать — или галлюцинировать — сильнее, чем их более ранние версии, пишет Naked Science.

Изображение носит иллюстративный характер. Фото: Freepik.com
Изображение носит иллюстративный характер. Фото: Freepik.com

По данным издания TechCrunch, новые модели OpenAI противоречат исторической тенденции, согласно которой каждая новая модель давала все меньше галлюцинаций, чем предыдущая, что позволяет предположить, что OpenAI теперь движется в неверном направлении.

Согласно результатам внутреннего тестирования OpenAI, o3 и o4-mini склонны к галлюцинациям чаще, чем старые модели, включая o1, o1-mini и даже o3-mini. Модель o3 выдала 33% ошибок на тесте точности компании. Это примерно вдвое больше, чем у предыдущих моделей OpenAI. Тогда как o4-mini показала еще более худший результат — 48%.

Хуже того, специалисты компании, похоже, не до конца понимают причины проблем. Согласно их техническому отчету, «необходимы дополнительные исследования, чтобы понять причину» этих ошибок.