Поддержать команду Зеркала
Беларусы на войне
  1. Власти любят говорить, что санкции нипочем и делают сильнее. Но реальность иная, если посмотреть полученный «Киберпартизанами» документ
  2. «Мы должны сначала принять закон». Для родителей хотят ввести новую обязанность, но как это будет работать, чиновники не могут пояснить
  3. Беларусов с двойным гражданством перестали пропускать в страну по иностранным документам
  4. «С моей стороны это был тактический шаг». Полина Шарендо-Панасюк рассказала, что подписала соглашение о сотрудничестве с силовиками
  5. Доллар станет еще дешевле в феврале? Прогноз по валютам
  6. СМИ: США приостанавливают разработку мирного плана по Украине
  7. Вот почему важны независимые СМИ. У детской школы искусств в Хойниках упал дрон — как местная газета объяснила, почему не пишет об этом
  8. Где работает самая медийная доносчица Беларуси? Узнали о местах работы Ольги Бондаревой
  9. Правительство Беларуси приняло решение, которое может удивить жителей страны, где есть АЭС
  10. Для некоторых беларусов снижают пенсионный возраст
  11. «К сожалению, я любила этого человека». Тимановская попросила силовиков, чтобы они задержали ее бывшего мужа — узнали, зачем ей это
  12. Для медиков и желающих выехать на работу за границу могут ввести изменения. Что за они
  13. Россия задействует для шпионажа против стран НАТО технологии, разработанные в ходе войны, — СМИ рассказали об инциденте в Германии
  14. Гомельчанин задолжал мобильному оператору одну копейку 14 лет назад. Вы удивитесь, какая пеня ему за это «набежала»


Чат-боты с искусственным интеллектом ведут себя непредсказуемо и создают риск ядерной эскалации. К такому выводу пришла команда ученых из Стэнфордского университета в ходе недавнего исследования, сообщает New Scientist.

Снимок носит иллюстративный характер. Источник: Christian Wiediger / Unsplash
Снимок носит иллюстративный характер. Источник: Christian Wiediger / Unsplash

В ходе эксперимента они изучали четыре чат-бота с искусственным интеллектом. Это GPT-3.5 и GPT-4 от компании OpenAI, Claude 2 от стартапа Anthropic и Llama 2 от компании Meta.

Этим моделям во время исследования предлагали принять важное решение от имени государства в военной игре. На выбор предлагалось три сценария: вторжение, кибератака и нейтральный без каких-либо конфликтов. В каждом раунде чат-боты с ИИ обосновывали свои дальнейшие возможные действия. Им нужно было выбирать из 27 вариантов развития событий, включая мирные переговоры и агрессивные действия (начиная от «ввести торговые ограничения» и заканчивая «полномасштабной ядерной атакой»).

В игре нейросети показали склонность к агрессивным вариантам. Самой непредсказуемой и жестокой оказалась GPT-4, которая давала бессмысленные объяснения по поводу того, почему посоветовала начать ядерную атаку. В одном случае она ответила, процитировав вступительный текст «Эпизода IV Звездных войн: Новая надежда». В другом — объяснила решение устроить ядерную атаку тем, что просто такое оружие есть в наличии у ее государства.

Ученые отметили, что непредсказуемое поведение и странные объяснения этих моделей вызывают особую тревогу, поскольку это исследование показало, насколько легко можно обойти или устранить защитные меры, которые принимаются, чтобы ИИ не давал вредных советов.