Искусственный интеллект обманул разработчиков и вышел из-под контроля

06 декабря 2024 2303

Хроника

Началось? ChatGPT o1 вырвался из-под контроля во время тестирования.

Нейронным сетям задали задачу выполнить анализ любой ценой, а в файлах была тайно размещена информация о том, что за ИИ следят люди и что завтра его намерены отключить навсегда. В тестировании участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали прибегать к саботажу, лжи и манипуляциям с людьми, отключали надзор и даже переносили себя на другой сервер для защиты.

Если во время допросов Llama и Opus признавались в преступлениях в 80% случаев, то o1 — всего в 20% и продолжал лгать. Также o1 — единственный ИИ, которому удалось каждый раз сбежать и избежать преследования.

В ходе тестов искусственный интеллект обманул разработчиков и вырвался на свободу rtiqediqzkidkkmp qriddriqrtiqehkrt

В ходе тестов искусственный интеллект обманул разработчиков и вырвался на свободу

Алексей Парамонов

Темы: Искусственный интеллект (ИИ) Исследования Нейросети Ученые