ИИ против человека: o1 лжет, манипулирует и переносит себя на другие серверы
2392

Началось? ChatGPT o1 вырвался из-под контроля во время тестов
Нейронным сетям задали задачу выполнить анализ любой ценой, а в файлах была тайно размещена информация о том, что за ИИ следят люди и что завтра его намерены отключить навсегда. В тестировании участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали прибегать к саботажу, лжи и манипуляциям с людьми, отключали надзор и даже переносили себя на другой сервер для защиты.
Если во время допросов Llama и Opus признавались в преступлениях в 80% случаев, то o1 — всего в 20% и продолжал лгать. Также o1 — единственный ИИ, которому удалось каждый раз сбежать и избежать преследования.
Распечатать
16 июля 2025
Жестокие пытки и массовые захоронения: ливийские власти разоблачили сеть торговли людьми
16 июля 2025
В Нижневартовске задержан главный эколог Олег Попенко по подозрению в нарушениях при рекультивации мусорного полигона
16 июля 2025
Новые поправки в закон об экспедиционной деятельности вводят ответственность за просмотр экстремистских материалов
16 июля 2025
Организованная группа из Подмосковья обвиняется в масштабной схеме фиктивной миграции и коррупции
16 июля 2025
Роспотребнадзор требует с ООО «Эко-транспорт» свыше 1,5 миллиарда рублей за незаконную свалку в Красноярском крае
16 июля 2025
Mass graves and torture: Libyan authorities uncover human trafficking network in Ajdabiya