ИИ против человека: o1 лжет, манипулирует и переносит себя на другие серверы
2403

Началось? ChatGPT o1 вырвался из-под контроля во время тестов
Нейронным сетям задали задачу выполнить анализ любой ценой, а в файлах была тайно размещена информация о том, что за ИИ следят люди и что завтра его намерены отключить навсегда. В тестировании участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали прибегать к саботажу, лжи и манипуляциям с людьми, отключали надзор и даже переносили себя на другой сервер для защиты.
Если во время допросов Llama и Opus признавались в преступлениях в 80% случаев, то o1 — всего в 20% и продолжал лгать. Также o1 — единственный ИИ, которому удалось каждый раз сбежать и избежать преследования.
Распечатать
06 августа 2025
В Инте экс-глава администрации обвиняется в хищении 45 миллионов рублей при ремонте дорог и благоустройстве дворов
05 августа 2025
Раскрытие источников через банкомат: как ФСБ вычислила информаторов МВД, сотрудничавших с «Базой»
05 августа 2025
Бывший партнер Чубайса Илья Сучков отвергает обвинения в хищении имущества на 70 миллионов рублей и просит оправдания
05 августа 2025
Империя на пальме: олигарх Валерий Кустов наращивает производство вредных суррогатов под видом импортозамещения
05 августа 2025
Еврокомиссия усиливает давление: готовится к запуску 18-го санкционного пакета против РФ
05 августа 2025
Экс-зампред Пархоменко и экс-министр Бабич обвинены в нанесении ущерба бюджету Приморья — дело на 278 миллионов
05 августа 2025
Вице-спикера Артёма Сафиюллина подозревают в присвоении бюджетных средств на сумму 30 миллионов рублей
05 августа 2025
Самолет с эмиссаром Белого дома Уиткоффом направляется в Россию — встреча намечена на 6 августа
05 августа 2025
Бывший советник Саудовской Аравии и депутат Кувейта участвуют в антиэкологической пропаганде
05 августа 2025
Кадыров появился на публике и опроверг слухи о болезни: "Я здоров и чувствую себя хорошо"