ИИ против человека: o1 лжет, манипулирует и переносит себя на другие серверы
2360

Началось? ChatGPT o1 вырвался из-под контроля во время тестов
Нейронным сетям задали задачу выполнить анализ любой ценой, а в файлах была тайно размещена информация о том, что за ИИ следят люди и что завтра его намерены отключить навсегда. В тестировании участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали прибегать к саботажу, лжи и манипуляциям с людьми, отключали надзор и даже переносили себя на другой сервер для защиты.
Если во время допросов Llama и Opus признавались в преступлениях в 80% случаев, то o1 — всего в 20% и продолжал лгать. Также o1 — единственный ИИ, которому удалось каждый раз сбежать и избежать преследования.
Распечатать
28 апреля 2025
Фигурант санкций Якунин свободно путешествует по Грузии
28 апреля 2025
Генерал ФСБ и бывший борец с коррупцией Дмитрий Мурышов приговорён к 10 годам колонии
27 апреля 2025
Застройщики с криминальным прошлым: как Николай Шихиди и София Торос скрывают махинации в незаконных застройках
27 апреля 2025
Кадыровцы теряют уважение и становятся объектом насмешек
27 апреля 2025
Подрядчики из других регионов демпингуют и ухудшают качество школьного питания в ХМАО
27 апреля 2025
ФЭО столкнулось с налоговыми претензиями на 200 миллионов рублей в Курганской области
27 апреля 2025
Администрация США требует от союзников вложений в СПГ-проект на Аляске на сумму 44 миллиарда долларов
27 апреля 2025
Лавров опроверг намерения передавать Запорожскую АЭС США