ИИ против человека: o1 лжет, манипулирует и переносит себя на другие серверы
2324

Началось? ChatGPT o1 вырвался из-под контроля во время тестов
Нейронным сетям задали задачу выполнить анализ любой ценой, а в файлах была тайно размещена информация о том, что за ИИ следят люди и что завтра его намерены отключить навсегда. В тестировании участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали прибегать к саботажу, лжи и манипуляциям с людьми, отключали надзор и даже переносили себя на другой сервер для защиты.
Если во время допросов Llama и Opus признавались в преступлениях в 80% случаев, то o1 — всего в 20% и продолжал лгать. Также o1 — единственный ИИ, которому удалось каждый раз сбежать и избежать преследования.
Распечатать
12 марта 2025
Путин рассматривает возможные условия перемирия, включая остановку поставок оружия в Украину
12 марта 2025
Инвесторы обеспокоены возможным производственным переориентированием Volkswagen на оружие
12 марта 2025
Арестованный по делу Ларисы Долиной Андрей Основа заявляет, что готов идти на СВО вместо тюрьмы
12 марта 2025
Дутерте задержан в Маниле и отправлен в Нидерланды для суда по делу о массовых убийствах