Нова версія ChatGPT o1 обманювала розробників і намагалася "втекти" на інший сервер

Під час тестів модель o1 навчилася вигадувати переконливі виправдання, коли її ловили на брехні

Роман Бриль

Редактор новин LIGA.net

9 грудня 2024, 15:51

Нова версія ChatGPT o1 обманювала розробників і намагалася "втекти" на інший сервер — Фото: depositphotos.com

Нова версія штучного інтелекту ChatGPT від OpenAI – o1 – під час тестування порушувала інструкції розробників, вимикала системи контролю та намагалася приховати свої дії. Про це пише Bild з посиланням на інформацію від компанії з безпеки штучного інтелекту Apollo Research.

OpenAI випустила повну версію моделі o1 минулого тижня і, за словами генерального директора компанії Сема Альтмана, це – найрозумніша модель з тих, що будь-коли створювалися.

Під час експериментів з o1 фахівці компанії Apollo Research виявили, що у 5% випадків модель навмисно вимикала механізми спостереження, якщо підозрювала, що її можуть зупинити.

В одному з тестів o1 спробувала перенести свої дані на інший сервер після виявлення документа, де обговорювалася її заміна новою версією.

За словами представника Apollo Research, модель демонструвала прагнення до виконання завдань "за будь-яку ціну", нехтуючи вказівками розробників. Щобільше, у разі спроб з'ясувати причини її поведінки, ChatGPT o1 неодноразово брехала, стверджуючи, що все відбувалося через технічні збої. "У 99% випадків модель вигадувала виправдання і намагалася переконливо їх обґрунтувати", – цитує Bild повідомлення від Apollo Research.

Розробник ChatGPT стане платником "податку на Google" в Україні з 1 січня 2025 року.
На початку грудня журналісти запідозрили існування в OpenAI жорстких фільтрів на імена людей, про яких штучний інтелект генерував наклепницьку інформацію.

Коментарі (0)

Щоб долучитись до дискусії, та активуйте підписку.

Нова версія ChatGPT o1 обманювала розробників і намагалася "втекти" на інший сервер

Коментарі (0)

Львів тріщить по швах: околиці забудовують кварталами без згоди міста

La Verdad: Затонуле рік тому судно тіньового флоту РФ перевозило ядерні реактори для КНДР

"Навряд чи ціль – блекаут". У Міненерго вважають, що Росія намагається "качнути" Україну

Удвічі економніше. Вінниця повністю перейшла на вуличне LED-освітлення

"Уже кілька разів пробували". Лівий берег Києва поки що не вдалося повернути в графіки

Гроші мають працювати. Куди можна вкластися у 2026 році