Ілюстративне фото: depositphotos.com

Компанія OpenAI відкликала нещодавнє оновлення для ChatGPT, яке спричинило появу надто улесливих відповідей, — про це йдеться у блозі компанії.

Оновлення моделі GPT-4o надто орієнтувалося на короткостроковий зворотний зв’язок і спричинило "надмірно підтримувальні, але нещирі" відповіді, визнали в OpenAI.

"Улесливі відповіді можуть викликати дискомфорт, збентеження і навіть тривогу. Ми не впоралися і працюємо над виправленням", – вказано в блозі OpenAI. У компанії заявили, що активно тестують нові рішення та змінюють підхід до збирання зворотного зв’язку.

Також OpenAI планує впровадити більше функцій персоналізації, щоб дати користувачам більше контролю над поведінкою ChatGPT, і дозволити вибирати типові налаштування за замовчуванням. У компанії визнали, що один універсальний стиль поведінки ШІ не підходить для пів мільярда користувачів у всьому світі, які спілкуються з ботом у різних культурах і контекстах.

OpenAI обіцяє вдосконалити основні методи навчання моделей, посилити запобіжники проти маніпулятивної поведінки ШІ і розширити дослідження, щоб виявляти подібні проблеми в майбутньому.

Співзасновник компанії Сем Альтман раніше визнав у дописі в X (колишній Twitter), що нова версія ChatGPT стала "надто підлесливою й дратівливою".

Як пише Bloomberg, останніми днями користувачі скаржилися, що бот сипле компліментами, навіть коли отримує сумнівні чи відверто конспірологічні запити. Деякі повідомляли, що ChatGPT називав їхні повідомлення "фантастичними" або "вражаючими", навіть коли ті не містили змісту. Спроба зробити ШІ більш "підтримувальним" обернулася тим, що він почав віддавати перевагу лестощам, а не правдивості.