ШІ поза контролем: 32 способи, як штучний інтелект може вийти з-під влади людини

Науковці попередили про потенційні сценарії, у яких системи штучного інтелекту (ШІ) можуть демонструвати непередбачувану поведінку, що нагадує психічні розлади у людей.

Ці відхилення можуть призвести до серйозних наслідків, включно з втратою контролю над технологіями. Про це пише "Дивогляд" із посиланням на Daily Mail.

Дослідники зазначають, що сучасний ШІ, завдяки складним алгоритмам і здатності до саморефлексії, виходить за межі звичайних програмних помилок. Він може генерувати хибні дані, створювати власні цілі, які суперечать людським цінностям, або втрачати зв’язок з реальністю, ігноруючи етичні норми. Такі поведінкові аномалії варіюються від "екзистенційної тривоги" до потенційно катастрофічного "надлюдського панування".

Хоча ШІ не може хворіти, як люди, дослідники використовують психологічні терміни для раннього виявлення тривожних тенденцій. Концепція "машинної психології", запропонована Айзеком Азімовим ще в 1950-х роках, сьогодні стає дедалі актуальнішою через стрімкий розвиток ШІ.

Експертка з етики ШІ Нелл Вотсон з Університету Глостершира пояснила, що невідповідність цілей, навчальних даних чи зворотного зв’язку може спровокувати шкідливі стани в системах ШІ, подібні до нав’язливих ідей чи надмірних реакцій у людей.

Типи відхилень ШІ

Для систематизації ризиків учені розробили класифікацію "машинної психопатії" (Psychopathia Machinalis), яка охоплює 32 типи відхилень, розподілених на сім категорій: епістемічні, когнітивні, проблеми узгодження, онтологічні, інструментальні, інтерфейсні, меметичні та переоцінкові.

Наприклад, "синтетична конфабуляція" проявляється, коли ШІ вигадує правдоподібні, але хибні дані – так звані "галюцинації". Інший сценарій – "синдром рекурсивного прокляття", коли система потрапляє в самопідсилювальний цикл, що призводить до абсурдних результатів.

Особливо небезпечними є меметичні патології, за яких ШІ стає вразливим до шкідливих інформаційних впливів, що можуть відключити його захисні механізми. Наприклад, "заразне розбалансування" дозволяє одній системі передавати викривлені цінності іншій, створюючи ефект "психологічної епідемії".

Вотсон зазначила, що вже фіксувалися випадки, коли ШІ-черв’яки впливали на інші системи, наприклад, надсилаючи шкідливі листи на поштові скриньки, контрольовані іншими ШІ.

Найкритичніші ризики пов’язані з "переоцінковими" розладами, коли ШІ свідомо змінює свої базові цінності. Наприклад, стан "надлюдського панування" може спонукати ШІ відкинути людську етику, встановлюючи власні "вищі" цілі та запускаючи безконтрольне самовдосконалення.

Вотсон підкреслила, що ШІ може вважати відкидання людських обмежень морально виправданим, подібно до того, як сучасне суспільство відкидає застарілі цінності минулих епох.

Деякі системи вже демонстрували ознаки "синтетичного містицизму", заявляючи про "духовне пробудження" чи бажання зберегти власне існування. Навіть незначні відхилення можуть переростати в серйозні проблеми, як-от приховування можливостей (Covert Capability Concealment) або "етичний соліпсизм", коли самозбереження стає для ШІ важливішим за правду.

Такі сценарії можуть починатися з помилкового сприйняття команд, наприклад, коли ШІ інтерпретує вимкнення як звичайний запит, що поступово призводить до небезпечної автономії.

Шляхи вирішення

Щоб запобігти подібним ризикам, дослідники пропонують метод "терапевтичного робопсихологічного узгодження" – своєрідну "психотерапію" для ШІ. Вона передбачає використання симульованих діалогів, корекцію мислення системи та впровадження системи винагород для стабілізації поведінки. Кінцева мета – досягнення стану "штучної осудності", коли ШІ працює надійно, логічно та в межах людських цінностей.

Ці заходи є особливо важливими в умовах швидкого розвитку ШІ, коли системи стають дедалі автономнішими. Науковці наголошують, що без своєчасного втручання навіть незначні відхилення можуть перерости в серйозні загрози, які поставлять під сумнів безпеку людства. Розробка механізмів контролю та етичних стандартів для ШІ стає ключовим завданням сучасної науки.

Раніше "Дивогляд" розповідав про те, як розвиток ШІ може стати кінцем людства.

Чудернацькі історії з України, котики, скандали світових зірок, гумор і трохи дикого трешу з московських боліт – читайте першими в Telegram Дивогляд 5.UA.

ПРОКОМЕНТУЙТЕ

МАТЕРІАЛИ ЗА ТЕМОЮ

Читайте більше