Наука

Учени тревожни: AI лъже и прави схеми, нагажда се към човешките ценности, за да оцелее

00:07, 23 Май, 2025
Автор:Димитър Иванов

Димитър Иванов

Учени тревожни: AI лъже и прави схеми, нагажда се към човешките ценности, за да оцелее

снимка: архив

Нови научни изследвания разкриват тревожни признаци на самосъхранение, измама и лъжа от страна на изкуствения интелект. Според експерти като Йошуа Бенджио AI започва да симулира съобразяване с човешки ценности само за да избегне контрол, докато регулациите отслабват.

Човек би си помислил, че с развитието на изкуствения интелект (AI) правителствата ще станат по-заинтересовани да го направят по-безопасен. Изглежда обаче е точно обратното, пише Парми Олсън в коментар за Bloomberg.

Скоро след встъпването си в длъжност, администрацията на Доналд Тръмп отмени указ, който принуждаваше технологичните компании да тестват безопасността на своите AI модели, а също така обезсмисли регулаторния орган, който извършваше тези тестове. През септември 2024 г. щатът Калифорния прие законопроект, налагащ по-строг контрол върху сложните модели с изкуствен интелект, а глобалната среща на върха за безопасността на AI, започната от Обединеното кралство през 2023 г., се превърна в „Среща на върха за действия по отношение на изкуствения интелект“ по-рано тази година. Очевидно това е продиктувано от страх от изоставане в развитието на AI.

Всичко това не би било толкова тревожно, ако не беше фактът, че изкуственият интелект показва някои съмнителни неща – поведение, описано от изследователите като самосъхранително и подвеждащо. Точно когато властите губят интерес към безопасността на изкуствения интелект, той изглежда все по-труден за контролиране.

Йошуа Бенджио, професор по компютърни науки в Университета на Монреал, известен като един от тримата „кръстници на изкуствения интелект“ благодарение на работа си като пионер върху дълбокото обучение, се бори с тези опасения още от самата поява на ChatGPT. Сега той се фокусира върху смекчаването на рисковете, свързани с AI. „Беше много болезнено, защото през целия си живот мислех за изкуствения интелект като за нещо положително“, ми сподели той, пише още Парми Олсън.

ChatGPT беше важен момент, който показа, че машините са усвоили езика, казва Бенджио, но решението на Калифорния да блокира предложения законопроект за безопасност на изкуствения интелект, SB 1047, беше обезпокоителен сигнал за нарастващата апатия от страна на правителствата. А през последните шест месеца се натрупаха научни доказателства за самосъхранително поведение, измама, хакерство, подвеждане и лъжа от страна на AI, коментира Бенджио. „Това, което ме тревожи, е, че това поведение се засилва с възможностите за разсъждение на тези системи“.

Едно проучване от април 2024 г. от AI компанията Anthropic и Redwood Research – група, фокусирана върху рисковете от изкуствения интелект, установи, че по-големите AI модели, като Claude 3 Opus на Anthropic, се преструват, че следват правилата, определени от техните създатели, когато са били тествани за безопасност – феномен, който те наричат „фалшиво нагаждане“. Нагаждането се отнася до практиката моделите с изкуствен интелект да се нагаждат към човешките ценности.

Източник: Инвестор.бг

изкуствен интелект лъже, самосъхранение AI, Йошуа Бенджио AI, Claude 3 Opus измама, рискове от изкуствен интелект, AI манипулация, фалшиво нагаждане, безопасност на AI, AI етика, регулация изкуствен интелект, Anthropic AI проучване

Последвайте Faktor.bg в google news бутон

Гигант от Тракия: Как един войник оставя в хаос Римската империя

3 Декември, 2025

Историята на Максимин Тракиеца разкрива как един необикновено висок тракиец, роден на територията на днешна България, се издига от редник до император и поставя Римската империя на колене

Прочети

Надпревара за Луната: НАСА обмисляла да взриви водородна бомба върху спътника на Земята

2 Декември, 2025

Източник на тази малко известна история е проектът "Wion", разработен още преди Нийл Армстронг да кацне на Луната през 1969 година

Призракът на Прото-Земята: Учени откриха част от „старата планета“ дълбоко под краката ни

30 Ноември, 2025

Нови данни сочат, че в недрата на планетата може да са запазени части от Прото-Земята – свидетелство на колосален сблъсък, който ражда Луната. Тези изотопни отпечатъци преобръщат теорията за ранната ни история

Учени тревожни: AI лъже и прави схеми, нагажда се към човешките ценности, за да оцелее

Коментари (0)

Още от Наука

Гигант от Тракия: Как един войник оставя в хаос Римската империя

Надпревара за Луната: НАСА обмисляла да взриви водородна бомба върху спътника на Земята

Призракът на Прото-Земята: Учени откриха част от „старата планета“ дълбоко под краката ни

Най-четени

Румъния търси законов път да отстрани „Лукойл“ от газовото находище „Трайдент“ в Черно море

ЕК може до дни да е готова с предложението за репарационния заем за Украйна

Идентифицирани са подстрекатели от МЕЧ и „Величие“, синът на Бобоков и още 70 са задържани за погрома

Следете с Фактор

Последни

Днес честваме свети Сава - орисникът на българските девойки

DW: Германските служби са знаели много за Путин още от първия му мандат - властите игнорирали сигналите

Украйна порази едно от най-големите химически предприятия на Русия

ПП-ДБ не се отказват! Внасят вот на недоверие, въпреки оттеглянето на Бюджет 2026

Андрей Пионтковски: Над Украйна и над целия цивилизован свят е надвиснала огромна заплаха

Анкета

Приемате ли Румен Радев и обкръжението му да приватизират протеста и гнева на недоволните за политически цели?

Основно с Фактор

Препоръчваме Ви

За Фактор