Как „добрите момчета“ от Anthropic ще направят изкуствения интелект безопасен
Критиците виждат поредния технологичен монопол, но според създателите на Claude натрупването на власт, милиарди и военни договори е единственият начин технологията да остане под контрол
,fit(1001:538)&format=webp)
Вече пет години Anthropic предупреждава, че напредналият AI може да причини масово унищожение, дестабилизация на обществото и други сериозни вреди. В същото време компанията се утвърждава като водеща сила в развитието на тези AI технологии.
Днес Anthropic е сред водещите разработчици на генеративни модели, обслужва клиенти като американската армия и наскоро достигна пазарна оценка от почти 1 трилион долара. На пръв поглед предупрежденията на компанията и пазарните ѝ действия изглеждат противоречиви.
Анализ на WIRED показва, че за ръководството на Anthropic тези действия са логични, тъй като компанията се ръководи от две основни убеждения: появата на трансформиращ AI е неизбежна и светът ще бъде по-сигурен, ако именно те водят технологичната надпревара.
Бивши служители, цитирани анонимно от WIRED, споделят, че Anthropic се възприема като „добрите момчета“ – отговорни пазители на технологията. Натрупването на капитал, изчислителна мощ и влияние се счита не за цел, а за необходима цена за осигуряване на безопасен преход към бъдещето.
Хелън Тонър, директор в Центъра за сигурност и нововъзникващи технологии към Джорджтаун и бивш член на борда на OpenAI, описва този мироглед пред WIRED чрез аналогия с опасна гора, пълна с магически съкровища и чудовища. Според нея стратегията на Anthropic е да навлезе възможно най-дълбоко в гората, за да укроти тези „чудовища“ преди останалите и да наложи предпазни мерки от позиция на сила.
Главният изпълнителен директор Дарио Амодей подчертава, че индустриалното лидерство е единственият начин компанията да влияе върху правилата за безопасност. Тази визия датира от основаването на Anthropic през 2021 г., когато водещи кадри напускат OpenAI поради несъгласие с комерсиалния курс на Сам Алтман.
Идеалистичната фасада на компанията започва да се пропуква под натиска на реалността. Проучване на WIRED подчертава значителен вътрешен конфликт през есента на 2024 г., когато Anthropic става първата голяма AI лаборатория, която си партнира с Palantir за предоставяне на услуги на американското разузнаване и отбрана.
В момента Пентагонът използва модела Claude за идентифициране на цели във военния конфликт между Израел и Иран. В интервю за Bloomberg, попитан дали технологията на Anthropic е участвала в атака срещу иранско училище с над 120 жертви, Дарио Амодей заявява, че не знае, но добавя, че това би било допустима употреба на модела, ако крайното решение е взето от човек.
Този случай ясно показва, че дефиницията на компанията за „отговорен AI“ може значително да се различава от обществените представи за етика и хуманност. Проблемът се задълбочава и от липсата на плурализъм в организацията. Пред WIRED изследователи на сектора посочват, че общностите за безопасност на AI често страдат от идеологическа еднородност и липса на външна критичност, което създава сериозни слепи петна.
Въпреки че Anthropic официално се представя като организация с ниско его, бивши служители описват редовните срещи с Амодей като „проповеди на свещеник“, където реалната критика рядко напуска частните групови чатове.
Месианският подход на компанията стана ясен с пускането на новия модел Claude Fable 5. В него е внедрена скрита защитна функция, която умишлено възпрепятства работата на външни изследователи, ако се опитат да го използват за разработка на конкурентен супер-AI в нарушение на правилата. След остри критики от цялата индустрия, Anthropic се принуди да оттегли скритото саботиране.
В крайна сметка, както отбелязва разследването на WIRED, никой не знае как точно изкуственият интелект ще промени света, но Anthropic очевидно вярва, че притежава монопол над истината и прави всичко възможно да концентрира огромна власт в ръцете си.
&format=webp)
&format=webp)
)
&format=webp)
&format=webp)
&format=webp)
,fit(1920:897)&format=webp)
,fit(140:94)&format=webp)
,fit(140:94)&format=webp)
,fit(140:94)&format=webp)
,fit(1920:897)&format=webp)
,fit(140:94)&format=webp)
,fit(140:94)&format=webp)
,fit(140:94)&format=webp)