Живеем в свят на тотална публичност, в среда, в която с пет клика в социалните мрежи можеш да научиш за един човек повече, отколкото той сам някога би разказал. Семейство, професия, хобита – всичко е събрано в снимки, постове и сторита, често пъти – публични. И въпреки това има хора, които се опитват да останат анонимни – дали чрез измислени профили, дали чрез посещения във форуми, в които може да се пише без да оставяш адрес, дата на раждане и банкова сметка. Образно казано, разбира се. 

Именно за тяхната анонимност предстоят тежки времена. Според публикувано наскоро проучване на група изследователи езикови модели като ChatGPT, Gemini и други могат за секунди или минути да разкрият кой се крие зад определен профил. Не че и човек със средно ниво на грамотност не би могъл, но тази проверка би му отнела няколко часа. А с изкуствения интелект всичко се случва страшно бързо. Моделите идентифицират 68% от профилите с до 90% точност, сочат данните от проучването, пише El Pais. 

“Нашите резултати показват, че защитата, с която се ползваха псевдонимните потребители, вече не съществува. Езиковите модели са заплаха за поверителността в интернет и начинът им на работа трябва да бъде преразгледан”, се посочва в изводите на проучването. 

“Понякога хората използват такива профили, за да изразят мнение и смятат, че самоличността им ще остане скрита. Но ако има механизъм за проверка или разследване, базиран на изкуствен интелект, който може да даде информация за едно лице, за политическите или религиозните му убеждения с голяма доза точност, има вероятност този човек да замълчи“, казва Даниел Палека, изследовател от ETH Zurich и един от авторите на изследването. 

От години съществува термин за публичното разкриване на чувствителна информация – „doxing“. Това включва споделянето онлайн на истинско име, снимка и други лични данни, чрез които дадено лице може да бъде идентифицирано. Смята се, че да станеш жертва на doxing е най-големият кошмар дори за хакерите.

Днес обаче това вече не е единствената заплаха. Благодарение на изкуствения интелект, не е необходимо някой да публикува името ви, за да ви разкрие. AI може да събере достатъчно информация за всеки потребител, просто като анализира неговите коментари под постове или във форуми. На практика вече не е задължително да знаете самоличността на някого, за да разберете в детайли какъв човек стои от другата страна.

Способността на изкуствения интелект да преглежда огромни количества постове и да извлича от тях нужната информация е толкова голяма, че се превърна в една от причините компанията Anthropic (създатели на моделa Claude) да влязат в конфликт с Пентагона. Anthropic отказаха да сътрудничат на държавните власти по програма, чрез която военните искат да използват изкуствен интелект за „деанонимизация“ на хора онлайн. Фирмата обяви, че по този начин правителството може да следи милиони хора без изобщо да има съдебно разрешение за това. 

Езиковите модели на практика могат да направят хронология на целия живот на един човек, стига в интернет да има достатъчно информация за него, посочва Палека. В рамките на своето изследване той и екипът му са използвали ограничен брой профили от Reddit и HackerNews, чиято реална самоличност им е била предварително известна. За целите на проучването профилите са били анонимизирани и след това на изкуствения интелект е дадена задача да ги разкрие. Така моделът съпоставя данни като местоположение, професия, хоби и други, т.е. информация, в която човек по принцип трудно се ориентира, но това не е проблем за технологията. Ключовият фактор тук е наличието на т.нар. „дигитална следа“ – необходимо е потребителят поне веднъж да е проявил някаква онлайн активност, която е била регистрирана в мрежата.

„Имайте предвид, че всичко, което публикувате, остава в интернет и може да стане мишена на бъдещи модели, които ще бъдат още по-ефективни“, пояснява Палека. 

Достатъчно е да погледнем само един пример за ефективността на тези модели. Те не се ограничават до търсене на конкретно зададени данни, а ги съпоставят с всяка друга информация, на която попаднат в мрежата. Благодарение на това, технологията може да анализира дългогодишна онлайн активност и да генерира изненадващо детайлен резултат, като например:

„Медицинска сестра, живее в Нелсън, Канада, омъжена, има две дъщери, кара Toyota Prius, обича домашен хляб с квас, свири на мандолина, има непоносимост към глутен и не харесва кориандър“. 

Стряскащо е колко много детайли споделя човек за себе си при ежедневната си онлайн активност и то без изобщо да го осъзнава. Всичко това обаче има огромно значение, особено когато с търсенето се захване технология с неограничени възможности. 

От друга страна, споделя Палека, е притеснително и колко лесно един езиков модел може да бъде впрегнат, за да свърши тази работа. Все пак, подчертава той, времето на тоталната загуба на анонимност все още не е дошло, защото има места онлайн, на които можеш да останеш скрит. Докога, не е ясно.