През април социалните мрежи преливаха от необичайни публикации: потребители по целия свят масово споделяха снимки на екшън фигури, създадени по техен образ и подобие. Фигурките изглеждат поразително точни – с всички лични аксесоари като йога постелки, слушалки и чаши за многократна употреба с имената им, пише WIRED.

Новата мания стана възможна благодарение на GPT-4o – най-новата версия на генератора на изображения на OpenAI, който значително разширява възможностите на ChatGPT в редактирането на снимки и създаването на визуално съдържание. Един от най-големите хитове бяха изображенията в стила на японското студио за анимации Studio Ghibli, които бързо се превърнаха в тренд.

Създаването на подобни изображения се случва лесно и е безплатно – нуждаете се само от OpenAI акаунт и ваша снимка. Но за да създадете екшън фигура или изображение в стил Ghibli, трябва да предоставите доста лични данни на OpenAI, които потенциално могат да бъдат използвани за обучение на моделите и… Да, в това със сигурност няма нищо забавно.

Данните, които предоставяте, често са поверителни. Всеки път когато качите снимка в ChatGPT, вие реално изпращате цял пакет от метаданни, обяснява Том Ваздар, ръководител в областта на киберсигурността към Open Institute of Technology. „Това включва EXIF данните към файла – като кога е направена снимката, както и GPS координатите на мястото, където е заснета.“

Освен това OpenAI събира информация за устройството ви, с което достъпвате платформата – модел, операционна система, версия на браузъра и уникални идентификатори.

„И тъй като платформи като ChatGPT работят по разговорен принцип, се събира и поведенческа информация – какво въвеждате, какви изображения генерирате, как взаимодействате с интерфейса и колко често го правите“, допълва Ваздар.

И тук не става въпрос само за лицето ви. Ако качите висококачествена снимка, предоставяте и всичко друго, което присъства на нея – фон, други хора, предмети в стаята, както и всичко четимо, например документи или баджове, посочва Камдън Уулвен от GRC International Group.

Данните ви всъщност са златна мина за AI

Този вид доброволно предоставени данни, които са абсолютно подкрепени със съгласието ви, са „златна мина за обучение на генеративни модели“, особено за мултимодални системи, които разчитат на визуални входове, казва Ваздар.

OpenAI категорично отрича да стои зад вирусните тенденции с цел събиране на потребителски данни, но е факт, че компанията извлича полза от тях.

„На компанията не ѝ се налага да обикаля интернет, за да търси лицето ви, ако вие самите с удоволствие го предоставяте“, отбелязва Ваздар.

„Тенденцията, независимо дали е замислена или е просто „щастлива“ случайност, осигурява на OpenAI огромни обеми от свежи и качествени данни за лица от различни възрасти, етноси и региони.“

От OpenAI уверяват, че не търсят активно лична информация за обучение на моделите и не използват публични данни от интернет за създаване на профили за таргетирана реклама или продажба на данни.

Въпреки това, според действащата политика за поверителност, изображенията, които се качват в ChatGPT, могат да бъдат съхранявани и използвани за подобряване на моделите.

„Без значение какво споделяте – дали данни, заявки или снимки – всичко това реално помага за обучението на алгоритъма“, казва Джейк Мур, глобален съветник по киберсигурност в ESET. Той дори създава своя собствена екшън фигура, за да демонстрира какви са рисковете за личната поверителност в LinkedIn.

Колко всъщност е защитено личното ви изображение в ChatGPT?

На много места личните ви снимки и данни са защитени от стриктни регулации. Например в Обединеното кралство и Европейския съюз Общият регламент за защита на данните (GDPR) осигурява силна защита – включително право на достъп и изтриване на данните ви. Освен това използването на биометрични данни изисква изрично съгласие.

Снимките обаче се класифицират като биометрични данни само ако се обработват чрез специфични технологии, които позволяват уникална идентификация на конкретен човек, обяснява Мелиса Хол, старши сътрудник в правната кантора MFMac.

По нейно мнение, ако дадено изображение просто бива обработвано, за да се създаде анимирана версия на оригиналния субект, „вероятността да попадне в тази дефиниция е минимална“.

Същевременно на територията на САЩ защитата на личните данни варира за различните щати. „Калифорния и Илинойс водят с по-строги закони, но няма единен национален стандарт“, казва Аналиса Кеки, партньор в правната кантора Ionic Legal.

Политиката за поверителност на OpenAI също не съдържа изрично уточнение за изображения с лица или биометрични данни, което „създава сива зона за качване на стилизирани портрети“, коментира тя.

Сред основните рискове са възможността вашето изображение или подобие да бъдат съхранявани, използвани за обучение на бъдещи модели или комбинирани с други данни за профилиране, обяснява Кеки. „Макар че платформите обикновено поставят безопасността на първо място, дългосрочната употреба на вашето изображение остава неясна – и е трудно да бъде оттеглена веднъж качена.“

От OpenAI заявяват, че поверителността и сигурността на потребителите са техен приоритет. Компанията подчертава, че целта ѝ е моделите да се учат за света като цяло, а не за конкретни хора, и активно минимизира събирането на лична информация.

Потребителите разполагат с контрол върху това как данните им се използват – чрез инструменти за достъп, експортиране и изтриване на лична информация. Освен това всеки може да се откаже от това съдържанието му да се използва за подобряване на моделите, казват от OpenAI.

Потребителите на ChatGPT, независимо какъв план използват, могат да управляват дали допринасят за бъдещи обучения на моделите в настройките си за контрол на данни. Компанията уточнява, че по подразбиране не използва данните на клиентите на ChatGPT Team, Enterprise и Edu за обучение.

Забавлението струва скъпо

Следващия път, когато се изкушавате да се включите в подобен тренд, като създаването на изображение в стил Ghibli или ваша собствена екшън фигурка, си струва добре да обмислите какви лични данни предоставяте.

Рисковете естествено не важат само за ChatGPT, но и за повечето генеративни AI инструменти за редакция и създаване на изображения – именно затова е важно политиката за поверителност да се чете внимателно, преди да споделяте каквато и да е информация.

Има и някои практически мерки за защита на данните ви. Най-ефективната в ChatGPT е да изключите историята на чатовете, което намалява вероятността данните ви да бъдат използвани за обучение, съветва Том Ваздар.

Също така можете да качвате анонимни или модифицирани изображения – например със специален филтър или дигитален аватар, вместо реалната ви снимка.