OpenAI представи нов инструмент, който може да имитира човешки глас със смущаваща точност. AI-базираният генераторът има редица приложения, включително в обслужването на хора в неравностойно положение, но буди и тревога, тъй като може да бъде използван за дезинформация и друг вид злоупотреби, пише CNN.

В петък OpenAI разпространи резултати от ранни тестове на инструмента, наречен Voice Engine, който използва 15-секундни записи на човешки глас, за да генерира убедително синтетично копие. Потребителите могат да подадат и кратък текст, който AI инструментът да прочете със същия този глас.

От компанията казват, че подобен AI-базиран инструмент може да помага в преводаческата дейност, четенето – особено на деца, и на хора, загубили способността си да говорят. Някои скептици обаче се опасяват, че той може да бъде използван за дезинформация и измами.

Понастоящем Voice Engine се използва от „малка група доверени партньори“ на OpenAI, казват от компанията. Сред тях са бизнеси в сферата на образованието и здравните технологии, а от експериментите им с инструмента ще зависи дали и как той ще бъде достъпен за по-широка аудитория. Екипите, които извършват тестове с Voice Engine, са дали съгласие да не копират гласове на хора, които не са дали изрично съгласие, както и да информират слушателите, че записите са генерирани от изкуствен интелект.

„Осъзнаваме, че генерирането на гласове, които наподобяват човешки, носи сериозни рискове, особено в година на избори“, гласи публикация на OpenAI. Въпреки че засега свободният достъп до Voice Engine се отлага, компанията отчита необходимостта за мащабни промени заради все по-широкото разпространение на AI-генерирано аудио. Оттам предлагат например банките поетапно да премахнат гласовата идентификация за достъп до сметките на клиентите си.

„Всяко приложение на технологията за синтетичен глас трябва да бъде съпътствано от процес на удостоверяване, че първоначалният говорител съзнателно добавя гласа си към услугата, както и от списък с гласове, които не могат да бъдат репликирани, тъй като са твърде близки до тези на известни личности“, казват от OpenAI.

Voice Engine може да използва запис на глас на един език, за да генерира негово копие на няколко други. Публикацията на компанията включва пример със запис на човек, който чете кратък текст за приятелството, и AI генерирано аудио, което звучи също като него и чете същия откъс на испански, мандарин, немски, френски и японски. Във всеки от синтетичните записи интонацията и акцентът на първоначалния говорител са запазени.

Представянето на Voice Engine бе предшествано от това на Sora – AI-базиран инструмент на OpenAI за генериране на видеосъдържание. Отделно в понеделник компанията оповести, че вече всеки може да използва ChatGPT без необходимост от акаунт.