В Силициевата долина, където смелите технологични залози са ежедневно явление, малко от тях изглеждат толкова дръзки, колкото опитът да бъде разбита хватката на CUDA – софтуерният стек на Nvidia, който тихомълком се превърна в операционната система на целия AI бум.

Именно това се опитва да постигне Modular – стартъп, основан от софтуерни специалисти, идващи от гигантите Apple и Google.

Съоснователите Крис Латнър и Тим Дейвис са прекарали десетилетия в изграждането на „софтуерния водопровод“, който стои в основите на съвременната технологична индустрия. Латнър е известен в средите като създател на езика за програмиране Swift на Apple. Заедно с Дейвис, той изгражда и софтуера, който поддържа чиповете за изкуствен интелект (TPU) на Google.

Сега те насочват този експертен опит директно срещу CUDA. Опитът граничи с лудост, но това е именно онзи вид дързък проект, който би могъл изцяло да трансформира AI индустрията.

„Много хора гледат на това като на налудничава идея“, разказва пред Business Insider Кайлан Гибс, главен изпълнителен директор на стартъпа Inworld AI и бивш продуктов мениджър в Google DeepMind. „Но тук Крис има едно ключово предимство: той е достатъчно умен, за да знае как да го направи, и достатъчно луд, за да се наеме с тази задача.“

CUDA стартира преди почти 20 години като начин графичните чипове да бъдат програмируеми. Днес тя се е разраснала в многопластова софтуерна екосистема – езици, библиотеки, компилатори – на която разчитат повечето AI компании.

Успехът обаче идва с определена цена: индустрията е оптимизирана около хардуера на един доставчик. CUDA „заключва“ AI работните процеси към графичните процесори на Nvidia. Това е страхотно за компанията, но е изключително ограничаващо за всички останали.

На пръв поглед изглежда, че конкуренция не липсва: AMD продава GPU, Google има своите TPU, Amazon създава чиповете Trainium, а множество стартъпи разработват подобен хардуер. Проблемът идва от факта, че всеки чип върви със собствен софтуерен стек, оптимизиран само за него. Това води до безкрайно „преоткриване на колелото“. В повечето случаи е по-просто да се придържаш към CUDA – и съответно към Nvidia.

Въпреки това, AI разработчиците искат да имат възможността да използват комбинация от чипове на различни доставчици, без да жонглират с различни софтуери.

„Никой не създава преносими неща, защото защо някой би работил върху софтуер за повече от един чип, когато самите производители на чипове създават софтуера?“, коментира Латнър, изпълнителен директор на Modular.

За него този парадокс представлява огромна пазарна ниша.

„Стигнахме до извода, че в индустрията няма никой, който да има стимул да направи това. Много е скъпо и е изключително трудно“, казва той. „И в същото време – всеки го иска.“

Това вдъхновява Латнър и Дейвис да напуснат Google и да стартират Modular през 2022 г. – годината, в която ChatGPT превзе света.

Оттогава Modular набра 380 милиона долара от инвеститори като Greylock, General Catalyst и GV (фондът за рисков капитал на Google). Последното финансиране през септември оцени стартъпа на 1.6 милиарда долара.

Екипът прекарва три години в относителна сянка, изграждайки градивните елементи на новия AI софтуерен стек.

Основата започва с чисто нов език за програмиране, наречен Mojo. Той предлага дълбок контрол, за да накара чиповете за изкуствен интелект да работят максимално ефективно. Modular са го проектирали да работи подобно на Python (който е лесен за използване), но със скоростта и мощността на сложни езици като C++.

Следващият слой е MAX, който управлява изпълнението на AI моделите (inference). Тази част работи с чипове на Nvidia, AMD и дори Apple. Най-отгоре стои Mammoth, който помага за управлението на клъстери от графични процесори.

В края на септември Modular обяви, че е постигнала върхова производителност с новите чипове Blackwell B200 на Nvidia и най-новите MI355X на AMD – ключовото тук е, че това се случва на една и съща софтуерна платформа.

Латнър твърди, че Modular е накарал чиповете на AMD да работят приблизително 50% по-добре, отколкото когато работят със собствения софтуер на AMD. Това отваря вратата за директно сравнение между Nvidia и конкурентите ѝ при равни условия.

Кайлан Гибс от Inworld AI е подложил софтуера на Modular на тест в реални условия. Неговата компания създава изкуствен интелект за гиганти като Disney и NBCUniversal.

По-рано тази година те отправят предизвикателство към Modular: „Намалете разходите ни с 60% и латентността (забавянето) с 40%, и ще работим с вас.“

„В рамките на около четири седмици успяхме да постигнем тази невероятна производителност“, казва пред Business Insider Гибс, който скоро след това подписва партньорство. „Заложих с портфейла си.“

Въпреки че Inworld са привлечени основно от подобрението при чиповете на Nvidia, Гибс харесва гъвкавостта да използва различни доставчици в бъдеще, ако се наложи.

Google наскоро пусна новия си модел Gemini 3, обучен и работещ на техните TPU чипове, което поставя Nvidia в отбранителна позиция. Проект като Modular добавя допълнителен натиск.

„Nvidia може да убие това в рамките на няколко дни“, смята Гибс. „Те могат просто да пуснат опция на CUDA, която работи и на AMD. Би било лудост от бизнес гледна точка, но е възможно.“

Въпреки критиките към индустрията, Латнър твърди, че Modular не се опитва да унищожи хегемона. „Опитваме се да изградим нещо като Android, но за AI хардуер“, обяснява той.

Въпреки че милиарди хора използват Android, този успех не уби iOS на Apple. Латнър смята, че нещо подобно ще се случи в AI сферата – софтуерът на Modular ще направи другия хардуер по-конкурентен, разбивайки монокултурата на единичния доставчик.

„Nvidia не трябва да умира, но ние искаме повече конкуренция и повече иновации. Мисля, че това е добре за света“, завършва той.