Сложната математика се превръща в новия тест за изкуствения интелект
Модели на OpenAI и Google вече решават задачи на ниво научни изследвания, превръщайки математиката в новия стандарт за измерване на реалния напредък на изкуствения интелект
,fit(1001:538)&format=webp)
Водещи компании за изкуствен интелект все по-често използват едни от най-трудните математически проблеми в света като тест за способностите на своите модели – сигнал, че надпреварата вече се измества отвъд комерсиалните приложения към фундаменталната наука.
Показателен пример идва от Университета в Кеймбридж, където студент използва най-напредналия модел на OpenAI, за да реши конкретен случай от т.нар. „проблеми на Ердьош“ – серия от известни математически задачи, много от които остават нерешени до днес.
Този пробив е част от по-широка тенденция. През последната година системи на OpenAI и Google DeepMind постигат резултати на ниво златен медал на престижни състезания като Международната математическа олимпиада и Международното състезание по програмиране за студенти.
„Преминахме от тестове, които проверяват дали изкуственият интелект може да различава котки от кучета, към това дали може да решава научни математически проблеми“, казва Хелън Тонър, временен изпълнителен директор на Центъра за сигурност и нововъзникващи технологии към Джорджтаун и бивш член на борда на OpenAI, пред Financial Times.
Математиката се превръща в новия състезателен терен за AI
Конкуренцията между водещите лаборатории вече се фокусира върху научни открития, а не единствено върху чатботове и приложения за потребителите.
Google DeepMind разработва специализирани инструменти като AlphaProof и AlphaGeometry, предназначени да решават сложни математически задачи. Anthropic, от своя страна, започва да предлага системите си за изкуствен интелект директно на учени като част от стратегията си да навлезе в научноизследователския сегмент.
Математиката се утвърждава и като ключов тест. Според нов индекс на Epoch AI, който измерва представянето на AI в решаването на сложни математически задачи, GPT-5.2 на OpenAI оглавява класацията, следван от Gemini 3 Pro на Google.
Това е значителна промяна спрямо предишните очаквания. Дълго време изследователите са на мнение, че големите езикови модели ще се сблъскат със сериозни трудности в математиката, тъй като те работят на вероятностен принцип – предсказват най-вероятната следваща дума, а не гарантират абсолютна точност. Това води до риска от т.нар. „халюцинации“ – убедително звучащи, но грешни отговори.
Математиката обаче изисква логическа строгост, разпознаване на абстрактни модели и безупречна точност.
Новото поколение модели с логическо мислене променя правилата
Според водещи изследователи последното поколение модели за изкуствен интелект вече прави качествен скок благодарение на т.нар. способности за логическо мислене – способността да решават проблеми стъпка по стъпка, да проверяват собствените си изчисления и да коригират грешки.
„Много хора смятаха, че това, което днес виждаме, ще бъде невъзможно за езиковите модели“, казва Себастиан Бюбек, изследовател в OpenAI, пред Financial Times.
Напредъкът има и стратегическо измерение. Наскоро OpenAI привлича двама изтъкнати математици – Ърнест Рю от UCLA и Мехтааб Сохни от Columbia University – за да подсили екипа си, фокусиран върху научните приложения на AI.
Математиката има и ключово практическо значение. Тя позволява автоматична проверка на решенията, което я прави идеална тренировъчна среда за системи, които трябва да бъдат изключително точни – например при писане на код.
Това вече носи сериозни бизнес резултати. Anthropic например отбелязва значителен успех със своя инструмент Claude Code, който се превръща във важен продукт и допринася за оценката на компанията от около 350 млрд. долара.
„Лабораториите искат изкуствен интелект, който е отличен в математическите изчисления, защото това директно подобрява способността му да пише код“, казва Майлс Кранмър, професор по математика в Кеймбридж, който работи върху използването на AI за научни открития.
Все още сме далеч от автономни научни открития
Въпреки бързия напредък експертите подчертават, че изкуственият интелект все още не може самостоятелно да решава най-сложните математически проблеми.
Причината за това е структурна. Реалните научни пробиви изискват продължителен процес на учене, запазване на контекст и постепенно изграждане на знания – нещо, което днешните модели все още не могат да правят напълно автономно.
„Проблеми, които отнемат седмици или години, не могат да бъдат решени в една сесия. Трябва да оставяш бележки, да учиш от грешките и да надграждаш“, казва Бюбек.
На този етап изкуственият интелект е най-полезен като ускорител на научния процес – при анализ на научна литература, обобщаване на данни, генериране на идеи и свързване на информация от различни области.
Благодарение на огромната си изчислителна мощ тези системи могат да проверяват хиляди хипотези и уравнения значително по-бързо от хората.
„Това е изключително вълнуващ момент за математиката“, казва Кранмър.
Как изглежда голямата картина?
Накратко, математиката се превръща в новия лакмус тест за реалните способности на изкуствения интелект.
Ако един модел може надеждно да решава сложни математически задачи, това означава, че той вече притежава ключови качества – логика, последователност и способност за абстрактно мислене. Именно тези качества ще определят кои AI системи ще доминират следващата фаза на технологичната революция.
И ако до момента AI беше инструмент за автоматизация, следващият етап в развитието му е много по-амбициозен: да се превърне в партньор в научните открития.
&format=webp)
&format=webp)
&format=webp)
)
&format=webp)
&format=webp)
&format=webp)
,fit(1920:897)&format=webp)
,fit(140:94)&format=webp)
,fit(140:94)&format=webp)
,fit(140:94)&format=webp)
,fit(140:94)&format=webp)
,fit(140:94)&format=webp)