ChatGPT за 80 минут закрыл задачу 60-х: что это значит для всей математики!

Свежая история, о которой сейчас говорит всё ИИ-сообщество: ChatGPT за 80 минут добил математическую задачу, которая висела открытой ещё со времён шестидесятых. Но самое любопытное здесь не сам результат, а способ, которым он был получен, и именно из-за него у этой истории такие далеко идущие последствия для всей теории чисел.

Контекст простой. Молодой математик Джаред Лихтман в 26 лет уже прославился тем, что закрыл гипотезу, открытую с 1988 года. После этого он семь лет бился над более тонкой версией той же задачи и упёрся в стену. Речь шла о так называемых примитивных множествах, придуманных Палом Эрдёшем. Если объяснять на пальцах, то это список чисел, в котором ни одно число не делится на другое: есть двойка , значит, нет ни четвёрки, ни шестёрки, ни восьмёрки. Простые числа идеально вписываются в это правило, и Эрдёш почти век назад поставил вопрос, действительно ли они образуют наилучший возможный список.

Мой тг канал, если хочешь быть в курсе ИИ, технологий и интересных разработок!

Дальше начинается та часть, ради которой и стоит читать. Все девяносто лет математики ходили вокруг этой задачи одной и той же тропинкой: переводили её в язык теории вероятностей, получали аккуратное и красивое решение, но фактически делали лишний круг. Модель пошла напрямую, по той самой улице, которая людям казалась некрасивой и неэлегантной. Лихтман сравнил это с шахматами: представьте, что все классические дебюты разобраны на столетия вперёд, а ИИ внезапно достаёт ход, который всё это время лежал на поверхности, но никто его не играл, потому что он выглядел грубо.

Реакция со стороны цеха показательна. Теренс Тао, которого многие считают самым влиятельным живущим математиком, сказал, что найденный приём не просто закрывает один частный сюжет, а способен упростить целую ветвь теории чисел, которая десятилетиями носила в себе ненужную сложность. То есть речь идёт не о красивой одноразовой победе, а о смене инструмента, которым теперь можно перепахивать соседние задачи.

Для специалистов по ИИ здесь два важных вывода. Первый: модель оказалась полезна не там, где надо считать быстрее человека, а там, где надо игнорировать культурную инерцию. У людей за плечами девяносто лет привычки решать задачу через вероятности, у модели этой привычки нет, и она спокойно выбирает прямой путь. Второй вывод глубже и неприятнее. Получается, что часть правил, которым мы следуем в науке, инженерии и продуктовой разработке, это вовсе не законы вселенной, а просто то, как мы однажды сделали в первый раз и потом перестали ставить под сомнение. ИИ как раз и оказывается удобной линзой, чтобы такие застывшие договорённости разглядеть.

Если перенести вывод на ML-практику, картина получается отрезвляющая. Мы привыкли оценивать модели по тому, как они повторяют человеческие ходы: бенчмарки, ground truth, экспертные ответы. Но самое ценное от них приходит ровно в тех точках, где эксперт сказал бы «так не делают». Значит, и оценку, и постановку задач для научного ИИ стоит проектировать так, чтобы у модели был шанс предложить некрасивое решение и чтобы это решение не отбрасывалось на первом же ревью.

И ещё один тонкий момент, который легко упустить. Лихтман не получил готовый ответ из чёрного ящика, он работал с моделью семь лет в фоновом режиме и в нужный момент задал ей правильный вопрос. Это совсем не похоже на сюжет «ИИ заменяет учёного». Это скорее про новую форму соавторства, в которой человек удерживает вкус и постановку, а модель приносит варианты, которые человеку даже в голову не пришли бы из-за его собственного опыта.

Источник поста: https://x.com/AlanDaitch/status/2048009722737901819

Обсуждение задачи и решения: https://erdosproblems.com/forum/thread/1