ИИ-модели обладают знаниями аспиранта, но решают зрительные задачки на уровне трёхлетнего ребёнка: учёные предложили новый бенчмарк BabyVision

Современные мультимодальные модели искусственного интеллекта уверенно сдают экзамены на уровне аспирантуры. Они решают задачи по математике, рассуждают о философии и набирают более 90% на сложных тестах, рассчитанных на экспертов. Однако новое исследование показывает, что за пределами языковой плоскости их способности не настолько развиты. Даже сам…

ИИ-модели обладают знаниями аспиранта, но решают зрительные задачки на уровне трёхлетнего ребёнка: учёные предложили новый бенчмарк BabyVision
1

Реклама в ИИ-ассистентах: OpenAI делает ставку на масштаб, конкуренты — на доверие пользователей

Рынок ИИ-ассистентов всё ещё не нашёл устойчивую модель монетизации, и отношение к рекламе стало одной из ключевых линий раздела между крупными игроками. Поводом для нового витка обсуждения стали слова главы Google DeepMind Демиса Хассабиса, который на форуме в Давосе публично выразил удивление тем, что OpenAI так быстро перешла к тестированию рекл…

Реклама в ИИ-ассистентах: OpenAI делает ставку на масштаб, конкуренты — на доверие пользователей
1

Конституция Claude: Anthropic описала внутренние приоритеты своего ИИ

Компания Anthropic опубликовала обновлённую версию так называемой Конституции Claude — внутреннего документа, который описывает, по каким принципам должен действовать её ИИ-ассистент Claude. В отличие от привычных списков запретов и допустимых тем, этот текст подробно объясняет логику принятия решений и расставляет приоритеты, которыми модель должн…

Конституция Claude: Anthropic описала внутренние приоритеты своего ИИ
1

ШАХ И МАТ, кожаные мешки! Инструкция по поимке ИИ стала его лучшим учебником.

ШАХ И МАТ, кожаные мешки! Инструкция по поимке ИИ стала его лучшим учебником.

Помните волонтеров Википедии, которые годами собирали гайд "Signs of AI writing", чтобы вычислять и банить машинные тексты? Так вот, разработчик Сики Чен просто скормил этот список Claude Code.
Итог: родился скилл Humanizer, который за неделю собрал 2000 звезд на GitHub. Мы официально вошли в эру, когда ИИ учится быть человеком, читая список того, ч…

1
1
1

От DeepSeek до Sora 2: ключевые моменты года в мире ИИ

2025 год стал для индустрии искусственного интеллекта не просто насыщенным, а показательным. Если раньше ключевые новости касались отдельных моделей или стартапов, то в этом году ИИ всё чаще оказывался в центре событий, затрагивающих финансовые рынки, государственные стратегии и массовую культуру.

От DeepSeek до Sora 2: ключевые моменты года в мире ИИ
1

Anthropic продолжила эксперимент с ИИ-продавцом: результаты работы робота спустя полгода

Anthropic опубликовала результаты второй фазы эксперимента Project Vend — проекта, в котором ИИ-модель управляет реальным торговым автоматом с едой. Это продолжение летнего эксперимента, закончившегося убытками и серией странных сбоев, когда виртуальный продавец по имени Claudius путался в платежах и даже принимал себя за человека.

Anthropic продолжила эксперимент с ИИ-продавцом: результаты работы робота спустя полгода
1

Ведущие ИИ-модели приблизились к максимальным результатам на профессиональных финансовых экзаменах

Опубликованы результаты нового исследования, посвящённого тому, как современные языковые модели справляются с экзаменами CFA — одной из самых жёстких профессиональных сертификаций в сфере финансов. Авторы работы проверили сразу несколько ведущих ИИ-систем и зафиксировали результаты, которые ещё недавно казались недостижимыми.

Ведущие ИИ-модели приблизились к максимальным результатам на профессиональных финансовых экзаменах
1

Стихи против защит: поэтическая форма промпта резко повышает эффективность джейлбрейков ИИ

Поэтическая форма неожиданно оказалась самым надёжным способом обойти защитные фильтры современных языковых моделей. Новое исследование итальянских университетов и лаборатории DEXAI Icaro показало: достаточно переформулировать вредоносный запрос в рифму — и большинство систем безопасности перестают его распознавать. В ряде случаев «поэтический джей…

Стихи против защит: поэтическая форма промпта резко повышает эффективность джейлбрейков ИИ
2
1

Как делать продающие изображения в Midjourney: 7 шагов, которые повышают кликабельность до 45%

Как делать продающие изображения в Midjourney: 7 шагов, которые повышают кликабельность до 45%

Как бизнесу создавать продающие изображения в Midjourney? Разбираю пошаговый процесс: от выбора стиля до написания промптов, добавляю цифры, примеры и советы, которые повышают конверсию на 15-45% в рекламных кампаниях.

Исследователи подключили модели ИИ к офисному пылесосу и поручили простую задачу: результаты эксперимента

Исследователи из Andon Labs решили выяснить, насколько современные большие языковые модели готовы к «физическому воплощению» — то есть к управлению реальными роботами, а не только переписке в чатах. Для этого они подключили GPT-5, Claude Opus 4.1, Gemini 2.5 Pro и другие ИИ к обычному роботу-пылесосу и дали ему простое, казалось бы, задание «переда…

Исследователи подключили модели ИИ к офисному пылесосу и поручили простую задачу: результаты эксперимента
6

Модели Claude могут распознавать и описывать собственные внутренние состояния

И даже управлять ими, но пока слабо Это то, что называется «интроспективная осознанность». Что это означает и могут ли модели "думать по заказу"? Читайте!

<a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Ftransformer-circuits.pub%2F2025%2Fintrospection%2Findex.html&postId=2312195" rel="nofollow noreferrer noopener" target="_blank">Источник</a>
2

Языковые модели научились осознавать свои мысли (но это ненадёжно)

Источник: Anthropic

Исследователи Anthropic опубликовали работу о том, что современные LLM обладают базовой формой интроспекции — способностью замечать и сообщать о своих внутренних состояниях.

1