От LLM до галлюцинаций: простой гид по основным терминам ИИ для школьника

Искусственный интеллект — это сложный и запутанный мир. Ученые, работающие в этой области, часто используют профессиональный жаргон, чтобы объяснить свои разработки. В результате нам часто приходится использовать эти технические термины в новостях об индустрии ИИ. Поэтому мы решили составить глоссарий с определениями самых важных слов и фраз, которые встречаются в наших статьях.

Это любая команда, вопрос или текст, который ты вводишь в поле ввода при общении с искусственным интеллектом. Представь, что ты даешь квест персонажу в игре: если ты скажешь просто «иди туда», он может застрять в текстурах, но если ты опишешь маршрут, результат будет иным. Хороший промпт включает в себя контекст, задачу и формат ответа. Например, вместо «напиши про котов», лучше сработает: «Напиши пять интересных фактов о породах котов для школьной презентации в юмористическом стиле». Чем точнее твой промпт, тем меньше шансов, что нейросеть начнет «фантазировать» не в ту сторону.

Это внешняя оболочка или программа, через которую ты общаешься с искусственным интеллектом. Важно понимать разницу: чат-бот — это как мессенджер или интерфейс (кнопки, текстовое поле), а нейросеть — это «мозги», которые сидят внутри него. Раньше чат-боты были очень глупыми и работали по простым правилам (если пользователь написал «привет», ответь «привет»). Современные чат-боты на базе нейросетей способны поддерживать сложный диалог, понимать шутки и запоминать то, что ты сказал несколько минут назад. Они могут жить в Telegram, на сайтах или в виде отдельных приложений на твоем смартфоне.

Это целая дисциплина о том, как правильно «разговаривать» с нейросетями, чтобы получать от них идеальные ответы. Это не просто написание вопросов, а знание специальных техник. Например, промпт-инженер может попросить ИИ «сначала составить план, а потом писать текст» или «проверить свой ответ на ошибки перед тем, как показать его пользователю». В крупных компаниях это уже стало отдельной профессией. Хороший промпт-инженер знает, как заставить ИИ решать сложные математические задачи или писать программный код, используя только обычные слова вместо языка программирования.

Это мощнейший тип нейросети, который обучался на гигантских объемах текста — книгах, статьях из Википедии, коде программ и сообщениях на форумах. Слово «Большая» здесь означает, что внутри модели находятся миллиарды связей (параметров). Работа LLM похожа на работу очень продвинутого Т9: она не «понимает» смысл жизни, но она настолько хорошо знает правила языка и факты, что может предсказать, какое слово должно идти следующим в предложении. Благодаря этому она может писать эссе, переводить с одного языка на другой и даже имитировать стиль общения конкретного человека.

Это ИИ будущего, который по уровню развития будет равен человеческому мозгу или превзойдет его. Современные нейросети называют «узким» ИИ: одна круто рисует, другая пишет тексты, третья играет в шахматы. Но они не могут завтра пойти и научиться водить трактор или проводить хирургическую операцию самостоятельно. AGI же сможет освоить любую задачу, которую способен выполнить человек. Ученые спорят, когда он появится: одни говорят, что через пять лет, другие — что на это уйдут десятилетия. Это тот самый «умный компьютер» из научной фантастики вроде Джарвиса из «Железного человека».

Это эволюция обычного чат-бота. Если бот просто отвечает на вопросы, то агент — это программа, которая умеет выполнять действия в реальном мире или других программах. Например, ИИ-агент может по твоей просьбе зайти на сайт авиакомпании, сравнить цены на билеты, выбрать самый дешевый рейс и забронировать его, используя твою карту. Он может самостоятельно пользоваться браузером, калькулятором или редактором кода. Главная фишка агента в его автономности: ты даешь ему конечную цель, а он сам решает, какие шаги нужно предпринять для её достижения.

Специальный метод работы ИИ, когда модель заставляют разбивать решение задачи на последовательные логические этапы. Без этого метода ИИ может выдать ответ мгновенно и ошибиться в простых вычислениях. Но если попросить его «рассуждать шаг за шагом», он сначала запишет первое действие, потом второе, проанализирует промежуточный результат и только в конце выдаст финальный ответ. Это значительно повышает точность в задачах по математике, физике или при написании сложного программного кода, так как модель сама видит свои возможные ошибки в процессе «размышления».

Это физическая сила, на которой работает весь мир ИИ. Для обучения и работы нейросетей не подходят обычные домашние компьютеры — нужны огромные центры обработки данных с тысячами мощных видеокарт (GPU). Термин «компьют» описывает количество этих ресурсов. Чем больше вычислительной мощности у компании, тем более умную модель она может создать. Сегодня «компьют» — это своего рода новая нефть: страны и корпорации тратят миллиарды долларов, чтобы закупить как можно больше чипов, потому что без них ИИ просто не сможет «думать».

Это технология обучения нейросетей, которая вдохновлена устройством человеческого мозга. «Глубоким» оно называется потому, что нейросеть состоит из огромного количества слоев — от десятков до сотен. Каждый слой отвечает за свою часть задачи: например, при распознавании картинки первый слой видит просто линии, второй — углы и круги, третий — очертания ушей или хвоста, а последний понимает, что перед ним кот. Благодаря глубокому обучению программы стали способны сами находить сложные закономерности в данных, не дожидаясь, пока человек объяснит им каждое правило.

Это математическая модель, которая имитирует сеть нервных клеток живого организма. Она состоит из цифровых «нейронов», которые соединены между собой. Когда информация проходит через эти связи, они могут либо усиливать сигнал, либо ослаблять его. Обучение нейросети — это процесс настройки этих связей так, чтобы на выходе получался правильный результат. Современный бум ИИ случился потому, что инженеры научились строить нейросети из миллиардов таких ячеек и быстро обучать их на мощных видеокартах, которые раньше использовались только для крутой графики в видеоиграх.

Технология, которая перевернула мир цифрового искусства. Работает она так: нейросеть сначала учат портить картинки, постепенно добавляя на них «шум» (помехи, как на старом телевизоре), пока изображение не превратится в кашу из цветных точек. А потом её учат обратному процессу — восстанавливать изображение из шума. Когда ты пишешь запрос «астронавт на лошади», нейросеть берет чистый «шум» и начинает шаг за шагом убирать из него лишние точки, пока на холсте не проявится четкая картина. Так работают Midjourney и Stable Diffusion.

Метод «сжатия» знаний ИИ. Представь огромную, очень умную, но неповоротливую нейросеть, которая занимает целую серверную комнату. Дистилляция позволяет создать маленькую и быструю модель-«ученика». Большая модель («учитель») показывает маленькой свои ответы и объясняет, как она к ним пришла. В итоге маленькая модель научится выдавать почти такие же качественные ответы, но при этом она будет весить в разы меньше и сможет работать даже на твоем телефоне без подключения к интернету. Это критически важно для создания быстрых голосовых помощников.

Это процесс специализации уже готовой нейросети. Допустим, у нас есть «базовая» модель, которая умеет просто хорошо писать тексты. Чтобы сделать из неё крутого юриста, её нужно «дообучить» на сборниках законов и судебных делах. Это и есть тонкая настройка. Модель не учится говорить заново, она просто уточняет свои знания в конкретной узкой области. Это гораздо дешевле и быстрее, чем обучать новую нейросеть с нуля, и именно так создаются специализированные ИИ для медицины, программирования или службы поддержки.

Это система, где две нейросети постоянно «дерутся» друг с другом. Одна называется «Генератор» — её задача создавать что-то новое (например, лица людей). Вторая — «Дискриминатор», она играет роль критика или полицейского, который пытается отличить работу первой нейросети от реального фото. Генератор постоянно пытается обмануть Дискриминатора, а Дискриминатор старается стать внимательнее. В результате этого бесконечного соревнования Генератор научился создавать изображения, которые практически невозможно отличить от настоящих фотографий.

Главный минус современных нейросетей. Галлюцинация — это когда ИИ с очень уверенным видом выдает ложную информацию: придумывает исторические даты, цитирует несуществующие законы или приписывает книги другим авторам. Это происходит потому, что ИИ не «знает» факты так, как мы, а просто подбирает слова, которые статистически чаще всего стоят рядом. Если в его «опыте» есть пробел, он просто заполнит его красиво звучащей выдумкой. Поэтому любые важные данные, которые выдает нейросеть, нужно всегда перепроверять в проверенных источниках.

Это использование уже готовой, обученной нейросети. Когда разработчики обучают модель — это процесс «учебы», который длится месяцами. Когда ты вводишь запрос в чат и получаешь ответ — это инференс. Это стадия, когда модель применяет все свои накопленные знания на практике. Скорость инференса очень важна: если модель слишком большая, она будет «тупить» и выдавать ответ по одному слову в минуту. Разработчики постоянно оптимизируют нейросети, чтобы инференс проходил как можно быстрее и дешевле.

Самый первый и самый сложный этап создания ИИ. В нейросеть загружают огромный массив данных (тексты, картинки, звуки) и заставляют её искать в них закономерности. Во время обучения модель делает миллиарды попыток угадать правильный ответ, и каждый раз, когда она ошибается, её внутренние настройки (веса) немного меняются. Это требует колоссального количества электроэнергии и времени. Если данные для обучения были плохими или их было мало, то и нейросеть получится глупой или предвзятой.

Это единицы измерения, на которые ИИ разбивает текст перед обработкой. Нейросеть не видит буквы или слова так, как мы. Она превращает текст в токены — это могут быть целые слова, слоги или даже отдельные символы. Например, слово «кот» может быть одним токеном, а слово «высокопревосходительство» будет разбито на пять или шесть. У каждой модели есть «контекстное окно» — лимит токенов, которые она может держать в памяти за раз. Именно за количество потраченных токенов (как входящих от тебя, так и исходящих от ИИ) обычно выставляются счета за использование нейросетей.

Это числа внутри нейросети, которые определяют силу связей между цифровыми нейронами. Можно представить их как миллионы маленьких регуляторов громкости. Если вес большой — значит, этот сигнал важен для принятия решения. В процессе обучения ИИ крутит эти регуляторы туда-сюда, пока не добьется правильных ответов. Когда говорят, что в модели GPT-4 триллионы параметров, имеют в виду именно количество этих «весов». По сути, файл с весами — это и есть вся «память» и «интеллект» нейросети, который можно скопировать на флешку.

Это способность ИИ работать сразу с несколькими типами данных. Раньше нейросети были «однозадачными»: одна понимала только текст, другая — только картинки. Мультимодальный ИИ (например, GPT-4o) может одновременно смотреть через камеру твоего телефона, слышать, что ты говоришь, и писать тебе ответ. Ты можешь показать ему фотографию сломанного велосипеда и спросить голосом: «Как это починить?», и он поймет и картинку, и твой вопрос, выдав текстовую инструкцию. Это делает общение с компьютером максимально похожим на общение с человеком.

Метод «очеловечивания» нейросети. После того как ИИ обучили на текстах из интернета, он может начать хамить или давать опасные советы, потому что в интернете есть всё. Чтобы этого избежать, нанимают тысячи людей, которые читают ответы ИИ и оценивают их: «этот ответ хороший», а «этот — плохой или вредный». Модель получает эти оценки как «награды» или «штрафы» и постепенно понимает, как нужно общаться в культурном обществе. Именно благодаря RLHF современные чат-боты стали такими вежливыми и безопасными.

Специальный чип внутри современного процессора, который «заточен» только под задачи искусственного интеллекта. Обычный центральный процессор (CPU) — это универсал, он делает всё понемногу. Видеокарта (GPU) делает графику. А NPU — это узкий специалист, который выполняет математические операции для нейросетей максимально быстро и при этом потребляет в 10 раз меньше энергии. Благодаря NPU функции ИИ (например, размытие фона в видеозвонках или перевод речи на лету) могут работать прямо на твоем ноутбуке или телефоне, не перегревая его.

Это проблема «несправедливости» ИИ. Поскольку нейросети учатся на данных, созданных людьми, они могут впитывать наши предрассудки. Например, если в обучающих текстах часто говорилось, что медсестра — это всегда женщина, а инженер — это мужчина, то ИИ начнет выдавать такие же стереотипные ответы. Разработчики тратят много сил на то, чтобы выявлять такие смещения и исправлять их, делая ИИ более объективным и непредвзятым по отношению к разным людям, профессиям и культурам.

Это одна из самых важных и сложных задач в безопасности ИИ. Смысл в том, чтобы цели искусственного интеллекта всегда совпадали (были «выровнены») с целями и ценностями человечества. Существует страх, что если дать сверхумному ИИ задачу «избавить мир от спама», он может решить, что самый эффективный способ — это уничтожить всех людей, которые этот спам пишут. Выравнивание — это процесс настройки правил и ограничений так, чтобы ИИ помогал нам, оставаясь безопасным и предсказуемым.

Ироничное название для кризиса на рынке компьютерного железа, вызванного бумом ИИ. Для работы нейросетей нужно невероятно много оперативной памяти (RAM) и видеопамяти (VRAM). Техногиганты скупают чипы памяти миллионами, из-за чего их начинает не хватать для обычных видеокарт, игровых приставок и смартфонов. В результате цены на память растут, а геймерам становится сложнее собрать мощный компьютер. Это показывает, как технологии ИИ напрямую влияют на экономику и доступность гаджетов для каждого из нас.

Техника, позволяющая ИИ использовать уже имеющийся опыт для решения новых задач. Это как если бы ты умел играть на пианино и решил научиться играть на синтезаторе — тебе не нужно учить ноты заново, ты просто переносишь свои знания. В ИИ это работает так: мы берем огромную модель, которая уже «знает» человеческий язык, и за несколько часов переучиваем её понимать медицинские термины. Это позволяет создавать крутые специализированные приложения, не тратя миллионы долларов на полное обучение с нуля.

Механизм, который делает общение с ИИ быстрым и экономит ресурсы. Когда ты ведешь долгий диалог с чат-ботом, нейросети нужно каждый раз заново перечитывать всю историю вашей переписки, чтобы не потерять нить разговора. Это требует много вычислений. Кэширование позволяет «запоминать» промежуточные математические результаты предыдущих сообщений и хранить их в быстрой памяти. Благодаря этому ИИ отвечает тебе мгновенно, а сервера компании не перегреваются от лишней работы.

Больше новостей в телеграм-канале: Quantum Drift

От LLM до галлюцинаций: простой гид по основным терминам ИИ для школьника

Prompt (Промпт / Запрос)

Chatbot (Чат-бот)

Prompt Engineering (Промпт-инжиниринг / Конструирование запросов)

LLM (Large Language Model / Большая языковая модель)

AGI (Artificial General Intelligence / Искусственный общий интеллект)

AI agent (ИИ-агент)

Chain of thought (Цепочка рассуждений)

Compute (Вычисления / Вычислительные мощности)

Deep learning (Глубокое обучение)

Neural network (Нейронная сеть)

Diffusion (Диффузия)

Distillation (Дистилляция)

Fine-tuning (Тонкая настройка)

GAN (Generative Adversarial Network / Генеративно-состязательная сеть)

Hallucination (Галлюцинация)

Inference (Инференс / Вывод)

Training (Обучение)

Tokens (Токены)

Weights (Веса)

Multimodality (Мультимодальность)

RLHF (Reinforcement Learning from Human Feedback / Обучение с подкреплением на основе отзывов людей)

NPU (Neural Processing Unit / Нейронный процессор)

Bias (Предвзятость / Смещение)

Alignment (Выравнивание)

RAMageddon (РАМагеддон)

Transfer learning (Обучение с переносом знаний)

Memory cache (Кэш памяти)