RAG — это не ChatGPT: почему инженеру важно понимать разницу
Почему обычный ИИ врёт, а инженер не может себе этого позволить
Если вы хоть раз задавали технический вопрос ChatGPT или похожей системе и получали ответ, который выглядел убедительно, но оказывался неверным — вы столкнулись с явлением, которое в профессиональной среде называют галлюцинацией. Модель не лжёт намеренно. Она просто генерирует текст, который статистически похож на правильный ответ, опираясь на всё, что было в её обучающих данных. Иногда это работает. Иногда — нет. И в большинстве случаев отличить одно от другого без независимой проверки невозможно.
Для широкого круга задач это терпимо. Для инженерной работы — нет. Когда вопрос касается допусков, методов испытаний, требований стандарта или нормативных условий сертификации, ответ должен быть не «похожим на правду», а точным и верифицируемым. Ссылка на конкретный пункт конкретного документа — это не удобство, это необходимость. Без неё ответ технически бесполезен, потому что его нельзя ни применить, ни защитить перед коллегами или аудитором.
Именно здесь универсальные языковые модели ломаются. Они обучены на огромных массивах общедоступного текста, но не на ваших документах, не на актуальных редакциях стандартов, не на внутренних регламентах предприятия. Они не знают, что конкретная редакция ISO была обновлена в прошлом году. Они не могут сослаться на пункт 4.3.2 вашего корпоративного техпроцесса, потому что никогда его не видели.
Как работает RAG — и почему это принципиально другая архитектура
RAG расшифровывается как Retrieval-Augmented Generation — генерация ответа с дополнением через поиск. За этим термином стоит простая, но важная идея: прежде чем отвечать, система сначала ищет.
Когда вы задаёте вопрос в RAG-системе, происходит следующее. Сначала система преобразует ваш вопрос в математическое векторное представление — числовой «слепок» смысла — и ищет в базе документов фрагменты, которые по смыслу близки к вашему запросу. Это не поиск по ключевым словам: система понимает контекст и находит релевантное даже тогда, когда формулировки в вопросе и в документе не совпадают буквально. Затем найденные фрагменты передаются в языковую модель вместе с вашим вопросом. Модель формирует ответ строго на основе этого контекста — и только на его основе. Ничего не додумывается, ничего не берётся «из общих знаний». Если ответа в документах нет — система скажет об этом, а не сгенерирует правдоподобную версию.
Результат: ответ, который можно проверить. Система показывает, из какого документа взят каждый фрагмент, и указывает конкретный раздел или пункт. Для инженерной работы это меняет всё — вы не просто получаете информацию, вы получаете аргумент с источником.
Важно понимать, что RAG работает только с теми документами, которые в него загружены. Это не ограничение — это принцип, который обеспечивает точность. Система отвечает за то, что знает, и честно молчит о том, чего в базе нет.
Чем RAG отличается от привычных инструментов — и почему это важно именно сейчас
Полезно сравнить RAG с тем, что инженеры уже используют, чтобы понять, где именно появляется новая ценность.
Поиск по PDF или корпоративному порталу работает по ключевым словам. Если вы знаете точный термин — находит. Если формулируете вопрос своими словами или ищете что-то смежное — нет. Результат: список документов, в которых нужно искать дальше самостоятельно.
Техэксперт и аналогичные системы — это хорошо структурированные базы российских нормативных документов. Они дают доступ к актуальным ГОСТам и позволяют следить за их обновлениями. Но они не отвечают на вопросы — они предоставляют документы для чтения.
ChatGPT и универсальные языковые модели отвечают на вопросы бегло и связно, но без привязки к конкретным источникам и без гарантий актуальности. Для технических задач, где точность критична, это неприемлемо.
RAG закрывает промежуток между этими подходами. Он понимает смысл вопроса как языковая модель, но отвечает только на основе реальных документов — как профессиональная база данных. Вопрос можно задать на русском языке, а система найдёт ответ в документах на английском и вернёт его в понятном виде со ссылкой на источник.
В SIZAMAI эта архитектура реализована применительно к инженерной документации: международным стандартам, научно-техническим публикациям и внутренним документам предприятия. Специалист задаёт вопрос так, как он звучит в голове во время работы — и получает ответ, который можно использовать, а не версию ответа, которую нужно проверять.
Есть ещё один аспект, который часто упускают из виду. RAG не требует переобучения модели под новые данные — достаточно загрузить документы в базу. Это означает, что система остаётся актуальной: появился новый стандарт, обновилась редакция, добавился внутренний регламент — всё это сразу становится доступным для поиска. Никаких задержек на «дообучение», никаких устаревших знаний, зашитых в параметры модели. Именно поэтому RAG — это не просто более умный поиск. Это архитектура, которая в принципе подходит для работы с живой, постоянно обновляющейся нормативной базой.
Разница между «ИИ, который генерирует» и «ИИ, который ищет и генерирует на основе найденного» — это разница между инструментом, которому нельзя доверять в технической работе, и инструментом, которому доверять можно.
Заходите в наш Телеграм-канал https://t.me/sizam_ai. Здесь мы регулярно пишем об актуальных методах управления технической документацией.