Top.Mail.Ru
Блог

Почему научный обзор без проверки ссылок становится рискованным

Несуществующие источники как новая норма

В мае 2026 года Nature опубликовал результаты крупнейшего на сегодняшний день аудита научной литературы на предмет фальсификации ссылок. Исследователи из Колумбийского университета проанализировали 97 миллионов библиографических ссылок из 2,5 миллиона биомедицинских работ и обнаружили почти 3 000 статей с фиктивными цитатами — ссылками на публикации, которые не существуют ни в одной из четырёх верифицированных научных баз данных. Авторы исследования назвали эти данные «консервативной нижней оценкой» и добавили, что реальный масштаб проблемы, скорее всего, значительно больше.
Особенно показательна динамика: уровень фальсификации ссылок в 2025 году оказался более чем в 12 раз выше, чем в 2023-м. Рост почти точно совпадает по времени с массовым распространением генеративных ИИ-инструментов для написания текстов. Прямой причинно-следственной связи исследователи не устанавливают — технически фиктивная ссылка может появиться и без участия ИИ. Но характер и масштаб роста говорят сами за себя.
Для R&D-команд и исследователей, которые используют научные обзоры как основу для технических решений, это меняет базовые правила работы с источниками. Раньше ссылка в рецензируемой статье воспринималась как достаточное подтверждение существования источника. Сейчас это допущение больше не работает автоматически. Фиктивная ссылка выглядит как настоящая — у неё может быть правдоподобное название, правдоподобные авторы и правдоподобный журнал. Отличить её от реальной без проверки невозможно.
Важно понимать, что речь идёт не о маргинальных изданиях с сомнительной репутацией. Аудит охватывал работы из базы PubMed Central — рецензируемые биомедицинские публикации. Если фиктивные ссылки проходят рецензирование в академических журналах, нет оснований считать, что инженерные и технические обзоры, составленные с помощью ИИ-инструментов, застрахованы от той же проблемы.

СИЗАМ — как инструмент, который должен не просто генерировать обзор, а сохранять библиографию и исходные документы для проверки

Проблема фиктивных ссылок — это частный случай более широкой проблемы, с которой сталкивается любой специалист, использующий ИИ для работы с научно-технической информацией. Универсальная языковая модель, когда её просят написать обзор или ответить на технический вопрос, генерирует текст, который выглядит как результат работы с источниками. Но «выглядит как» и «является» — разные вещи. Модель не обращается к реальным документам в момент генерации. Она воспроизводит паттерны из своих обучающих данных, и если нужного источника там нет — достраивает правдоподобный. Именно так появляются ссылки на несуществующие статьи с несуществующими DOI и несуществующими авторами, которые, тем не менее, прошли рецензирование в реальных журналах.
Для инженерной работы это не абстрактная угроза научной репутации. Это практический риск: обзор, в котором часть ссылок фиктивна, не может служить обоснованием технического решения. Не потому что всё в нём неверно — вероятно, большинство утверждений корректны. А потому что без возможности проверить каждое утверждение по первоисточнику невозможно отделить достоверное от сгенерированного.
Именно здесь принципиальный вопрос к любому инструменту, который помогает работать с научно-технической информацией: он генерирует текст о документах или работает с реальными документами? Разница архитектурная, и она определяет всё.
В SIZAMAI ответ на вопрос инженера строится строго на основе реальных документов из базы — с прямой ссылкой на источник, раздел и пункт. Система не может сослаться на публикацию, которой нет в базе, потому что не обращается к общим знаниям языковой модели при формировании ответа. Найденный документ можно сохранить в библиотеку — карточка с метаданными, статус, история редакций, при необходимости полный текст для работы с ИИ-ассистентом. Это не просто удобство: это возможность в любой момент вернуться к первоисточнику и проверить, что именно там написано. Библиография становится не украшением обзора, а его верифицируемой основой.
Рост фиктивных ссылок в академической литературе — это симптом системной проблемы доверия к автоматически генерируемому контенту. R&D-команды, которые выстраивают работу с источниками на основе проверяемой библиографии, а не на доверии к тексту обзора, оказываются в принципиально другом положении. Не потому что они более осторожны. А потому что у них есть инструмент, который позволяет проверить, а не только прочитать.
Есть и практическое следствие для внутренней работы команды. Когда библиография обзора сохранена не как список названий, а как набор верифицированных карточек с доступом к исходным документам, этот обзор можно использовать повторно через месяц или через год — и быть уверенным, что каждое утверждение в нём по-прежнему можно проверить. Это то, что в предыдущих статьях мы называли институциональной памятью: знание, которое не исчезает вместе с человеком, который его накапливал.
Заходите в наш Телеграм-канал https://t.me/sizam_ai. Здесь мы регулярно пишем об актуальных методах управления технической документацией.