Почему нам пришлось превратить нормативные документы в граф, а не просто загрузить их в векторную базу
Когда говорят про RAG, обычно имеют в виду довольно прямую схему: взять документы, нарезать их на фрагменты, посчитать эмбеддинги, сложить всё в векторную базу и поверх этого подключить LLM. На демо это часто работает. Иногда работает и на корпоративных данных. Но на нормативных документах такой подход очень быстро ...
Когда говорят про RAG, обычно имеют в виду довольно прямую схему: взять документы, нарезать их на фрагменты, посчитать эмбеддинги, сложить всё в векторную базу и поверх этого подключить LLM. На демо это часто работает. Иногда работает и на корпоративных данных. Но на нормативных документах такой подход очень быстро начинает сыпаться.Мы увидели это на практике, когда строили систему для работы с нормативкой. Сначала задача выглядела стандартно: есть документы, есть вопросы пользователей, есть поиск по смыслу. Значит, нужен обычный RAG. Но довольно быстро стало ясно, что главная проблема здесь не генерация. Главная проблема в том, как представить документ так, чтобы retrieval не разрушал его структуру и смысл.В итоге мы ушли от плоской индексации к иерархическим узлам, группам соседних пунктов, отдельному слою терминов и графу обязательных связей между фрагментами. Читать далее
Related tags
Entities
Related clusters
Ad slot
Article monetization slot
Reserved for contextual monetization inside article pages.
Related articles
More stories that share tags, source, or category context.
DPI IS ALL YOU NEED: абсолютно все о блокировках
привет, хабр это zarazaex.абсолютно ВСЕ о блокировках, DPI, тспу, белых списках и так далееистория РКН и протоколов Читать далее
И снова ИИ, как я из предпринимателя стал «мечтателем»
Я не разработчик и не из IT. У меня автосервис и несколько офлайн-бизнесов. В 2022 году я спросил у AI, чем он может мне помочь. Через несколько часов у меня появилась первая CR...
Почему вайбкодинг не убьёт нормальную разработку (взгляд маркетолога)
«AI отнимет мою работу» – эту фразу я слышу на каждой второй встрече с командами разработки. Тревога понятна: нейросеть за минуту генерирует код, на который раньше уходил день. ...
Установка Claude AI (Клод ИИ) Code на зарубежный VPS для обхода санкций и как купить подписку в России
В статье пошагово показано, как завести аккаунт Claude Code в обход санкций, с европейского IP-адреса, на европейский телефон, с оплатой виртуальной карточкой.Конкретно вы нашем...