Как помочь вашему RAG адаптироваться? Принимайте DRAG with KNEE! Часть 1
Все мы проходили через это: скармливаешь RAG‑системе сложный PDF на 50 страниц, а она в ответ либо галлюцинирует, либо вываливает на LLM простыню нерелевантного текста, съедая ваш бюджет на токены быстрее, чем вы успеваете сказать «GPT-4o». Проблема в том, что класси...
Все мы проходили через это: скармливаешь RAG‑системе сложный PDF на 50 страниц, а она в ответ либо галлюцинирует, либо вываливает на LLM простыню нерелевантного текста, съедая ваш бюджет на токены быстрее, чем вы успеваете сказать «GPT-4o». Проблема в том, что классический подход со статическим top_k — это костыль, который либо не додает контекста, либо вызывает у модели информационное «ожирение» (заполняет контекст нерелевантным мусором). Нашему RAG нужно помочь адаптироваться к безжалостной среде разрозненных документов!Я потратил выходные на то, чтобы решить эту проблему фундаментально. В итоге на свет появился DRAG with KNEE (Dynamic RAG with Knee‑point pruning) — алгоритм, который не просто ищет «похожее», а выстраивает иерархию документов и безжалостно отсекает лишнее с помощью геометрического анализа «колена». В этой статье я покажу, как с помощью Qdrant, Python и капли математики сделать ваш RAG адаптивным.
Краткая сводка
Все мы проходили через это: скармливаешь RAG‑системе сложный PDF на 50 страниц, а она в ответ либо галлюцинирует, либо вываливает на LLM простыню нерелевантного текста, съедая ваш бюджет на токены быстрее, чем вы успеваете сказать «GPT-4o». Проблема в том, что класси...
Связанные теги
Компании и люди
Линия сюжета
GPT-4o
Последние материалы и связанные ссылки по теме GPT-4o.
GPT-4o
Последние материалы и связанный контекст по теме GPT-4o.
Habr
Последние материалы и связанные ссылки по теме Habr.
Habr
Последние материалы и связанный контекст по теме Habr.
LLM-агентов
Последние материалы и связанные ссылки по теме LLM-агентов.
Продолжить следить за темой
Переходите к связанным материалам, страницам сущностей и активным линиям сюжета.
Война костей: как два палеонтолога враждовали, уничтожали находки друг друга и попутно открыли 142 новых вида
Существует такое понятие Bone Wars — «Война костей». Под этим названием известна история двух профессоров палеонтологии — одного из Йеля, другого из Филадельфии, — которые на пр...
Мобильная разработка за неделю #625 (23 — 29 марта)
В новом дайджесте сетевой слой в iOS и сериализация Kotlin, 10 ошибок, которые Android-разработчиков и сожаление о выборе профессии, что происходит с подписочной моделью в прило...
ПМК и Кастанеда. Часть 8. Сказки о силе
Завершение серии статей о параллелях между недокументированными операциями советских ПМК и концепциями Карлоса Кастанеды. Начало тут...
Суперконденсаторы вместо Li‑ion: Dell меняет подход к беспроводной периферии
Беспроводные мыши и клавиатуры появились на наших столах много лет назад. И добавили новую головную боль — теперь нужно следить за зарядом своих девайсов. Иногда нужно менять ба...
«Рассвет» взлетел. Это 16 из 292. Почему я осторожно рад
23 марта с Плесецка ушла «Союз-2.1б» с 16 серийными спутниками «Рассвета». Я поймал себя на странном чувстве: уважение к инженерам — и одновременно лёгкое раздражение от пресс-р...
Как мы хакнули ИИ-бенчмарк PAC1 без нейросетей
Недавно я участвовал в корпоративном хакатоне по обходу ИИ-песочниц. Задача: пройти закрытый бенчмарк PAC1, где ИИ-агенту нужно работать с виртуальной файловой системой (чтение ...
Рекламный слот
Встроенный блок в статье
Зарезервированный партнерский слот для релевантных инструментов, сервисов и аккуратных редакционных интеграций.
Похожие статьи
Еще материалы, которые пересекаются по тегам, источнику или категории.
Война костей: как два палеонтолога враждовали, уничтожали находки друг друга и попутно открыли 142 новых вида
Существует такое понятие Bone Wars — «Война костей». Под этим названием известна история двух профессоров палеонтологии — одного из Йеля, другого из Филадельфии, — которые на пр...
Мобильная разработка за неделю #625 (23 — 29 марта)
В новом дайджесте сетевой слой в iOS и сериализация Kotlin, 10 ошибок, которые Android-разработчиков и сожаление о выборе профессии, что происходит с подписочной моделью в прило...
ПМК и Кастанеда. Часть 8. Сказки о силе
Завершение серии статей о параллелях между недокументированными операциями советских ПМК и концепциями Карлоса Кастанеды. Начало тут...
Суперконденсаторы вместо Li‑ion: Dell меняет подход к беспроводной периферии
Беспроводные мыши и клавиатуры появились на наших столах много лет назад. И добавили новую головную боль — теперь нужно следить за зарядом своих девайсов. Иногда нужно менять ба...
Еще материалы от Habr
Свежие публикации и продолжение темы от той же редакции.
Продвижение сайтов в Новосибирске. Дикое SEO начала 00-х
Ну что, расскажем, как всё начиналось? Даже не знаю, рассказать правду или как оно было на самом деле. В любом случае, получится предельно личный мемуар об эволюции новосибирско...
Я устал рулить десятками CLI AI-агентов и терминалов на разных машинах — навайбил Agent-Bridge
Привет. Меня зовут Вадим, в разработке очень давно — поучаствовал во всём чём можно: стартапы, продуктовые команды, инфра, питчи, продажи. Последнее время плотно живу в терминал...
Война костей: как два палеонтолога враждовали, уничтожали находки друг друга и попутно открыли 142 новых вида
Существует такое понятие Bone Wars — «Война костей». Под этим названием известна история двух профессоров палеонтологии — одного из Йеля, другого из Филадельфии, — которые на пр...
Мобильная разработка за неделю #625 (23 — 29 марта)
В новом дайджесте сетевой слой в iOS и сериализация Kotlin, 10 ошибок, которые Android-разработчиков и сожаление о выборе профессии, что происходит с подписочной моделью в прило...