News Grower

Независимое покрытие AI, стартапов и технологий.

Как помочь вашему RAG адаптироваться? Принимайте DRAG with KNEE! Часть 1

Все мы проходили через это: скармливаешь RAG‑системе сложный PDF на 50 страниц, а она в ответ либо галлюцинирует, либо вываливает на LLM простыню нерелевантного текста, съедая ваш бюджет на токены быстрее, чем вы успеваете сказать «GPT-4o». Проблема в том, что класси...

Как помочь вашему RAG адаптироваться? Принимайте DRAG with KNEE! Часть 1

Все мы проходили через это: скармливаешь RAG‑системе сложный PDF на 50 страниц, а она в ответ либо галлюцинирует, либо вываливает на LLM простыню нерелевантного текста, съедая ваш бюджет на токены быстрее, чем вы успеваете сказать «GPT-4o». Проблема в том, что классический подход со статическим top_k — это костыль, который либо не додает контекста, либо вызывает у модели информационное «ожирение» (заполняет контекст нерелевантным мусором). Нашему RAG нужно помочь адаптироваться к безжалостной среде разрозненных документов!Я потратил выходные на то, чтобы решить эту проблему фундаментально. В итоге на свет появился DRAG with KNEE (Dynamic RAG with Knee‑point pruning) — алгоритм, который не просто ищет «похожее», а выстраивает иерархию документов и безжалостно отсекает лишнее с помощью геометрического анализа «колена». В этой статье я покажу, как с помощью Qdrant, Python и капли математики сделать ваш RAG адаптивным.

Краткая сводка

Все мы проходили через это: скармливаешь RAG‑системе сложный PDF на 50 страниц, а она в ответ либо галлюцинирует, либо вываливает на LLM простыню нерелевантного текста, съедая ваш бюджет на токены быстрее, чем вы успеваете сказать «GPT-4o». Проблема в том, что класси...

Связанные теги

Компании и люди

Линия сюжета

Продолжить следить за темой

Переходите к связанным материалам, страницам сущностей и активным линиям сюжета.

Война костей: как два палеонтолога враждовали, уничтожали находки друг друга и попутно открыли 142 новых вида

Война костей: как два палеонтолога враждовали, уничтожали находки друг друга и попутно открыли 142 новых вида

Существует такое понятие Bone Wars — «Война костей». Под этим названием известна история двух профессоров палеонтологии — одного из Йеля, другого из Филадельфии, — которые на пр...

Мобильная разработка за неделю #625 (23 — 29 марта)

Мобильная разработка за неделю #625 (23 — 29 марта)

В новом дайджесте сетевой слой в iOS и сериализация Kotlin, 10 ошибок, которые Android-разработчиков и сожаление о выборе профессии, что происходит с подписочной моделью в прило...

Суперконденсаторы вместо Li‑ion: Dell меняет подход к беспроводной периферии

Суперконденсаторы вместо Li‑ion: Dell меняет подход к беспроводной периферии

Беспроводные мыши и клавиатуры появились на наших столах много лет назад. И добавили новую головную боль — теперь нужно следить за зарядом своих девайсов. Иногда нужно менять ба...

«Рассвет» взлетел. Это 16 из 292. Почему я осторожно рад

«Рассвет» взлетел. Это 16 из 292. Почему я осторожно рад

23 марта с Плесецка ушла «Союз-2.1б» с 16 серийными спутниками «Рассвета». Я поймал себя на странном чувстве: уважение к инженерам — и одновременно лёгкое раздражение от пресс-р...

Как мы хакнули ИИ-бенчмарк PAC1 без нейросетей

Недавно я участвовал в корпоративном хакатоне по обходу ИИ-песочниц. Задача: пройти закрытый бенчмарк PAC1, где ИИ-агенту нужно работать с виртуальной файловой системой (чтение ...

Рекламный слот

Встроенный блок в статье

Зарезервированный партнерский слот для релевантных инструментов, сервисов и аккуратных редакционных интеграций.

Партнерский слот

Похожие статьи

Еще материалы, которые пересекаются по тегам, источнику или категории.

Война костей: как два палеонтолога враждовали, уничтожали находки друг друга и попутно открыли 142 новых вида

Война костей: как два палеонтолога враждовали, уничтожали находки друг друга и попутно открыли 142 новых вида

Существует такое понятие Bone Wars — «Война костей». Под этим названием известна история двух профессоров палеонтологии — одного из Йеля, другого из Филадельфии, — которые на пр...

Мобильная разработка за неделю #625 (23 — 29 марта)

Мобильная разработка за неделю #625 (23 — 29 марта)

В новом дайджесте сетевой слой в iOS и сериализация Kotlin, 10 ошибок, которые Android-разработчиков и сожаление о выборе профессии, что происходит с подписочной моделью в прило...

Суперконденсаторы вместо Li‑ion: Dell меняет подход к беспроводной периферии

Суперконденсаторы вместо Li‑ion: Dell меняет подход к беспроводной периферии

Беспроводные мыши и клавиатуры появились на наших столах много лет назад. И добавили новую головную боль — теперь нужно следить за зарядом своих девайсов. Иногда нужно менять ба...

Еще материалы от Habr

Свежие публикации и продолжение темы от той же редакции.

Открыть страницу источника
Продвижение сайтов в Новосибирске. Дикое SEO начала 00-х

Продвижение сайтов в Новосибирске. Дикое SEO начала 00-х

Ну что, расскажем, как всё начиналось? Даже не знаю, рассказать правду или как оно было на самом деле. В любом случае, получится предельно личный мемуар об эволюции новосибирско...

Я устал рулить десятками CLI AI-агентов и терминалов на разных машинах — навайбил Agent-Bridge

Я устал рулить десятками CLI AI-агентов и терминалов на разных машинах — навайбил Agent-Bridge

Привет. Меня зовут Вадим, в разработке очень давно — поучаствовал во всём чём можно: стартапы, продуктовые команды, инфра, питчи, продажи. Последнее время плотно живу в терминал...

Война костей: как два палеонтолога враждовали, уничтожали находки друг друга и попутно открыли 142 новых вида

Война костей: как два палеонтолога враждовали, уничтожали находки друг друга и попутно открыли 142 новых вида

Существует такое понятие Bone Wars — «Война костей». Под этим названием известна история двух профессоров палеонтологии — одного из Йеля, другого из Филадельфии, — которые на пр...

Мобильная разработка за неделю #625 (23 — 29 марта)

Мобильная разработка за неделю #625 (23 — 29 марта)

В новом дайджесте сетевой слой в iOS и сериализация Kotlin, 10 ошибок, которые Android-разработчиков и сожаление о выборе профессии, что происходит с подписочной моделью в прило...