[Перевод] EVGeoQA: Оценка LLM в динамическом, многоцелевом геопространственном поиске
Хотя большие языковые модели (LLM) демонстрируют выдающиеся способности к рассуждению, их потенциал для целенаправленного поиска в динамичных геопространственных средах остается малоизученным. Существующие бенчмарки для геопространственных вопросно-ответных систем (GSQA) в основном сосредоточены на статическом поиск...
Хотя большие языковые модели (LLM) демонстрируют выдающиеся способности к рассуждению, их потенциал для целенаправленного поиска в динамичных геопространственных средах остается малоизученным. Существующие бенчмарки для геопространственных вопросно-ответных систем (GSQA) в основном сосредоточены на статическом поиске информации, упуская из виду сложность реального планирования, которое включает динамическое местоположение пользователя и составные ограничения. Чтобы восполнить этот пробел, мы представляем EVGeoQA — новый бенчмарк, построенный на сценариях зарядки электромобилей (EV), который отличается уникальной привязкой к местоположению и наличием двух целевых условий. В частности, каждый запрос в EVGeoQA явно привязан к координатам пользователя в реальном времени и объединяет две цели: саму потребность в зарядке и предпочтения по совмещенной активности (рядом со станцией). Для систематической оценки моделей в таких сложных условиях мы также предлагаем GeoRover — общую систему
Связанные теги
Компании и люди
Линия сюжета
Продолжить следить за темой
Переходите к связанным материалам, страницам сущностей и активным линиям сюжета.
Я разучился получать удовольствие от программирования из-за LLM. Его вернул шкаф
LLM сделали меня сильно эффективнее, расширили диапазон моих услуг, но вместе с этим почти убили ту часть разработки, ради которой я вообще когда-то в нее пришел.А потом мне при...
Приложение полностью написанное AI
У меня возникла идея провести эксперимент, чтобы лучше понять текущие возможности агентов для написания кода. Ну и кроме этого протестировать рынок и понять что нас ожидает в бл...
Ваш собес уже в базе
Привет, Habr.Обычно найм представляют довольно просто: есть вакансия, есть кандидат, есть несколько этапов собеседования, после которых человек либо получает оффер, либо отказ. ...
Паттерны конкурентности в Go. Подробный разбор. Часть 3. Pub/Sub
Пример паттерна Pub/Sub на Go с подробным описанием кода. Пример подходит для знакомства с паттерном в процессе обучения, собеседования. В статье есть ссылка на полноценную библ...
Полтора года без ручного кода: почему инструкции ИИ-агенту не заменяют инженерную дисциплину
ИИ-агенты вроде Claude Code и Cursor умеют писать код. Но одного файла с инструкциями им хватает ровно до первых сложных задач. Дальше агент молча трогает семь модулей вместо од...
Мы выпустили игру в Ранний доступ, и всё пошло не так
Ritualist - это isometric roguelike в стилистике low poly. В ранний доступ мы вышли 5 марта, а до этого участвовали в Steam Next Fest с демкой (об этом хочется выложить отдельну...
Страницы сущностей
Рекламный слот
Встроенный блок в статье
Зарезервированный партнерский слот для релевантных инструментов, сервисов и аккуратных редакционных интеграций.
Похожие статьи
Еще материалы, которые пересекаются по тегам, источнику или категории.
Я разучился получать удовольствие от программирования из-за LLM. Его вернул шкаф
LLM сделали меня сильно эффективнее, расширили диапазон моих услуг, но вместе с этим почти убили ту часть разработки, ради которой я вообще когда-то в нее пришел.А потом мне при...
Приложение полностью написанное AI
У меня возникла идея провести эксперимент, чтобы лучше понять текущие возможности агентов для написания кода. Ну и кроме этого протестировать рынок и понять что нас ожидает в бл...
Ваш собес уже в базе
Привет, Habr.Обычно найм представляют довольно просто: есть вакансия, есть кандидат, есть несколько этапов собеседования, после которых человек либо получает оффер, либо отказ. ...
Паттерны конкурентности в Go. Подробный разбор. Часть 3. Pub/Sub
Пример паттерна Pub/Sub на Go с подробным описанием кода. Пример подходит для знакомства с паттерном в процессе обучения, собеседования. В статье есть ссылка на полноценную библ...
Еще материалы от Habr
Свежие публикации и продолжение темы от той же редакции.
Kotlin для новичков: всё о функциях за 15 минут
Продолжаем серию «Kotlin для новичков»! В прошлых статьях мы настроили IDE, разобрались с переменными и типами данных, научились управлять потоком программы через условия и цикл...
Я разучился получать удовольствие от программирования из-за LLM. Его вернул шкаф
LLM сделали меня сильно эффективнее, расширили диапазон моих услуг, но вместе с этим почти убили ту часть разработки, ради которой я вообще когда-то в нее пришел.А потом мне при...
Приложение полностью написанное AI
У меня возникла идея провести эксперимент, чтобы лучше понять текущие возможности агентов для написания кода. Ну и кроме этого протестировать рынок и понять что нас ожидает в бл...
Ваш собес уже в базе
Привет, Habr.Обычно найм представляют довольно просто: есть вакансия, есть кандидат, есть несколько этапов собеседования, после которых человек либо получает оффер, либо отказ. ...