News Grower

Независимое покрытие AI, стартапов и технологий.

[Перевод] EVGeoQA: Оценка LLM в динамическом, многоцелевом геопространственном поиске

Хотя большие языковые модели (LLM) демонстрируют выдающиеся способности к рассуждению, их потенциал для целенаправленного поиска в динамичных геопространственных средах остается малоизученным. Существующие бенчмарки для геопространственных вопросно-ответных систем (GSQA) в основном сосредоточены на статическом поиск...

[Перевод] EVGeoQA: Оценка LLM в динамическом, многоцелевом геопространственном поиске

Хотя большие языковые модели (LLM) демонстрируют выдающиеся способности к рассуждению, их потенциал для целенаправленного поиска в динамичных геопространственных средах остается малоизученным. Существующие бенчмарки для геопространственных вопросно-ответных систем (GSQA) в основном сосредоточены на статическом поиске информации, упуская из виду сложность реального планирования, которое включает динамическое местоположение пользователя и составные ограничения. Чтобы восполнить этот пробел, мы представляем EVGeoQA — новый бенчмарк, построенный на сценариях зарядки электромобилей (EV), который отличается уникальной привязкой к местоположению и наличием двух целевых условий. В частности, каждый запрос в EVGeoQA явно привязан к координатам пользователя в реальном времени и объединяет две цели: саму потребность в зарядке и предпочтения по совмещенной активности (рядом со станцией). Для систематической оценки моделей в таких сложных условиях мы также предлагаем GeoRover — общую систему

Связанные теги

Компании и люди

Линия сюжета

Продолжить следить за темой

Переходите к связанным материалам, страницам сущностей и активным линиям сюжета.

Я разучился получать удовольствие от программирования из-за LLM. Его вернул шкаф

LLM сделали меня сильно эффективнее, расширили диапазон моих услуг, но вместе с этим почти убили ту часть разработки, ради которой я вообще когда-то в нее пришел.А потом мне при...

Приложение полностью написанное AI

Приложение полностью написанное AI

У меня возникла идея провести эксперимент, чтобы лучше понять текущие возможности агентов для написания кода. Ну и кроме этого протестировать рынок и понять что нас ожидает в бл...

Паттерны конкурентности в Go. Подробный разбор. Часть 3. Pub/Sub

Паттерны конкурентности в Go. Подробный разбор. Часть 3. Pub/Sub

Пример паттерна Pub/Sub на Go с подробным описанием кода. Пример подходит для знакомства с паттерном в процессе обучения, собеседования. В статье есть ссылка на полноценную библ...

Полтора года без ручного кода: почему инструкции ИИ-агенту не заменяют инженерную дисциплину

Полтора года без ручного кода: почему инструкции ИИ-агенту не заменяют инженерную дисциплину

ИИ-агенты вроде Claude Code и Cursor умеют писать код. Но одного файла с инструкциями им хватает ровно до первых сложных задач. Дальше агент молча трогает семь модулей вместо од...

Мы выпустили игру в Ранний доступ, и всё пошло не так

Мы выпустили игру в Ранний доступ, и всё пошло не так

Ritualist - это isometric roguelike в стилистике low poly. В ранний доступ мы вышли 5 марта, а до этого участвовали в Steam Next Fest с демкой (об этом хочется выложить отдельну...

Рекламный слот

Встроенный блок в статье

Зарезервированный партнерский слот для релевантных инструментов, сервисов и аккуратных редакционных интеграций.

Партнерский слот

Похожие статьи

Еще материалы, которые пересекаются по тегам, источнику или категории.

Я разучился получать удовольствие от программирования из-за LLM. Его вернул шкаф

LLM сделали меня сильно эффективнее, расширили диапазон моих услуг, но вместе с этим почти убили ту часть разработки, ради которой я вообще когда-то в нее пришел.А потом мне при...

Приложение полностью написанное AI

Приложение полностью написанное AI

У меня возникла идея провести эксперимент, чтобы лучше понять текущие возможности агентов для написания кода. Ну и кроме этого протестировать рынок и понять что нас ожидает в бл...

Паттерны конкурентности в Go. Подробный разбор. Часть 3. Pub/Sub

Паттерны конкурентности в Go. Подробный разбор. Часть 3. Pub/Sub

Пример паттерна Pub/Sub на Go с подробным описанием кода. Пример подходит для знакомства с паттерном в процессе обучения, собеседования. В статье есть ссылка на полноценную библ...

Еще материалы от Habr

Свежие публикации и продолжение темы от той же редакции.

Открыть страницу источника
Kotlin для новичков: всё о функциях за 15 минут

Kotlin для новичков: всё о функциях за 15 минут

Продолжаем серию «Kotlin для новичков»! В прошлых статьях мы настроили IDE, разобрались с переменными и типами данных, научились управлять потоком программы через условия и цикл...

Я разучился получать удовольствие от программирования из-за LLM. Его вернул шкаф

LLM сделали меня сильно эффективнее, расширили диапазон моих услуг, но вместе с этим почти убили ту часть разработки, ради которой я вообще когда-то в нее пришел.А потом мне при...

Приложение полностью написанное AI

Приложение полностью написанное AI

У меня возникла идея провести эксперимент, чтобы лучше понять текущие возможности агентов для написания кода. Ну и кроме этого протестировать рынок и понять что нас ожидает в бл...