Habr 16.04.2026 07:51 Инструменты разработки Стабильно Тёпло

Как измерить LLM для задач кибербеза: обзор открытых бенчмарков

Погода сигнала

Стабильно

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Автор: netcitizen (Positive Technologies) Оригинальный источник

Как измерить LLM для задач кибербеза: обзор открытых бенчмарков

Привет, Хабр! Меня зовут Андрей Кузнецов, я ML-директор в Positive Technologies. Недавно я решил разобраться, какие бенчмарки измеряют способности языковых моделей в контексте задач кибербезопасности. Думал, что это займет вечер, — увы! Все оказалось куда хаотичнее, чем предполагалось. Поэтому делюсь тем, что собрал сам. Первое, что бросилось в глаза, — полный бардак и отсутствие системы. Бенчи, про которые все пишут в 2024-м, могут вообще не упоминаться в свежих статьях 2025-го. А некоторые широко цитируемые датасеты при ближайшем рассмотрении оказываются сделанными очень небрежно, из-за чего непонятно, что они вообще измеряют. Поэтому, прежде чем лезть в конкретные примеры, давайте определимся, какими они бывают.

Читать полностью в источнике

Оставайтесь в сигнале

Следить за темой «Как измерить LLM для задач кибербеза: обзор открытых бенчмарков»

Следите не только за этой публикацией, но и за её продолжением: новыми материалами, соседними источниками и развитием сюжета.

Карта темы

Понять тему за минуту

Быстрый вход в историю: почему она важна сейчас, кто в ней участвует и куда идти дальше за контекстом.

Почему это важно сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.

У истории уже есть 6 связанных материала, поэтому отсюда легко перейти к продолжению темы.

Сюжет постоянно вращается вокруг LLM-агентов and Positive Technologies, поэтому страницы сущностей дадут самый быстрый контекст.

Habr уже выпустил ещё 4 продолжения по этой теме.

Карта темы

Открыть живую карту этой истории

Посмотрите, какие сущности, линии сюжета, источники и follow-up материалы формируют эту историю прямо сейчас.

Нажимайте на узлы

Сущность Линия сюжета Материал Хаб Источник

Страницы сущностей

LLM-агентов Positive Technologies

Линии сюжета

Habr

Последние материалы и связанные ссылки по теме Habr.

LLM-агентов

Последние материалы и связанные ссылки по теме LLM-агентов.

LLM-агентов

Последние материалы и связанный контекст по теме LLM-агентов.

ML-систем

Последние материалы и связанные ссылки по теме ML-систем.

Story timeline

Продолжить следить за темой

Короткая линия событий и follow-up материалов, чтобы быстро понять ход темы.

19.06.2026 09:17 3DNews Hardware

Развитие небольших моделей ИИ для ПК угрожает OpenAI и Anthropic — часто они не хуже больших LLM

Американские исследователи выяснили, что компактные ИИ-модели (SLM), запускаемые на локальных компьютерах, способны эффективно выполнять ...

19.06.2026 09:07 CNews Security

Positive Technologies представила платформу для прогнозирования внешних угроз

Positive Technologies представила «Киберпогоду» — платформу для прогнозирования атак с интерпретацией бизнес-рисков....

18.06.2026 09:14 CNews Security

Positive Technologies разработала своего первого ИИ-помощника

Positive Technologies разработала PT Naira, ИИ-помощника на основе больших языковых моделей, который берет на себя рутинную...

17.06.2026 08:57 CNews Internet

Positive Technologies: 75% атак на веб-приложения российских организаций привели к простоям

Веб-сервисы остаются одной из главных мишеней киберпреступников. Согласно исследованию Positive Technologies, по итогам...

17.06.2026 08:57 CNews Security

Positive Technologies: 75% атак на веб-приложения российских организаций привели к простоям

16.04.2026 07:51 Habr

Как измерить LLM для задач кибербеза: обзор открытых бенчмарков

Привет, Хабр! Меня зовут Андрей Кузнецов, я ML-директор в Positive Technologies. Недавно я решил разобраться, какие бенчмарки измеряют сп...

Насколько можно опираться

Сигнал и надёжность Habr

Источник работает в быстрый ритме: 0% последних материалов попадают в горячее окно, а 0% дают выраженный поисковый сигнал.

Рискованный

Надёжность

Свежесть

Источников в сюжете

Huawei получила патент на технологию автоматического подбора AI-моделей для устройств

Huawei Technologies получила патент на изобретение под названием «Метод и устройство коммуникации искусственного интеллекта». Информация о регистрации патента появилась в базе д...

Погода сигнала

Импульс быстро усиливается, поэтому это хороший ранний вход в тему.

Почему сейчас

Это один из самых свежих сюжетов, у которого ещё только формируется продолжение.

AI Huawei Huawei Technologies Live AI

Читать статью Следить за историей

ixbt.com

Развитие небольших моделей ИИ для ПК угрожает OpenAI и Anthropic — часто они не хуже больших LLM

3DNews Hardware 19.06.2026 09:17 Большой тех

Рост Горячо

Развитие небольших моделей ИИ для ПК угрожает OpenAI и Anthropic — часто они не хуже больших LLM

Американские исследователи выяснили, что компактные ИИ-модели (SLM), запускаемые на локальных компьютерах, способны эффективно выполнять большинство задач, возлагаемых сейчас на...

Погода сигнала

Импульс быстро усиливается, поэтому это хороший ранний вход в тему.

Почему сейчас

Это один из самых свежих сюжетов, у которого ещё только формируется продолжение.

Anthropic Hardware LLM-агентов OpenAI

Читать статью Следить за историей

3dnews.ru

CNews Security 19.06.2026 09:07 Кибербезопасность

Рост Горячо

Positive Technologies представила платформу для прогнозирования внешних угроз

Погода сигнала

Импульс быстро усиливается, поэтому это хороший ранний вход в тему.

Почему сейчас

Это один из самых свежих сюжетов, у которого ещё только формируется продолжение.

CNews Security Positive Positive Technologies Technologies

Читать статью Следить за историей

safe.cnews.ru

CNews Business 19.06.2026 07:30 Корпоративный IT

Рост Горячо

Positive Education и Standoff 365 запускают программу практической подготовки команд ИБ

Центр обучения команд по кибербезопасности Positive Education и платформа Standoff 365 представили совместную программу практической...

Погода сигнала

Импульс быстро усиливается, поэтому это хороший ранний вход в тему.

Почему сейчас

Это один из самых свежих сюжетов, у которого ещё только формируется продолжение.

CNews Business Education Positive Positive Education

Читать статью Следить за историей

biz.cnews.ru

Еще материалы от Habr

Свежие публикации и продолжение темы от той же редакции.

Открыть страницу источника

Промпты Nano Banana для фото и изображений: Бесплатно для Нано Банана Про

Habr 16.04.2026 10:57 Инструменты разработки

Стабильно Тёпло

Промпты Nano Banana для фото и изображений: Бесплатно для Нано Банана Про

Создание безупречного визуала в Nano Banana — это не вопрос везения, а результат правильной коммуникации с нейросетью. В отличие от простых моделей прошлого, этот инструмент спо...

Погода сигнала

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Почему сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.

Banana Habr Nano Nano Banana

Читать статью Следить за историей

habr.com

Пошаговая инструкция установки MTProto прокси через Service Node + VLESS

Habr 16.04.2026 10:43 Инструменты разработки

Стабильно Тёпло

Пошаговая инструкция установки MTProto прокси через Service Node + VLESS

Если вы когда-нибудь пытались поднять прокси для Telegram на сервере, то знаете, что такое «мессенджер не грузит». В этой инструкции я предлагаю рассмотреть подробную, пошаговую...

Погода сигнала

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Почему сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.

Habr MTProto Node MTProto Panel MTProto-прокси

Читать статью Следить за историей

habr.com

Накрутка поведенческих факторов для роста позиций — реально ли за день занять топ 1 Яндекса

Habr 16.04.2026 10:36 Инструменты разработки

Стабильно Тёпло

Накрутка поведенческих факторов для роста позиций — реально ли за день занять топ 1 Яндекса

Знаете, можно много долго спорить о том, что вот там умеют делать, а наши ничего не умеют. Но подход Яндекса к формированию поисковой выдачи мне всегда импонировал больше, нежел...

Погода сигнала

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Почему сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.

Habr

Читать статью Следить за историей

habr.com

Тени истории. Ренессанс – революция, подарившая миру главный инструмент шпионов

Habr 16.04.2026 10:35 Инструменты разработки

Стабильно Тёпло

Тени истории. Ренессанс – революция, подарившая миру главный инструмент шпионов

Вторая статья цикла о криптографии, в котором мы рассказываем, как человечество училось прятать и расшифровывать секреты — от древних методов до современных алгоритмов. Сегодня ...

Погода сигнала

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Почему сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.

Habr

Читать статью Следить за историей

habr.com

Как измерить LLM для задач кибербеза: обзор открытых бенчмарков

Следить за темой «Как измерить LLM для задач кибербеза: обзор открытых бенчмарков»

Понять тему за минуту

Почему это важно сейчас

Открыть живую карту этой истории

Страницы сущностей

Линии сюжета

Продолжить следить за темой

Сигнал и надёжность Habr

Похожие статьи

Еще материалы от Habr