News Grower

Независимое покрытие AI, стартапов и технологий.

Habr 25.03.2026 04:46 Инструменты разработки Стабильно Тёпло

Мы протестировали 22 нейросети на задачах для российских учителей. Ни одна не знает чувашский

Я живу в Чебоксарах и запускаю ИИ-пилот в местной школе. Когда понадобилось проверить, какие LLM действительно способны помочь российским учителям в их работе — оказалось, что бенчмарка для этого не существует. MERA тестирует, может ли модель решить задания ЕГЭ. EduBench — только английский и китайский. Российское о...

Погода сигнала

Стабильно

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Автор: daniel_ivanov Оригинальный источник

Я живу в Чебоксарах и запускаю ИИ-пилот в местной школе. Когда понадобилось проверить, какие LLM действительно способны помочь российским учителям в их работе — оказалось, что бенчмарка для этого не существует. MERA тестирует, может ли модель решить задания ЕГЭ. EduBench — только английский и китайский. Российское образование — это ФГОС, технологические карты уроков, ОГЭ, чувашский язык — и ничего из этого ни один бенчмарк не покрывает. Мы сделали EduBench-RU — первый бенчмарк для оценки LLM на задачах российского образования в школах. 50 промптов, 22 модели, двойная оценка. И нашли кое-что неожиданное.

Оставайтесь в сигнале

Следить за темой «Мы протестировали 22 нейросети на задачах для российских учителей. Ни одна не знает чувашский»

Следите не только за этой публикацией, но и за её продолжением: новыми материалами, соседними источниками и развитием сюжета.

Сначала отправим письмо для подтверждения, а дальше — только содержательные дайджесты.

Карта темы

Понять тему за минуту

Быстрый вход в историю: почему она важна сейчас, кто в ней участвует и куда идти дальше за контекстом.

Почему это важно сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.
У истории уже есть 6 связанных материала, поэтому отсюда легко перейти к продолжению темы.
Сюжет постоянно вращается вокруг EduBench, EduBench-RU, and MERA, поэтому страницы сущностей дадут самый быстрый контекст.
Habr уже выпустил ещё 4 продолжения по этой теме.

Карта темы

Открыть живую карту этой истории

Посмотрите, какие сущности, линии сюжета, источники и follow-up материалы формируют эту историю прямо сейчас.

Нажимайте на узлы

Сущность Линия сюжета Материал Хаб Источник

Story timeline

Продолжить следить за темой

Короткая линия событий и follow-up материалов, чтобы быстро понять ход темы.

25.06.2026 16:08 3DNews Software

ИИ-модель Wildberries вошла в топ-3 русскоязычного бенчмарка MERA

Большая языковая модель BerryLM-XL, которая была дообучена специалистами RWB, вошла в тройку лидеров текстового рейтинга русскоязычного б...

25.06.2026 06:41 3DNews Breaking

OpenAI обновила самую популярную LLM для ChatGPT, сделав её более удобной и приятной в общении

Компания OpenAI выпустила обновление для своей модели GPT-5.5 Instant, используемой в чат-боте ChatGPT. Разработчики заявляют, что новая ...

24.06.2026 15:24 ServerNews News

OpenAI и Broadcom представили кастомный ускоритель Jalapeño для ИИ-инференса

OpenAI и Broadcom представили кастомный чип Jalapeño, разработанный в тесном сотрудничестве «в соответствии с видением OpenAI будущего ин...

23.06.2026 09:21 3DNews Software

В России перестали работать трансляции на Twitch, а также Discord и PUBG: Battlegrounds

От россиян 23 июня 2026 года стали поступать массовые жалобы на невозможность подключаться к эфирам на платформе Twitch. Без специальных ...

19.06.2026 09:17 3DNews Hardware

Развитие небольших моделей ИИ для ПК угрожает OpenAI и Anthropic — часто они не хуже больших LLM

Американские исследователи выяснили, что компактные ИИ-модели (SLM), запускаемые на локальных компьютерах, способны эффективно выполнять ...

25.03.2026 04:46 Habr

Мы протестировали 22 нейросети на задачах для российских учителей. Ни одна не знает чувашский

Я живу в Чебоксарах и запускаю ИИ-пилот в местной школе. Когда понадобилось проверить, какие LLM действительно способны помочь российским...

Насколько можно опираться

Сигнал и надёжность Habr

Источник работает в быстрый ритме: 0% последних материалов попадают в горячее окно, а 0% дают выраженный поисковый сигнал.

Рискованный

Надёжность

10

Свежесть

22

Источников в сюжете

6

Похожие статьи

Еще материалы, которые пересекаются по тегам, источнику или категории.

ИИ-модель Wildberries вошла в топ-3 русскоязычного бенчмарка MERA
Рост Горячо

ИИ-модель Wildberries вошла в топ-3 русскоязычного бенчмарка MERA

Большая языковая модель BerryLM-XL, которая была дообучена специалистами RWB, вошла в тройку лидеров текстового рейтинга русскоязычного бенчмарка MERA. По итогам тестирования ал...

Погода сигнала

Импульс быстро усиливается, поэтому это хороший ранний вход в тему.

Почему сейчас

Это один из самых свежих сюжетов, у которого ещё только формируется продолжение.

OpenAI обновила самую популярную LLM для ChatGPT, сделав её более удобной и приятной в общении
Рост Горячо

OpenAI обновила самую популярную LLM для ChatGPT, сделав её более удобной и приятной в общении

Компания OpenAI выпустила обновление для своей модели GPT-5.5 Instant, используемой в чат-боте ChatGPT. Разработчики заявляют, что новая версия стала лучше понимать сложные запр...

Погода сигнала

Импульс быстро усиливается, поэтому это хороший ранний вход в тему.

Почему сейчас

Это один из самых свежих сюжетов, у которого ещё только формируется продолжение.

Рост Горячо

OpenAI и Broadcom представили кастомный ускоритель Jalapeño для ИИ-инференса

OpenAI и Broadcom представили кастомный чип Jalapeño, разработанный в тесном сотрудничестве «в соответствии с видением OpenAI будущего инференса LLM». Согласно первым тестам, ус...

Погода сигнала

Импульс быстро усиливается, поэтому это хороший ранний вход в тему.

Почему сейчас

Это один из самых свежих сюжетов, у которого ещё только формируется продолжение.

В России перестали работать трансляции на Twitch, а также Discord и PUBG: Battlegrounds
Рост Горячо

В России перестали работать трансляции на Twitch, а также Discord и PUBG: Battlegrounds

От россиян 23 июня 2026 года стали поступать массовые жалобы на невозможность подключаться к эфирам на платформе Twitch. Без специальных средств перестали открываться также Disc...

Погода сигнала

Импульс быстро усиливается, поэтому это хороший ранний вход в тему.

Почему сейчас

Это один из самых свежих сюжетов, у которого ещё только формируется продолжение.

Еще материалы от Habr

Свежие публикации и продолжение темы от той же редакции.

Открыть страницу источника
Промпты Nano Banana для фото и изображений: Бесплатно для Нано Банана Про
Стабильно Тёпло

Промпты Nano Banana для фото и изображений: Бесплатно для Нано Банана Про

Создание безупречного визуала в Nano Banana — это не вопрос везения, а результат правильной коммуникации с нейросетью. В отличие от простых моделей прошлого, этот инструмент спо...

Погода сигнала

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Почему сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.

Пошаговая инструкция установки MTProto прокси через Service Node + VLESS
Стабильно Тёпло

Пошаговая инструкция установки MTProto прокси через Service Node + VLESS

Если вы когда-нибудь пытались поднять прокси для Telegram на сервере, то знаете, что такое «мессенджер не грузит». В этой инструкции я предлагаю рассмотреть подробную, пошаговую...

Погода сигнала

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Почему сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.

Накрутка поведенческих факторов для роста позиций — реально ли за день занять топ 1 Яндекса
Стабильно Тёпло

Накрутка поведенческих факторов для роста позиций — реально ли за день занять топ 1 Яндекса

Знаете, можно много долго спорить о том, что вот там умеют делать, а наши ничего не умеют. Но подход Яндекса к формированию поисковой выдачи мне всегда импонировал больше, нежел...

Погода сигнала

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Почему сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.

Тени истории. Ренессанс – революция, подарившая миру главный инструмент шпионов
Стабильно Тёпло

Тени истории. Ренессанс – революция, подарившая миру главный инструмент шпионов

Вторая статья цикла о криптографии, в котором мы рассказываем, как человечество училось прятать и расшифровывать секреты — от древних методов до современных алгоритмов. Сегодня ...

Погода сигнала

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Почему сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.