News Grower

Независимое покрытие AI, стартапов и технологий.

Habr 06.04.2026 12:03 Инструменты разработки Стабильно Тёпло

Evals: мегастатья для фаундера, чей AI-агент работает как попало

Через несколько дней будет 16 лет, как я на Хабре. Это моя первая статья. Я делаю десктопный AI-ассистент для встреч. Агент суммаризирует транскрипты — и делал это плохо: галлюцинирует решения, теряет задачи, путает кто что сказал. Полгода я чинил промпты по ощущениям — менял слово, смотрел глазами на пару примеров, ...

Погода сигнала

Стабильно

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Evals: мегастатья для фаундера, чей AI-агент работает как попало

Через несколько дней будет 16 лет, как я на Хабре. Это моя первая статья. Я делаю десктопный AI-ассистент для встреч. Агент суммаризирует транскрипты — и делал это плохо: галлюцинирует решения, теряет задачи, путает кто что сказал. Полгода я чинил промпты по ощущениям — менял слово, смотрел глазами на пару примеров, говорил «вроде лучше», деплоил. Это называется vibes-based development, и это тупик. Потом я разобрался с evals — по сути, тестами для недетерминированных систем. Перелопатил Hamel Husain, Eugene Yan, гайды Anthropic, доку Mastra. Написал всё в одном месте: мегастатья от ручного разбора ошибок до self-improving loops, где агент улучшает себя сам за ночь. С кодом, граблями и метафорами про пиццу.

Оставайтесь в сигнале

Следить за темой «Evals: мегастатья для фаундера, чей AI-агент работает как попало»

Следите не только за этой публикацией, но и за её продолжением: новыми материалами, соседними источниками и развитием сюжета.

Сначала отправим письмо для подтверждения, а дальше — только содержательные дайджесты.

Карта темы

Понять тему за минуту

Быстрый вход в историю: почему она важна сейчас, кто в ней участвует и куда идти дальше за контекстом.

Почему это важно сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.
У истории уже есть 6 связанных материала, поэтому отсюда легко перейти к продолжению темы.
Сюжет постоянно вращается вокруг AI, Evals, and Habr, поэтому страницы сущностей дадут самый быстрый контекст.
Habr уже выпустил ещё 4 продолжения по этой теме.

Карта темы

Открыть живую карту этой истории

Посмотрите, какие сущности, линии сюжета, источники и follow-up материалы формируют эту историю прямо сейчас.

Нажимайте на узлы

Сущность Линия сюжета Материал Хаб Источник

Story timeline

Продолжить следить за темой

Короткая линия событий и follow-up материалов, чтобы быстро понять ход темы.

08.06.2026 20:17 3DNews Software

Apple представила visionOS 27 с поддержкой Siri AI и изогнутых окон

Компания Apple представила visionOS 27 — новую версию операционной системы для гарнитуры дополненной реальности Vision Pro. Как и другие ...

08.06.2026 19:46 3DNews Software

Европейцы не получат Siri AI вместе с iOS 27 — Apple винит в этом закон DMA

Apple не может выпустить новый голосовой помощник Siri AI в странах ЕС одновременно с выходом iOS 27 и iPadOS 27. Об этом компания сообщи...

08.06.2026 18:05 3DNews Software

Apple представила новую Siri, снова — Siri AI поселилась на островке iPhone, работает с Google Gemini и умеет анализировать экран

На конференции WWDC 2026 компания Apple представила обновлённую версию голосового помощника Siri — Siri AI, работающую на базе платформы ...

08.06.2026 13:58 iXBT Live AI

Учёные успешно испытали на людях универсальную вакцину от коронавирусов, созданную с помощью ИИ

Впервые в мире AI-разработанная универсальная вакцина против коронавирусов прошла первую фазу клинических испытаний на людях. Она оказала...

05.06.2026 12:21 iXBT Live AI

Apple готовит macOS 27 с новой Siri, AI‑функциями и только для Apple Silicon

Apple готовит macOS 27 только для Apple Silicon с новой Siri, интерфейсом Liquid Glass и расширенными AI‑функциями для фото, текста и Saf...

06.04.2026 12:03 Habr

Evals: мегастатья для фаундера, чей AI-агент работает как попало

Через несколько дней будет 16 лет, как я на Хабре. Это моя первая статья. Я делаю десктопный AI-ассистент для встреч. Агент суммаризирует...

Насколько можно опираться

Сигнал и надёжность Habr

Источник работает в быстрый ритме: 0% последних материалов попадают в горячее окно, а 8% дают выраженный поисковый сигнал.

Рискованный

Надёжность

10

Свежесть

22

Источников в сюжете

4

Похожие статьи

Еще материалы, которые пересекаются по тегам, источнику или категории.

Apple представила visionOS 27 с поддержкой Siri AI и изогнутых окон
Пик Горячо Рост в поиске

Apple представила visionOS 27 с поддержкой Siri AI и изогнутых окон

Компания Apple представила visionOS 27 — новую версию операционной системы для гарнитуры дополненной реальности Vision Pro. Как и другие представленные сегодня операционные сист...

Погода сигнала

Сейчас это одна из самых сильных точек сигнала: тема тянет поиск, внимание или редакционный приоритет.

Почему сейчас

Тема уже растёт в поиске: импульс 945 и 14 внешнего сигнала.

Европейцы не получат Siri AI вместе с iOS 27 — Apple винит в этом закон DMA
Пик Горячо Рост в поиске

Европейцы не получат Siri AI вместе с iOS 27 — Apple винит в этом закон DMA

Apple не может выпустить новый голосовой помощник Siri AI в странах ЕС одновременно с выходом iOS 27 и iPadOS 27. Об этом компания сообщила на своём официальном сайте, сославшис...

Погода сигнала

Сейчас это одна из самых сильных точек сигнала: тема тянет поиск, внимание или редакционный приоритет.

Почему сейчас

Тема уже растёт в поиске: импульс 945 и 14 внешнего сигнала.

Apple представила новую Siri, снова — Siri AI поселилась на островке iPhone, работает с Google Gemini и умеет анализировать экран
Пик Горячо Рост в поиске

Apple представила новую Siri, снова — Siri AI поселилась на островке iPhone, работает с Google Gemini и умеет анализировать экран

На конференции WWDC 2026 компания Apple представила обновлённую версию голосового помощника Siri — Siri AI, работающую на базе платформы Apple Intelligence. Многие из показанных...

Погода сигнала

Сейчас это одна из самых сильных точек сигнала: тема тянет поиск, внимание или редакционный приоритет.

Почему сейчас

Тема уже растёт в поиске: импульс 874 и 14 внешнего сигнала.

iXBT Live AI 08.06.2026 13:58 AI
Рост Горячо

Учёные успешно испытали на людях универсальную вакцину от коронавирусов, созданную с помощью ИИ

Впервые в мире AI-разработанная универсальная вакцина против коронавирусов прошла первую фазу клинических испытаний на людях. Она оказалась безопасной и вызвала иммунный ответ с...

Погода сигнала

Импульс быстро усиливается, поэтому это хороший ранний вход в тему.

Почему сейчас

Это один из самых свежих сюжетов, у которого ещё только формируется продолжение.

Еще материалы от Habr

Свежие публикации и продолжение темы от той же редакции.

Открыть страницу источника
Промпты Nano Banana для фото и изображений: Бесплатно для Нано Банана Про
Стабильно Тёпло

Промпты Nano Banana для фото и изображений: Бесплатно для Нано Банана Про

Создание безупречного визуала в Nano Banana — это не вопрос везения, а результат правильной коммуникации с нейросетью. В отличие от простых моделей прошлого, этот инструмент спо...

Погода сигнала

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Почему сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.

Пошаговая инструкция установки MTProto прокси через Service Node + VLESS
Пик Тёпло Рост в поиске

Пошаговая инструкция установки MTProto прокси через Service Node + VLESS

Если вы когда-нибудь пытались поднять прокси для Telegram на сервере, то знаете, что такое «мессенджер не грузит». В этой инструкции я предлагаю рассмотреть подробную, пошаговую...

Погода сигнала

Сейчас это одна из самых сильных точек сигнала: тема тянет поиск, внимание или редакционный приоритет.

Почему сейчас

Тема уже растёт в поиске: импульс 887 и 14 внешнего сигнала.

Накрутка поведенческих факторов для роста позиций — реально ли за день занять топ 1 Яндекса
Стабильно Тёпло

Накрутка поведенческих факторов для роста позиций — реально ли за день занять топ 1 Яндекса

Знаете, можно много долго спорить о том, что вот там умеют делать, а наши ничего не умеют. Но подход Яндекса к формированию поисковой выдачи мне всегда импонировал больше, нежел...

Погода сигнала

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Почему сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.

Тени истории. Ренессанс – революция, подарившая миру главный инструмент шпионов
Стабильно Тёпло

Тени истории. Ренессанс – революция, подарившая миру главный инструмент шпионов

Вторая статья цикла о криптографии, в котором мы рассказываем, как человечество училось прятать и расшифровывать секреты — от древних методов до современных алгоритмов. Сегодня ...

Погода сигнала

История уже пережила первый всплеск и теперь работает как надёжный контекстный материал.

Почему сейчас

История уже пережила первый заголовок, но всё ещё активно развивается.