News Grower

Независимое покрытие AI, стартапов и технологий.

Как я сделал скилл для AI-ревью плана и кода — и зачем мне две модели

Когда одна и та же модель пишет код и проверяет его, она пропускает свои ошибки. Она «помнит», почему приняла именно это решение, и не ставит его под сомнение. Знакомо? Как вычитывать собственный текст: глаз замыливается, мозг подставляет правильный смысл туда, где его нет.В нормальной команде эта проблема решена да...

Как я сделал скилл для AI-ревью плана и кода — и зачем мне две модели

Когда одна и та же модель пишет код и проверяет его, она пропускает свои ошибки. Она «помнит», почему приняла именно это решение, и не ставит его под сомнение. Знакомо? Как вычитывать собственный текст: глаз замыливается, мозг подставляет правильный смысл туда, где его нет.В нормальной команде эта проблема решена давно: автор кода ≠ ревьюер. Два человека с разным контекстом и разными слепыми пятнами. С LLM можно сделать то же самое, взяв две модели от разных вендоров. Другая архитектура, другой pretrain - другие слепые пятна. Одна пишет, другая проверяет.В англоязычной среде этот подход называют adversarial review, «состязательное ревью». Суть: ревьюер не подтверждает, что все хорошо, а пытается сломать уверенность в решении. Я называю это проще: перекрестное ревью.У меня Claude (Opus) планирует и пишет код, а Codex (GPT-5.4) ревьюит. Автоматически, в цикле, пока не одобрит. Все это - один файл-скилл для Claude Code. О нем и расскажу.

Связанные теги

Компании и люди

Линия сюжета

Продолжить следить за темой

Переходите к связанным материалам, страницам сущностей и активным линиям сюжета.

Как мы запустили 35B LLM на видеокарте за $500: внутри ZINC inference engine

Как мы запустили 35B LLM на видеокарте за $500: внутри ZINC inference engine

Год назад запуск модели на 35 миллиардов параметров подразумевал облако, очередь на GPU, и счёт от провайдера в конце месяца. Сегодня я покажу, как мы сделали это на одной потре...

Cruzo — минималистичный UI-фреймворк без лишней сложности

Cruzo — минималистичный UI-фреймворк без лишней сложности

Иногда возникает странное ощущение, что фронтенд уже не про решение задач.А про поддержание сложности.Я в разработке ещё до AngularJS и React. Тогда всё было просто: HTML и немн...

Push-уведомления в Linux не работают: история одного багрепорта

Push-уведомления в Linux не работают: история одного багрепорта

Меня зовут Олеся Лазарева, я — старший разработчик в команде web-редакции Pilot. Программный продукт входит в семейство программного обеспечения для совместной работы над строит...

Собираем pod с учетом зависимостей в Podman

Собираем pod с учетом зависимостей в Podman

Когда ваше приложение состоит из нескольких сервисов, например бэкенда, БД и кэша, невольно возникает вопрос — а как гарантировать, что они запустятся в правильно порядке и вооб...

Что даёт воспроизводимая среда разработки и как развернуть контейнеры на VPS

Что даёт воспроизводимая среда разработки и как развернуть контейнеры на VPS

3-я статья из цикла туториалов о том, как можно кастомизировать свой бизнес-портал в Битрикс24.Сегодня рассказываем о плюсах воспроизводимого окружения для разработки. Такую сре...

Рекламный слот

Встроенный блок в статье

Зарезервированный партнерский слот для релевантных инструментов, сервисов и аккуратных редакционных интеграций.

Партнерский слот

Похожие статьи

Еще материалы, которые пересекаются по тегам, источнику или категории.

Как мы запустили 35B LLM на видеокарте за $500: внутри ZINC inference engine

Как мы запустили 35B LLM на видеокарте за $500: внутри ZINC inference engine

Год назад запуск модели на 35 миллиардов параметров подразумевал облако, очередь на GPU, и счёт от провайдера в конце месяца. Сегодня я покажу, как мы сделали это на одной потре...

Cruzo — минималистичный UI-фреймворк без лишней сложности

Cruzo — минималистичный UI-фреймворк без лишней сложности

Иногда возникает странное ощущение, что фронтенд уже не про решение задач.А про поддержание сложности.Я в разработке ещё до AngularJS и React. Тогда всё было просто: HTML и немн...

Push-уведомления в Linux не работают: история одного багрепорта

Push-уведомления в Linux не работают: история одного багрепорта

Меня зовут Олеся Лазарева, я — старший разработчик в команде web-редакции Pilot. Программный продукт входит в семейство программного обеспечения для совместной работы над строит...

Еще материалы от Habr

Свежие публикации и продолжение темы от той же редакции.

Открыть страницу источника
Как мы запустили 35B LLM на видеокарте за $500: внутри ZINC inference engine

Как мы запустили 35B LLM на видеокарте за $500: внутри ZINC inference engine

Год назад запуск модели на 35 миллиардов параметров подразумевал облако, очередь на GPU, и счёт от провайдера в конце месяца. Сегодня я покажу, как мы сделали это на одной потре...

Cruzo — минималистичный UI-фреймворк без лишней сложности

Cruzo — минималистичный UI-фреймворк без лишней сложности

Иногда возникает странное ощущение, что фронтенд уже не про решение задач.А про поддержание сложности.Я в разработке ещё до AngularJS и React. Тогда всё было просто: HTML и немн...

Push-уведомления в Linux не работают: история одного багрепорта

Push-уведомления в Linux не работают: история одного багрепорта

Меня зовут Олеся Лазарева, я — старший разработчик в команде web-редакции Pilot. Программный продукт входит в семейство программного обеспечения для совместной работы над строит...