[Перевод] Cursor показал 5 графиков, которые хоронят все публичные ИИ-бенчмарки для кода. Разбираемся
11 марта 2026 года Cursor опубликовал пост под скромным названием «Как мы сравниваем качество моделей в Cursor». Без громких заявлений. Без атак на конкурентов. Просто пять графиков и спокойное объяснение внутреннего процесса оценки.ИИ-сообщество в основном отнеслось к этому как к очередному «компания рассказывает о...
11 марта 2026 года Cursor опубликовал пост под скромным названием «Как мы сравниваем качество моделей в Cursor». Без громких заявлений. Без атак на конкурентов. Просто пять графиков и спокойное объяснение внутреннего процесса оценки.ИИ-сообщество в основном отнеслось к этому как к очередному «компания рассказывает о своём бенчмарке». Это было ошибкой.Эти пять графиков, если прочитать их внимательно, обнажают пять допущений, зашитых в каждый публичный бенчмарк для кодинга, которые никто не ставит под вопрос. И каждое допущение, однажды увиденное, невозможно развидеть.Вот что показал Cursor. И вот чего они не сказали вслух. Читать далее
Related tags
Entities
Related clusters
Ad slot
Article monetization slot
Reserved for contextual monetization inside article pages.
Related articles
More stories that share tags, source, or category context.
В Apple Maps могут появиться рекламные объявления
Как сообщает издание Bloomberg, компания готовится ввести рекламу в своём картографическом сервисе уже летом 2026 годаЧитать дальше
Разработка через капсулы. Капсулы и AI-агенты: как передать опыт разработчика машине
В первой части я рассказал, что такое капсула и зачем упаковывать опыт. В второй части — как мы построили капсульный фреймворк для микросервисов. Если вы не читали предыдущие ча...
Конец эпохи вероятностного ИИ: почему гонка за GPU от Nvidia — это архитектурный тупик
Индустрия генеративного искусственного интеллекта больна. Симптомы этой болезни видны невооруженным глазом: шесть пальцев на руках, нарушенная геометрия объектов в движении и ра...
Как мы провели «пересадку сердца» у бегущего марафон, миграция 50 000 АРМ с ALSE 1.7 на 1.8 через Ansible без простоя
Привет, Хабр. Я Александр Габидуллин, старший инженер внедрения в Группе Астра. Основная часть моей работы — автоматизация установки и разворачивания наших продуктов. Нередко за...
More coverage around this story
Related URLs and close matches that can become future cluster or explainer pages.
Cursor admits its new coding model was built on top of Moonshot AI’s Kimi
Building on top of a Chinese model feels particularly fraught right now.