Я научил виртуальную камеру быть оператором: как устроен алгоритм face tracking для Shorts/Reels
В предыдущей статье я подробно рассказывал про свой "аниме завод" — пайплайн, который автоматически превращает эпизоды в готовые Shorts. Но внутри этой системы есть один особенно важный узел, который заслуживает отдельного разбора: виртуальная камера для автоматического кадрирования.В этой статье я разберу не просто...
В предыдущей статье я подробно рассказывал про свой "аниме завод" — пайплайн, который автоматически превращает эпизоды в готовые Shorts. Но внутри этой системы есть один особенно важный узел, который заслуживает отдельного разбора: виртуальная камера для автоматического кадрирования.В этой статье я разберу не просто "функцию автокропа", а полноценный алгоритм виртуальной камеры для вертикального видео. Это тот случай, когда задача на первый взгляд кажется простой: есть горизонтальный ролик, нужно сделать 9:16, удержать человека в кадре и не превратить результат в дёрганый автофокус из начала 2010-х.Но как только начинаешь делать это не для демо, а для реального пайплайна, сразу всплывают инженерные проблемы:
Связанные теги
Компании и люди
Линия сюжета
Face
Последние материалы и связанный контекст по теме Face.
Habr
Последние материалы и связанный контекст по теме Habr.
Habr
Последние материалы и связанные ссылки по теме Habr.
Reels
Последние материалы и связанные ссылки по теме Reels.
Shorts
Последние материалы и связанный контекст по теме Shorts.
Продолжить следить за темой
Переходите к связанным материалам, страницам сущностей и активным линиям сюжета.
Продвижение музыки в TikTok: три способа — от «сделай сам за $2» до «агентство сделает всё»
Вы записали трек. Он звучит хорошо, вы это знаете, ваши друзья это знают, даже мама одобрила. Осталось одно: чтобы его услышали не 40 человек, а 40 тысяч.В 2026 году ответ очеви...
Пишем AI-помощника для ревью пулл-реквестов: как выбрать модель и разработать серверную часть
Привет, Хабр! Я Полина Ященко, старший инженер по разработке ПО в YADRO. Мы с командой тестируем гипотезы и активно применяем искусственный интеллект, чтобы усовершенствовать пр...
Как использовать koda-cli в своей IDE без терминала
Привет. В свежей версии CLI-ассиcтента Koda 0.3.1 мы доработали поддержку ACP (Agent Client Protocol) и хотим поделиться туториалом — как настроить интеграцию с ним прямо сейчас...
Оказание проактивных сервисных услуг и проверка HealthCare
Информационная безопасность в классическом понимании часто работает как экстренная служба: «горит — тушим, не горим — отдыхаем». Но современная ИТ-инфраструктура слишком сложна ...
4 недели после открытия MENO для всех
Четыре недели. В первой части было 120 пользователей и баги в парсинге. Во второй - 149 и новый онбординг. В третьей - 216 и первый фидбек с Запада. Сейчас - четвёртая.Коротко: ...
Зачем ИИ-генератору презентаций собственный редактор
Привет, Хабр. На связи тим-лид разработки Кэмпа. Это третья статья цикла о релизе нового генератора презентаций в Кэмпе. Ранее разбирали, почему первая версия не взлетела, и что...
Рекламный слот
Встроенный блок в статье
Зарезервированный партнерский слот для релевантных инструментов, сервисов и аккуратных редакционных интеграций.
Похожие статьи
Еще материалы, которые пересекаются по тегам, источнику или категории.
Продвижение музыки в TikTok: три способа — от «сделай сам за $2» до «агентство сделает всё»
Вы записали трек. Он звучит хорошо, вы это знаете, ваши друзья это знают, даже мама одобрила. Осталось одно: чтобы его услышали не 40 человек, а 40 тысяч.В 2026 году ответ очеви...
Пишем AI-помощника для ревью пулл-реквестов: как выбрать модель и разработать серверную часть
Привет, Хабр! Я Полина Ященко, старший инженер по разработке ПО в YADRO. Мы с командой тестируем гипотезы и активно применяем искусственный интеллект, чтобы усовершенствовать пр...
Как использовать koda-cli в своей IDE без терминала
Привет. В свежей версии CLI-ассиcтента Koda 0.3.1 мы доработали поддержку ACP (Agent Client Protocol) и хотим поделиться туториалом — как настроить интеграцию с ним прямо сейчас...
Оказание проактивных сервисных услуг и проверка HealthCare
Информационная безопасность в классическом понимании часто работает как экстренная служба: «горит — тушим, не горим — отдыхаем». Но современная ИТ-инфраструктура слишком сложна ...
Еще материалы от Habr
Свежие публикации и продолжение темы от той же редакции.
Продвижение музыки в TikTok: три способа — от «сделай сам за $2» до «агентство сделает всё»
Вы записали трек. Он звучит хорошо, вы это знаете, ваши друзья это знают, даже мама одобрила. Осталось одно: чтобы его услышали не 40 человек, а 40 тысяч.В 2026 году ответ очеви...
[Перевод] «Большой скачок» в мире AI: история повторяется
В 1958 году Мао приказал каждой деревне в Китае выплавлять сталь. Крестьяне бросали кухонную утварь в самодельные домны и рапортовали о феноменальных показателях. Сталь оказалас...
Пишем AI-помощника для ревью пулл-реквестов: как выбрать модель и разработать серверную часть
Привет, Хабр! Я Полина Ященко, старший инженер по разработке ПО в YADRO. Мы с командой тестируем гипотезы и активно применяем искусственный интеллект, чтобы усовершенствовать пр...
Как использовать koda-cli в своей IDE без терминала
Привет. В свежей версии CLI-ассиcтента Koda 0.3.1 мы доработали поддержку ACP (Agent Client Protocol) и хотим поделиться туториалом — как настроить интеграцию с ним прямо сейчас...