Suno 5.5: почти ваш голос и мелодия
Вопрос генерации со своим голосом занимал меня с v3.5. Другая интересная тема — аранжировка. Если не в обычном виде (на входе стиль и аккорды, на выходе “минус”), то способом обновления, “раскраски” черновика (mp3 из GM MIDI, Audio Upload, режим Cover). За пару лет я сделал много тестов, результаты представлял на Ха...
Вопрос генерации со своим голосом занимал меня с v3.5. Другая интересная тема — аранжировка. Если не в обычном виде (на входе стиль и аккорды, на выходе “минус”), то способом обновления, “раскраски” черновика (mp3 из GM MIDI, Audio Upload, режим Cover). За пару лет я сделал много тестов, результаты представлял на Хабре, своём сайте, в Телеграм-канале. Последнее обновление Suno — повод снова вернуться к этим вопросам.Свой голосКак только версия 5.5 стала доступна, приступил к тестам опции “Your Voice” 1), опираясь на опыт с Suno v3.5 и RVC. Собрал 11 DS (голосовых наборов) на своём материале. Задача — проверить, как реагирует система на разный исходный материал, стили и параметры генерации.1) Ссылка на процедуру “Your Voice” (PDF на русском) из раздела Help на сайте Suno.Уже не раз касался понятий тембр и манера с психоакустической точки зрения. Нынче повод вернуться к теме: можно говорить похоже или нет, но чтобы контролировать, надо понимать механику.Для синтеза вокала Suno (или другому ИИ) нужно обеспечить 3 компонента:Тембр, или «окраска» звука, зависит от “геометрии” голосового аппарата: трахея, гортань, связки, резонаторы.(Певцы, артисты могут в определённой степени его менять. У родственников голоса часто похожи — физиология).Интонация — изменения высоты (мелодия) + нюансы: вибрато, опевания, “подъезды” (Pitch curve).Артикуляция — работа языка, нёба, челюсти, губ, обеспечивающая произнесение/ пропевание слов.Именно разделение на 3 компонента придаёт гибкость системе: берём модель тембра, добавляем интонирование в нужной манере и соответствующую языку артикуляцию. Хотите на хинди? Пожалуйста!
Продолжить следить за темой
Переходите к связанным материалам, страницам сущностей и активным линиям сюжета.
[Перевод] Межпланетная обитаемая зона
К 65-летию первого полёта человека в космос, публикую перевод свежей (от 13 февраля 2026) статьи Калеба Аса Шарфа (Caleb Asa Scharf), англо-американского астронома, астробиолога...
Моё путешествие в трёхмерное пространство: история о «программном» Франкенштейне и множестве открытий
Честно говоря, я долго не мог решиться написать и опубликовать эту статью. Зачем, думал я, возиться с не самой популярной технологией и изобретать велосипед — реализовывать функ...
Performance review без идеальной схемы: цели, лимиты, калибровки и почему все равно будет не идеально
Меня зовут Кирилл, я IT-директор в Ви.Tech, IT-дочке ВсеИнструменты.ру. Недавно мы записывали подкаст с Сергеем Щербининым, CEO консалтинговой компании fcon tech, бывшим CTO/CIO...
UX/UI рефакторинг блога с учётом SEO: +330% трафика за полгода
Шесть месяцев назад органический трафик блога держался на отметке 23 000 визитов в месяц. После системного UX/UI рефакторинга с учётом SEO правок он вырос до 76 000. Не за счёт ...
Как мы подняли CTR с 3% до 8% заменой обложек: протокол реанимации YouTube-роликов
Привет, Хабр. Меня зовут Дмитрий Таланов, я основатель продюсерской группы Talanov Vision. Мы строим и масштабируем медиа-активы на YouTube для бизнеса и экспертов. Суммарно наш...
«Увидеть» сигнал, «нарисовать» комнату, построить виртуальное пространство — исследования и эксперименты с Wi-Fi
Сегодня мы рассмотрим несколько исследований, посвященных использованию Wi-Fi в задачах визуализации. Речь пойдет не только о том, как «увидеть» движение внутри помещений, испол...
Похожие статьи
Еще материалы, которые пересекаются по тегам, источнику или категории.
[Перевод] Межпланетная обитаемая зона
К 65-летию первого полёта человека в космос, публикую перевод свежей (от 13 февраля 2026) статьи Калеба Аса Шарфа (Caleb Asa Scharf), англо-американского астронома, астробиолога...
Моё путешествие в трёхмерное пространство: история о «программном» Франкенштейне и множестве открытий
Честно говоря, я долго не мог решиться написать и опубликовать эту статью. Зачем, думал я, возиться с не самой популярной технологией и изобретать велосипед — реализовывать функ...
Performance review без идеальной схемы: цели, лимиты, калибровки и почему все равно будет не идеально
Меня зовут Кирилл, я IT-директор в Ви.Tech, IT-дочке ВсеИнструменты.ру. Недавно мы записывали подкаст с Сергеем Щербининым, CEO консалтинговой компании fcon tech, бывшим CTO/CIO...
UX/UI рефакторинг блога с учётом SEO: +330% трафика за полгода
Шесть месяцев назад органический трафик блога держался на отметке 23 000 визитов в месяц. После системного UX/UI рефакторинга с учётом SEO правок он вырос до 76 000. Не за счёт ...
Еще материалы от Habr
Свежие публикации и продолжение темы от той же редакции.
[Перевод] Межпланетная обитаемая зона
К 65-летию первого полёта человека в космос, публикую перевод свежей (от 13 февраля 2026) статьи Калеба Аса Шарфа (Caleb Asa Scharf), англо-американского астронома, астробиолога...
Моё путешествие в трёхмерное пространство: история о «программном» Франкенштейне и множестве открытий
Честно говоря, я долго не мог решиться написать и опубликовать эту статью. Зачем, думал я, возиться с не самой популярной технологией и изобретать велосипед — реализовывать функ...
Performance review без идеальной схемы: цели, лимиты, калибровки и почему все равно будет не идеально
Меня зовут Кирилл, я IT-директор в Ви.Tech, IT-дочке ВсеИнструменты.ру. Недавно мы записывали подкаст с Сергеем Щербининым, CEO консалтинговой компании fcon tech, бывшим CTO/CIO...
UX/UI рефакторинг блога с учётом SEO: +330% трафика за полгода
Шесть месяцев назад органический трафик блога держался на отметке 23 000 визитов в месяц. После системного UX/UI рефакторинга с учётом SEO правок он вырос до 76 000. Не за счёт ...
Дополнительное покрытие этой темы
Похожие публикации и близкие по смыслу материалы по этой же теме.
Промпты для Suno AI: как писать запросы, чтобы нейросеть генерировала нормальную музыку, а не кашу
Suno генерирует музыку по текстовому описанию, но без правильной разметки результат — каша. Разобрал систему промптов: метатеги [Verse], [Chorus], [Drop], музыкальные термины дл...
Бесплатная нейросеть для генерации музыки локально: ACE-Step 1.5 обходит Suno на бенчмарках
Open source модель для генерации музыки, которая на бенчмарке SongEval обходит Suno v5. Работает локально от 4 ГБ VRAM, генерирует полный трек за 2 секунды на A100. Разбираю арх...