Испанский в кармане: Архитектура Telegram-бота с локальным Whisper.cpp, AI-диалогами и оценкой произношения
Привет, Хабр! Меня зовут Vlad, я начинающий Python‑разработчик и энтузиаст изучения языков. Недавно я столкнулся с классической проблемой полиглота‑самоучки: учебники дают теорию, аудиокурсы — пассивное восприятие, но нет главного — обратной связи по произношению. Репетиторы дороги, а р...
Привет, Хабр! Меня зовут Vlad, я начинающий Python‑разработчик и энтузиаст изучения языков. Недавно я столкнулся с классической проблемой полиглота‑самоучки: учебники дают теорию, аудиокурсы — пассивное восприятие, но нет главного — обратной связи по произношению. Репетиторы дороги, а разговорные клубы требуют уровня, которого у меня еще не было. Я решил закрыть эту боль кодом. Моя цель была амбициозной: создать Telegram‑бота, который: 1. Слушает голосовые сообщения и распознает речь без дорогих облачных API. 2. Оценивает точность произношения в процентах, сравнивая с эталоном. 3. Поддерживает живой диалог через LLM, исправляя ошибки на лету. 4. Работает быстро и экономно на слабом VPS. В этой статье я подробно разберу архитектуру проекта, покажу, как интегрировать бинарный whisper.cpp в асинхронный aiogram 3.x, реализую алгоритм оценки речи и расскажу про управление состояниями (FSM). Под капотом — Python, нейросети и немного магии.
Связанные теги
Компании и люди
Линия сюжета
AI
Cluster page for AI.
Habr
Latest coverage and related links about Habr.
Habr
Cluster page for Habr.
Python-системы
Cluster page for Python-системы.
Python-системы
Latest coverage and related links about Python-системы.
Telegram
Cluster page for Telegram.
Telegram
Latest coverage and related links about Telegram.
Продолжить следить за темой
Переходите к связанным материалам, страницам сущностей и активным линиям сюжета.
Пусковой ток импульсного источника питания или как правильно выбрать автоматический выключатель
Наверное, каждый из нас так или иначе сталкивался с пусковым током какого-либо импульсного блока питания, когда подключал его к сети. В этот момент возникал характерный щелчок, ...
5 когнитивных искажений, которые ломают UX
Мы часто думаем, что плохой интерфейс — это про кнопки, цвета или сетку. Но чаще он ломается не из-за пикселей. А из-за того, что дизайнер не учитывает, как на самом деле работа...
Как выяснить актуальные IP Telegram и «завернуть их»
В этой короткой статье я расскажу, как определить IP-адреса, которые использует Telegram. А что делать с этой информацией дальше - решайте сами.Мне нужно было автоматизировать б...
Как я сократила время разработки на 50% одним решением
В статье показан практический подход, который помогает сократить время на вёрстку, убрать лишние вопросы и сделать дизайн понятным без дополнительных объяснений. Если вы сталкив...
Нестандартные применения LLM и синтетических данных: от антивируса для завода до сжатия данных языковыми моделями
Привет, Хабр! Меня зовут Вадим Кондаратцев, я руковожу ИИ-направлением в Friflex и небольшой ИИ-лабораторией в МГТУ им. Баумана. Последние 10 лет работаю на стыке ML, HPC и Edge...
Великое переселение: Почему бизнес переходит с ChatGPT на Claude
Почему бизнес все чаще выбирает Claude, а не ChatGPT? Еще недавно ChatGPT казался для бизнеса выбором по умолчанию. Но в марте 2026 года картина начала меняться: среди компаний,...
Рекламный слот
Article monetization slot
Reserved for contextual monetization inside article pages.
Похожие статьи
Еще материалы, которые пересекаются по тегам, источнику или категории.
Пусковой ток импульсного источника питания или как правильно выбрать автоматический выключатель
Наверное, каждый из нас так или иначе сталкивался с пусковым током какого-либо импульсного блока питания, когда подключал его к сети. В этот момент возникал характерный щелчок, ...
5 когнитивных искажений, которые ломают UX
Мы часто думаем, что плохой интерфейс — это про кнопки, цвета или сетку. Но чаще он ломается не из-за пикселей. А из-за того, что дизайнер не учитывает, как на самом деле работа...
Как выяснить актуальные IP Telegram и «завернуть их»
В этой короткой статье я расскажу, как определить IP-адреса, которые использует Telegram. А что делать с этой информацией дальше - решайте сами.Мне нужно было автоматизировать б...
Как я сократила время разработки на 50% одним решением
В статье показан практический подход, который помогает сократить время на вёрстку, убрать лишние вопросы и сделать дизайн понятным без дополнительных объяснений. Если вы сталкив...
Еще материалы от Habr
Свежие публикации и продолжение темы от той же редакции.
Пусковой ток импульсного источника питания или как правильно выбрать автоматический выключатель
Наверное, каждый из нас так или иначе сталкивался с пусковым током какого-либо импульсного блока питания, когда подключал его к сети. В этот момент возникал характерный щелчок, ...
5 когнитивных искажений, которые ломают UX
Мы часто думаем, что плохой интерфейс — это про кнопки, цвета или сетку. Но чаще он ломается не из-за пикселей. А из-за того, что дизайнер не учитывает, как на самом деле работа...
Почему HR и бизнес говорят на разных языках и из-за этого принимают плохие кадровые решения
Кадровые решения часто ломаются не потому, что у компании нет данных о людях, а потому что HR, руководители и собственники говорят о них на разных языках. Разбираю, почему оценк...
Как выяснить актуальные IP Telegram и «завернуть их»
В этой короткой статье я расскажу, как определить IP-адреса, которые использует Telegram. А что делать с этой информацией дальше - решайте сами.Мне нужно было автоматизировать б...