News Grower

Независимое покрытие AI, стартапов и технологий.

Habr 27.03.2026 16:09 Developer Tools

vLLM Production Stack. Часть 1: Базовые возможности vLLM

Статья будет о том, как быстро начать работать с vLLM и vLLM Production Stack: от первого запуска модели до базовых режимов инференса через OpenAI-совместимый API. Разберем практические настройки и сценарии запуска — tool calling, thinking/non-thinking, мультимодальные и CPU-модели, а так же какие стартовые параметр...

Автор: Bambarambambum Оригинальный источник
vLLM Production Stack. Часть 1: Базовые возможности vLLM

Статья будет о том, как быстро начать работать с vLLM и vLLM Production Stack: от первого запуска модели до базовых режимов инференса через OpenAI-совместимый API. Разберем практические настройки и сценарии запуска — tool calling, thinking/non-thinking, мультимодальные и CPU-модели, а так же какие стартовые параметры сильнее всего влияют на память, производительность и стабильность. Отдельном рассмотрим полезные оптимизации для production-сценариев: FP8, Tensor Parallelism, KV-cache offloading, Speculative Decoding и ускорение холодного старта больших моделей.

Связанные теги

Компании и люди

Линия сюжета

Продолжить следить за темой

Переходите к связанным материалам, страницам сущностей и активным линиям сюжета.

Как я хотел одного AI-агента, а получил целую деревню
Habr 27.03.2026 17:58 Developer Tools

Как я хотел одного AI-агента, а получил целую деревню

Всё началось с простого желания: чтобы AI-агент мог потихоньку развивать мои проекты, пока я занят другими делами. Поставил задачу, ушёл, вернулся к готовому результату. За неде...

Из фронтенда в «мультиспециалисты»: Как я штурмовал вертолетный завод и получил 16 рублей
Habr 27.03.2026 17:49 Developer Tools

Из фронтенда в «мультиспециалисты»: Как я штурмовал вертолетный завод и получил 16 рублей

История одного выгорания, которая привела меня к токарному станку 4-го разряда. О том, как завод заманивает стипендиями, но встречает мешками со списанной формой и кумовством. О...

[Перевод] Как один отказ превратился в $150 млрд к оценке, 295% роста удалений ChatGPT — и недооценённый сюжет в истории tech
Habr 27.03.2026 16:56 Developer Tools

[Перевод] Как один отказ превратился в $150 млрд к оценке, 295% роста удалений ChatGPT — и недооценённый сюжет в истории tech

Иногда наибольшую ценность создаёт тот, кто приходит вторым. Тим Кук и Сатья Наделла не основывали Apple и Microsoft, но каждый из них сел за руль — и увеличил капитализацию сво...

10 лет в российском IT: от кабальных договоров джуном до кабальных кредитов с ИП
Habr 27.03.2026 16:54 Developer Tools

10 лет в российском IT: от кабальных договоров джуном до кабальных кредитов с ИП

Больше 10 лет я в разработке — был джуном с договором на 100к за 5 месяцев и штрафом в 500к, дорос до ИП с приличным оборотом. Сейчас IT в России тонет, а я пытаюсь спасти себя ...

Как выбрать лучшего AI-ассистента для разработки: тестируем Codex, Claude и Cursor
Habr 27.03.2026 16:54 Developer Tools

Как выбрать лучшего AI-ассистента для разработки: тестируем Codex, Claude и Cursor

В 2026 году кодовые ассистенты окончательно перестали быть просто автокомплитом и превратились в полноценный инструмент разработки: они читают кодовую базу целиком, понимают зав...

Рекламный слот

Article monetization slot

Reserved for contextual monetization inside article pages.

Explore options

Похожие статьи

Еще материалы, которые пересекаются по тегам, источнику или категории.

Как я хотел одного AI-агента, а получил целую деревню
Habr 27.03.2026 17:58 Developer Tools

Как я хотел одного AI-агента, а получил целую деревню

Всё началось с простого желания: чтобы AI-агент мог потихоньку развивать мои проекты, пока я занят другими делами. Поставил задачу, ушёл, вернулся к готовому результату. За неде...

Из фронтенда в «мультиспециалисты»: Как я штурмовал вертолетный завод и получил 16 рублей
Habr 27.03.2026 17:49 Developer Tools

Из фронтенда в «мультиспециалисты»: Как я штурмовал вертолетный завод и получил 16 рублей

История одного выгорания, которая привела меня к токарному станку 4-го разряда. О том, как завод заманивает стипендиями, но встречает мешками со списанной формой и кумовством. О...

[Перевод] Как один отказ превратился в $150 млрд к оценке, 295% роста удалений ChatGPT — и недооценённый сюжет в истории tech
Habr 27.03.2026 16:56 Developer Tools

[Перевод] Как один отказ превратился в $150 млрд к оценке, 295% роста удалений ChatGPT — и недооценённый сюжет в истории tech

Иногда наибольшую ценность создаёт тот, кто приходит вторым. Тим Кук и Сатья Наделла не основывали Apple и Microsoft, но каждый из них сел за руль — и увеличил капитализацию сво...

Еще материалы от Habr

Свежие публикации и продолжение темы от той же редакции.

Открыть страницу источника
Как я хотел одного AI-агента, а получил целую деревню
Habr 27.03.2026 17:58 Developer Tools

Как я хотел одного AI-агента, а получил целую деревню

Всё началось с простого желания: чтобы AI-агент мог потихоньку развивать мои проекты, пока я занят другими делами. Поставил задачу, ушёл, вернулся к готовому результату. За неде...

Из фронтенда в «мультиспециалисты»: Как я штурмовал вертолетный завод и получил 16 рублей
Habr 27.03.2026 17:49 Developer Tools

Из фронтенда в «мультиспециалисты»: Как я штурмовал вертолетный завод и получил 16 рублей

История одного выгорания, которая привела меня к токарному станку 4-го разряда. О том, как завод заманивает стипендиями, но встречает мешками со списанной формой и кумовством. О...

[Перевод] Как один отказ превратился в $150 млрд к оценке, 295% роста удалений ChatGPT — и недооценённый сюжет в истории tech
Habr 27.03.2026 16:56 Developer Tools

[Перевод] Как один отказ превратился в $150 млрд к оценке, 295% роста удалений ChatGPT — и недооценённый сюжет в истории tech

Иногда наибольшую ценность создаёт тот, кто приходит вторым. Тим Кук и Сатья Наделла не основывали Apple и Microsoft, но каждый из них сел за руль — и увеличил капитализацию сво...