Как засунуть 62ГБ в 15ГБ и не сойти с ума: Партизанский MLOps на примере Gemma 4 31B
TL;DR: В этой статье мы возьмем новейшую Gemma 4 31B, которая в оригинале весит 62 ГБ, и заставим её работать и выгружаться на бесплатном Kaggle с лимитом диска в 57 ГБ. Спойлер: нам придется удалять исходники прямо во время работы Python-скрипта.
Связанные теги
Компании и люди
Линия сюжета
Gemma
Последние материалы и связанные ссылки по теме Gemma.
Gemma
Последние материалы и связанный контекст по теме Gemma.
MLOps
Последние материалы и связанные ссылки по теме MLOps.
MLOps
Последние материалы и связанный контекст по теме MLOps.
Python-системы
Последние материалы и связанный контекст по теме Python-системы.
Python-системы
Последние материалы и связанные ссылки по теме Python-системы.
Продолжить следить за темой
Переходите к связанным материалам, страницам сущностей и активным линиям сюжета.
Память для LLM-чата на Python. Часть 3: добавляем историю сообщений и контекст
Во второй части мы сделали консольный чат с циклом и system prompt. Но у него был пробел: каждый запрос шёл к модели независимо, без контекста предыдущих реплик. В третьей части...
Почему я написал Ёбифай: свой планировщик для фоновых задач на Python
Но очень быстро оказывается, что настоящая сложность не в самих задачах, а в инфраструктуре вокруг них.Сначала хочется просто запускать код в фоне. Потом появляются ретраи, тайм...
Микросервис потоковой конвертации видео (Python, FFmpeg)
Недавно перед нами встала задача быстро реализовать микросервис для конвертации видео. Стандартным решением для таких целей является FFmpeg, который умеет читать файлы чанками (...
Более 25 лет в Python не решаются исправить это
Сегодня (2026.04.01) прошло ровно 9731 день с тех пор, как сообщество Python узнало об изъяне в работе со строками.Это было так давно, что у Python еще не было мажорных версий (...
Программируем на Python с использованием искусственного интеллекта
Какому программисту не захочется прокачать свои навыки с ИИ и десятикратно умножить эффективность разработки? Когда мы получили оригинал книги «Modern Python Programming using C...
Симулятор JWST на Python: как критика Хабра заставила выучить астрофизику и почему мы сделаем открытие раньше NASA
Некоторое время назад я пришел на Хабр с простеньким ML-скриптом, который искал обитаемые экзопланеты. Я ждал похвалы, но вместо этого получил в комментариях ведро ледяной воды:...
Страницы сущностей
Рекламный слот
Встроенный блок в статье
Зарезервированный партнерский слот для релевантных инструментов, сервисов и аккуратных редакционных интеграций.
Похожие статьи
Еще материалы, которые пересекаются по тегам, источнику или категории.
Память для LLM-чата на Python. Часть 3: добавляем историю сообщений и контекст
Во второй части мы сделали консольный чат с циклом и system prompt. Но у него был пробел: каждый запрос шёл к модели независимо, без контекста предыдущих реплик. В третьей части...
Почему я написал Ёбифай: свой планировщик для фоновых задач на Python
Но очень быстро оказывается, что настоящая сложность не в самих задачах, а в инфраструктуре вокруг них.Сначала хочется просто запускать код в фоне. Потом появляются ретраи, тайм...
Микросервис потоковой конвертации видео (Python, FFmpeg)
Недавно перед нами встала задача быстро реализовать микросервис для конвертации видео. Стандартным решением для таких целей является FFmpeg, который умеет читать файлы чанками (...
Более 25 лет в Python не решаются исправить это
Сегодня (2026.04.01) прошло ровно 9731 день с тех пор, как сообщество Python узнало об изъяне в работе со строками.Это было так давно, что у Python еще не было мажорных версий (...
Еще материалы от Habr
Свежие публикации и продолжение темы от той же редакции.
Как я научил ИИ читать советские ГОСТы и сократил подготовку карт контроля с 2 часов до 5 минут
Реальный кейс: как LLM заменяет трех технологов на металлургическом заводе - и почему универсальный подход не сработал.Как я научил ИИ читать советские ГОСТы и сократил подготов...
Память для LLM-чата на Python. Часть 3: добавляем историю сообщений и контекст
Во второй части мы сделали консольный чат с циклом и system prompt. Но у него был пробел: каждый запрос шёл к модели независимо, без контекста предыдущих реплик. В третьей части...
Как тимлиду давать обратную связь: 4 фреймворка, которые работают
Даже опытные руководители пасуют перед сложными разговорами. Мы молчим, когда сотрудник делает что-то не так. Терпим, надеемся, что «само рассосётся». А потом удивляемся, почему...
Я сделал скоростной аналог скретча(12289+ скриптов)! История разработки новичка
Я только начинаю писать код, он у меня не аккуратный и странный, я его нигде не публиковал никогда, проект писать на luaJIT love 2d, а заголовок правдивый, оно смогло запустить ...