152-ФЗ и LLM несовместимы по умолчанию: как мы это исправили без потери качества AI
Строим AI-ассистента для бизнеса — и обнаруживаем, что каждое сообщение пользователя с персональными данными уходит в Google. Рассказываю, как это исправить, не сломав UX.Когда мы запускали AI-ассистента для квалификации лидов в строительном бизнесе, первый же вопрос от клиента поставил меня в тупик: «А куда уходят ...
Строим AI-ассистента для бизнеса — и обнаруживаем, что каждое сообщение пользователя с персональными данными уходит в Google. Рассказываю, как это исправить, не сломав UX.Когда мы запускали AI-ассистента для квалификации лидов в строительном бизнесе, первый же вопрос от клиента поставил меня в тупик: «А куда уходят персональные данные, которые люди вводят в чат?»Я знал ответ. И он мне не нравился.Пользователь пишет: «Меня зовут Дмитрий, наша компания ООО Ромашка, телефон +7 903 123-45-67, email dmitriy@company.com». Это сообщение в том же виде уходит в Google Gemini API для генерации ответа. Google получает PII — имя, телефон, email конкретного человека. Каждый раз. С каждым пользователем.Для бизнеса в России это три проблемы одновременно.Юридическая. 152-ФЗ требует, чтобы персональные данные российских граждан обрабатывались на территории РФ. Передача данных на серверы Google — даже для обработки, не хранения — это трансграничная передача данных, которая требует уведомления Роскомнадзора и согласия субъекта. Штрафы начинаются от 3 млн рублей.Бизнес-риск. Контактная база клиентов — главный актив отдела продаж. Отдавать её в третьи руки, пусть даже крупной корпорации — вопрос корпоративной гигиены.Этика. Клиент пишет в ваш чат. Он доверяет вам свои данные. Не Google.Задача сформулировалась чётко: большая языковая модель должна вести диалог естественно — обращаться по имени, знать компанию, упоминать email — но никогда не получать реальные персональные данные. Звучит как противоречие. Решение оказалось элегантным.
Краткая сводка
При разработке AI‑ассистента для квалификации лидов в строительном бизнесе выяснилось, что личные данные пользователей отправляются в Google Gemini, что нарушает требование 152‑ФЗ о локализации персональных данных в РФ; автор рассказывает, как было реализовано удаление PII перед запросом к модели, сохранив естественный диалог и пользовательский опыт.
Связанные теги
Компании и люди
Линия сюжета
Продолжить следить за темой
Переходите к связанным материалам, страницам сущностей и активным линиям сюжета.
5 вопросов об английской грамматике, которые вы стеснялись задать
Многим из нас не повезло с учителем английского. В итоге за годы изучения с нами остались не язык, а барьер, страх и ощущение, что «я не языковой человек».Нет, в этой статье я н...
Системы мониторинга без процессов — ресурсы на ветер, или Как получить максимум эффективности от использования SIEM
Чтобы автоматизированно проверять и централизованно обрабатывать огромное количество событий о происходящем в инфраструктуре, используется SIEM –– класс решений информационной б...
Концентрационный генератор/источник питания
StarsendСегодня мы поговорим об ещё одном интересном способе генерации электроэнергии — концентрационном, где электроэнергию можно извлекать за счёт разницы в концентрации ионов...
PG_EXPECTO v.7: Анализ инцидента производительности высоконагруженной СУБД (CPU=200 RAM=1TB)
Telegram: @pg_expectoMAX: PG_EXPECTOGitHub - Комплекс pg_expecto для статистического анализа производительности и нагрузочного тестирования СУБД PostgreSQLGitFlic - pg...
Headless CMS на Go — самая минималистичная система управления сайтом
Когда очередной лендинг требует «просто принимать заявки и показывать новости», разработчик оказывается перед выбором: поднять Laravel/Django с кучей зависимостей, купить SaaS-п...
Как составить распорядок дня и не сойти с ума
Не так давно в X (он же бывший Твиттер, есличто) завирусился пост одного там коуча по личной продуктивности, называющего себя “Отцом дисциплины”. В нем он поделился с ...
Рекламный слот
Article monetization slot
Reserved for contextual monetization inside article pages.
Похожие статьи
Еще материалы, которые пересекаются по тегам, источнику или категории.
5 вопросов об английской грамматике, которые вы стеснялись задать
Многим из нас не повезло с учителем английского. В итоге за годы изучения с нами остались не язык, а барьер, страх и ощущение, что «я не языковой человек».Нет, в этой статье я н...
Системы мониторинга без процессов — ресурсы на ветер, или Как получить максимум эффективности от использования SIEM
Чтобы автоматизированно проверять и централизованно обрабатывать огромное количество событий о происходящем в инфраструктуре, используется SIEM –– класс решений информационной б...
Концентрационный генератор/источник питания
StarsendСегодня мы поговорим об ещё одном интересном способе генерации электроэнергии — концентрационном, где электроэнергию можно извлекать за счёт разницы в концентрации ионов...
PG_EXPECTO v.7: Анализ инцидента производительности высоконагруженной СУБД (CPU=200 RAM=1TB)
Telegram: @pg_expectoMAX: PG_EXPECTOGitHub - Комплекс pg_expecto для статистического анализа производительности и нагрузочного тестирования СУБД PostgreSQLGitFlic - pg...
Еще материалы от Habr
Свежие публикации и продолжение темы от той же редакции.
5 вопросов об английской грамматике, которые вы стеснялись задать
Многим из нас не повезло с учителем английского. В итоге за годы изучения с нами остались не язык, а барьер, страх и ощущение, что «я не языковой человек».Нет, в этой статье я н...
Системы мониторинга без процессов — ресурсы на ветер, или Как получить максимум эффективности от использования SIEM
Чтобы автоматизированно проверять и централизованно обрабатывать огромное количество событий о происходящем в инфраструктуре, используется SIEM –– класс решений информационной б...
Концентрационный генератор/источник питания
StarsendСегодня мы поговорим об ещё одном интересном способе генерации электроэнергии — концентрационном, где электроэнергию можно извлекать за счёт разницы в концентрации ионов...
PG_EXPECTO v.7: Анализ инцидента производительности высоконагруженной СУБД (CPU=200 RAM=1TB)
Telegram: @pg_expectoMAX: PG_EXPECTOGitHub - Комплекс pg_expecto для статистического анализа производительности и нагрузочного тестирования СУБД PostgreSQLGitFlic - pg...