News Grower

Независимое покрытие AI, стартапов и технологий.

Модели LLM их проблема правдоподобных ответов

Добрый день, это моя первая статья на Хабре, прошу не судить.Я хочу рассказать вам немного о моём исследовании и то как стоит честно относиться к LLM моделям, так как вы скорее всего знаете, что такое LLM модель не будем терять времени на её определение дав...

Добрый день, это моя первая статья на Хабре, прошу не судить.Я хочу рассказать вам немного о моём исследовании и то как стоит честно относиться к LLM моделям, так как вы скорее всего знаете, что такое LLM модель не будем терять времени на её определение давайте перейдём к сути моей работы: LLM не дают гарантии правильности ответа особенно операций с большим количеством шагов и формальным рассуждением, даже когда ответ правдоподобный или оказывается верный. (Вы же все видели дисклеймер ChatGPT can make mistakes.Check important info)Начнём с самого начала 4 сентября 2025 года прошло исследование о галлюцинациях в моделях (в котором участвовали инженеры OpenAI), и одно из утверждений было, что даже при наличии безошибочных обучающих данных статистическая целевая функция, минимизируемая в процессе предварительного обучения, приведет к языковой модели, генерирующей ошибки, почему же это так потому, что сама природа LLM моделей вероятностная.Но так как мы живём в мире где мы внедряем системы LLM повсюду появляется закономерный вопрос как же верифицировать LLM и тут у инженеров есть готовый по их мнению инструментарий, который массово внедряется:

Связанные теги

Компании и люди

Линия сюжета

Продолжить следить за темой

Переходите к связанным материалам, страницам сущностей и активным линиям сюжета.

Движки для дронов, конопля в Бразилии и прочая ИИ-стартапщина на «Битве Единорогов»

Движки для дронов, конопля в Бразилии и прочая ИИ-стартапщина на «Битве Единорогов»

Вчера меня занесло на мероприятие под названием "Битва Единорогов" в офисе Инновационного Хаба Шелкового Пути, через дорогу от Стенфорда. Офис состоит из двух комнат, но согласн...

INFOSTART FRIENDS REGATA — неделя, которая меняет привычный ритм работы и общения

INFOSTART FRIENDS REGATA — неделя, которая меняет привычный ритм работы и общения

На INFOSTART FRIENDS REGATA дни проходят в совершенно новой и непривычной атмосфере. Сначала легкая йога или пешая прогулка. Затем завтрак и живое общение, как продолжение разго...

Почему сильный разработчик не всегда становится сильным тимлидом — и что с этим делать

Почему сильный разработчик не всегда становится сильным тимлидом — и что с этим делать

Вы наверняка встречали задачки на логику: «Все кошки — животные. Это животное — кошка. Значит ли это, что все животные — кошки?» Нет. С тимлидами та же история: не каждый сильны...

Мне всю жизнь говорили, что я умный. А потом в 34 попробовал своё дело…

Мне всю жизнь говорили, что я умный. А потом в 34 попробовал своё дело…

В предыдущем посте я разбирал механику прокрастинации умных людей — с исследованиями, формулами и ссылками на мета-анализы. Этот пост другой. Он от первого лица. И он про то, ка...

Soft skills в IT: почему я против?

Soft skills в IT: почему я против?

Сегодня софт скиллы в IT превратились в удобный инструмент для манипуляций и газлайтинга. Под видом адаптивности и эмпатии нам продают некомпетентность менеджмента и отсутствие ...

[Перевод] 18 месяцев до банкротства OpenAI? Прогноз NYT звучит всё правдоподобнее

[Перевод] 18 месяцев до банкротства OpenAI? Прогноз NYT звучит всё правдоподобнее

31 марта OpenAI объявила о раунде финансирования с оценкой $852 миллиарда. На следующий день, 1 апреля, Bloomberg вышел с заголовком: «OpenAI теряет популярность среди вторичных...

Рекламный слот

Встроенный блок в статье

Зарезервированный партнерский слот для релевантных инструментов, сервисов и аккуратных редакционных интеграций.

Партнерский слот

Похожие статьи

Еще материалы, которые пересекаются по тегам, источнику или категории.

Движки для дронов, конопля в Бразилии и прочая ИИ-стартапщина на «Битве Единорогов»

Движки для дронов, конопля в Бразилии и прочая ИИ-стартапщина на «Битве Единорогов»

Вчера меня занесло на мероприятие под названием "Битва Единорогов" в офисе Инновационного Хаба Шелкового Пути, через дорогу от Стенфорда. Офис состоит из двух комнат, но согласн...

INFOSTART FRIENDS REGATA — неделя, которая меняет привычный ритм работы и общения

INFOSTART FRIENDS REGATA — неделя, которая меняет привычный ритм работы и общения

На INFOSTART FRIENDS REGATA дни проходят в совершенно новой и непривычной атмосфере. Сначала легкая йога или пешая прогулка. Затем завтрак и живое общение, как продолжение разго...

Почему сильный разработчик не всегда становится сильным тимлидом — и что с этим делать

Почему сильный разработчик не всегда становится сильным тимлидом — и что с этим делать

Вы наверняка встречали задачки на логику: «Все кошки — животные. Это животное — кошка. Значит ли это, что все животные — кошки?» Нет. С тимлидами та же история: не каждый сильны...

Мне всю жизнь говорили, что я умный. А потом в 34 попробовал своё дело…

Мне всю жизнь говорили, что я умный. А потом в 34 попробовал своё дело…

В предыдущем посте я разбирал механику прокрастинации умных людей — с исследованиями, формулами и ссылками на мета-анализы. Этот пост другой. Он от первого лица. И он про то, ка...

Еще материалы от Habr

Свежие публикации и продолжение темы от той же редакции.

Открыть страницу источника
Движки для дронов, конопля в Бразилии и прочая ИИ-стартапщина на «Битве Единорогов»

Движки для дронов, конопля в Бразилии и прочая ИИ-стартапщина на «Битве Единорогов»

Вчера меня занесло на мероприятие под названием "Битва Единорогов" в офисе Инновационного Хаба Шелкового Пути, через дорогу от Стенфорда. Офис состоит из двух комнат, но согласн...

INFOSTART FRIENDS REGATA — неделя, которая меняет привычный ритм работы и общения

INFOSTART FRIENDS REGATA — неделя, которая меняет привычный ритм работы и общения

На INFOSTART FRIENDS REGATA дни проходят в совершенно новой и непривычной атмосфере. Сначала легкая йога или пешая прогулка. Затем завтрак и живое общение, как продолжение разго...

Почему сильный разработчик не всегда становится сильным тимлидом — и что с этим делать

Почему сильный разработчик не всегда становится сильным тимлидом — и что с этим делать

Вы наверняка встречали задачки на логику: «Все кошки — животные. Это животное — кошка. Значит ли это, что все животные — кошки?» Нет. С тимлидами та же история: не каждый сильны...

Мне всю жизнь говорили, что я умный. А потом в 34 попробовал своё дело…

Мне всю жизнь говорили, что я умный. А потом в 34 попробовал своё дело…

В предыдущем посте я разбирал механику прокрастинации умных людей — с исследованиями, формулами и ссылками на мета-анализы. Этот пост другой. Он от первого лица. И он про то, ка...