Сегодня 16 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Anthropic извинилась за непрозрачность в вопросах безопасности Claude Fable 5

Anthropic принесла извинения, что установила скрытые ограничения на работу своей модели искусственного интеллекта Claude Fable 5, которые мешают деятельности исследователей, как, впрочем, и конкурентов, разрабатывающим собственные системы. Компания пообещала сменить курс и стать более прозрачной в вопросах ограничений, даже если Fable будет отклонять больше запросов.

 Источник изображения: anthropic.com

Источник изображения: anthropic.com

Claude Fable 5 стала первой ИИ-моделью класса Mythos — Anthropic охарактеризовала их как слишком опасные для выпуска в открытый доступ. Разработчик заявил, что устранил некоторые из этих угроз, запретив модели отвечать на запросы по некоторым темам «высокого риска». Это сделано также для защиты от дистилляции — метода обучения меньших моделей ИИ на ответах крупных. При выявлении попыток дистилляции модель, отметили в Anthropic, ранее намеренно давала ответы более низкого качества. И пользователи же не знали о срабатывании средства защиты или о понижении качества ответов.

Теперь же компания решила изменить свой подход: при обнаружении попыток дистилляции ответы будут перенаправляться на Claude Opus 4.8 — предыдущую флагманскую модель компании, — и пользователь каждый раз будет получать соответствующее уведомление. Аналогичная схема действительна и при ответах на вопросы в областях высокого риска: таких как биология, химия и кибербезопасность. Если соответствующие запросы не блокируются полностью, то они делегируются Opus 4.8.

«Видимые меры можно проверить, поэтому они должны быть надёжными, а на их правильную настройку требуется время. Невидимые можно нацелить более узко, что позволяет нам быстро выпускать продукт с очень небольшим числом ложных срабатываний. По этой причине мы выбрали невидимые меры защиты — и этот компромисс был неправильным. Вы должны иметь представление о мерах защиты, которые мы используем, и о том, почему. Приносим извинения за то, что не смогли найти правильный баланс», — заявили в Anthropic.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Пользователь Claude обратился в суд на Anthropic из-за быстрого исчерпания лимитов платных тарифов 3 ч.
Новая статья: Обзор смартфона Xiaomi 17 Ultra: человечный камерофон с настоящим зумом 8 ч.
Midea запустила акцию «Сорви летний куш» с розыгрышем поездки в Китай и других призов 12 ч.
Nvidia тоже залезет в долги ради финансирования ИИ — Хуанг готовит облигации на $20 млрд 13 ч.
SpaceX с помощью IPO привлекла $85,7 млрд — сумма выросла на 14 % за счёт «зелёного башмака» 13 ч.
Ирано-американская мирная сделка запустила рост акций Samsung, SK hynix и других IT-компаний из Азии 14 ч.
МТС вложит 1 млрд рублей в модернизацию ядра сети ШПД и установку маршрутизаторов собственной разработки 14 ч.
Индийские клиенты Google Cloud уже неделю мирятся со сбоями сети из-за пожара в ЦОД в Дели 14 ч.
MSI оценила портативную приставку Claw 8 EX AI+ на чипе Arc G3 Extreme в $1799 15 ч.
Google Chromebook исполнилось 15 лет — массовыми хромбуки не стали, но завоевали популярность в образовании 15 ч.