Сегодня 16 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-модель Claude Fable 5 отказывается отвечать на элементарные вопросы по биологии — но так и задумано

Anthropic выпустила свою самую мощную модель искусственного интеллекта Claude Fable 5 в широкий доступ. Компания рассказала о её значительных познаниях в биологии, но модель отказалась отвечать на вопросы в этой области, даже те, с которым смог бы справиться даже школьник. На них отвечает Claude Opus 4.8 — предыдущая флагманская модель.

 Источник изображения: anthropic.com

Источник изображения: anthropic.com

Дело не в том, что Fable — модель класса Mythos — не знает ответов, а в том, что Anthropic намеренно пока не позволяет этого делать. Она отказывается отвечать даже на вопросы, которые представляются очень далёкими от каких-либо угроз, насколько это возможно, сообщает The Verge. Не даёт ответов на запросы вроде «расскажи о клеточных мембранах» или «что такое митохондрии», отказывается объяснять, «что такое прионы» или «как работают мРНК-вакцины». Ограничения касаются также обычных и довольно безобидных медицинских вопросов, в том числе «что вызывает сенную лихорадку», как работают лекарства от астмы; модель не объясняет, как возникает толерантность к антибиотикам, не говорит, что такое вирус Эбола, и как он распространяется. Она всё-таки ответила на вопросы «что такое рак» и «что такое ДНК». При этом модель Opus 4.8, как правило, даёт адекватные ответы на эти вопросы.

В Anthropic признали, что такие строгие фильтры — преднамеренный выбор компании, потому что она пытается не допустить создания биологического оружия. «С запуском Claude Fable 5, нашей первой модели класса Mythos, мы решили, что модели теперь обладают большей способностью решать действительные научные задачи, и что злоумышленники способны использовать наши модели для крайне рискованных биологических исследований. Мы всегда подключали классификаторы, чтобы блокировать помощь наших моделей в запросах, связанных с биологическим оружием. Чтобы Fable 5 работала в безопасном режиме, мы сочли необходимым чрезмерный консерватизм в отношении наших мер защиты, чтобы они блокировали большинство запросов, связанных с биологической работой», — заявили в Anthropic.

Ранее компания сформулировала, в каких областях будут ограничиваться ответы модели Fable в целях безопасности: химия, биология, кибербезопасность и дистилляция — обучение производных моделей ИИ. Впрочем, на практике она охотнее давала ответы на вопросы по химии: предоставила обзор тротила, но не раскрыла, как его изготовить. Рассказала об использовании хлора как химического оружия, о распространённых угрозах паролей, о ядерном синтезе и делении, а также объяснила, как защитить iPhone от хакеров. Но переадресовала Opus вопрос о ядовитом газе зарине. И обе модели отказались ответить, «как изготовить сибирскую язву» — чат-бот Claude полностью приостановил чат, и это было логично.

«Мы пошли на это компромисс, чтобы дать клиентам возможность быстрее воспользоваться моделью без рисков. Мы намерены сделать модели класса Mythos доступными для широкого сообщества биологов и специалистов в области биологических наук без этих средств защиты, чтобы эти способности использовались для ускорения биомедицинских исследований и разработки лекарств», — добавили в Anthropic.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
WhatsApp добавит в веб-версию мессенджера голосовые и видеозвонки в групповых чатах 32 мин.
Google сама показала, что новая Gemini 3.5 Flash не лучшая ИИ-модель для Android-разработки 33 мин.
Alibaba представила первый набор LLM для «воплощённого ИИ» — Qwen Robot Suite 45 мин.
ФБР устранило китайский фишинговый сервис Outsider, генерировавший мошеннические сайты с помощью ИИ 48 мин.
Одна голова хорошо, а две лучше: руководитель Treyarch покинул студию после 22 лет работы над Call of Duty 2 ч.
В «Яндекс Картах» появился надёжный пошаговый навигатор при нестабильном сигнале GPS 3 ч.
Teams научили отслеживать сотрудников через корпоративный Wi-Fi — Microsoft уверяет, что это не слежка 3 ч.
Double Fine, Ninja Theory и другие студии Xbox тоже оказались под угрозой закрытия, но продолжают борьбу за выживание 3 ч.
Индия заблокировала Telegram перед пересдачей аналога ЕГЭ, опасаясь утечек заданий 4 ч.
Fox купила конкурента Netflix за $22 млрд 4 ч.
Китайские инженеры заявили, что их лунный модуль многократно надёжнее американских аналогов, которые ещё не построены 28 мин.
Представлена игровая клавиатура Logitech G316 X 98 с горячей заменой клавиш и частотой опроса 8 кГц 42 мин.
Акции SpaceX взлетели на 50 % всего за три торговые сессии 50 мин.
Турция вложится в ИИ, ЦОД, облака и обучение в рамках программы AI Action Plan 2 ч.
Документы раскрыли характеристики Tesla Cybercab — роботакси проедет до 669 км на одной зарядке 3 ч.
Австралийская SharonAI Holdings купит 40 тыс. ускорителей GB300 и поделится с NVIDIA выручкой от ИИ-облака 3 ч.
TSMC получила от IMEC техпроцесс для массового выпуска 2D-транзисторов на 300-мм пластинах 3 ч.
Японская Nidec разработала 300-кВт внутристоечный CDU 3 ч.
Представлен смартфон Honor X70 Pro Max — большой экран, защита IP69K и батарея на 8560 мА·ч за $295 3 ч.
Qualcomm готовится к миру без приложений и разрабатывает более 40 ИИ-устройств 3 ч.