Сегодня 16 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Google представила очень быструю открытую ИИ-модель DiffusionGemma, которая принципиально отличается от других

Google выпустила экспериментальную модель искусственного интеллекта DiffusionGemma, в которой при генерации текста используется принципиально иной подход по сравнению с моделями, на которых работает большинство современных чат-ботов.

 Источник изображений: blog.google

Источник изображений: blog.google

Вместо того, чтобы генерировать слово за словом в строгой последовательности, она создаёт за один раз целый блок текста и продолжает его дорабатывать, пока он не станет читаемым. Основное преимущество DiffusionGemma в том, что приоритетом для неё является скорость, даже за счёт некоторой потери качества конечного результата. Модель опубликована с открытым исходным кодом под лицензией Apache 2.0 и ориентирована на разработчиков и исследователей, а не обычных пользователей.

Ответ на запрос пользователей она начинает с набора случайных токенов — шумного, нечитаемого текста, который за несколько проходов превращается в осмысленный. Это позволяет существенно увеличить скорость по сравнению с традиционными вариантами: на ускорителе Nvidia H100 генерируются по 1000 токенов в секунду, а на потребительской видеокарте — по 700 токенов в секунду.

Google DiffusionGemma имеет архитектуру «смеси экспертов» (Mixture-of-Experts), то есть при размере 26 млрд параметров одновременно активными остаются лишь 3,8 млрд; для работы модели требуются около 18 Гбайт видеопамяти. За один шаг она генерирует 256 токенов, и все они взаимодействуют внутри блока. Это даёт модели глобальное представление о результатах, а не строго линейное.

Она хорошо подходит для задач на структурирование или выполнение правил: её можно использовать для заполнения недостающих фрагментов кода, работы с форматами вроде JSON, решения сложных логических задач и обработки математических закономерностей. Видя блок токенов сразу, она может исправлять противоречия в одном цикле генерации, а не ждать, когда ошибку исправит более поздний токен.

Но есть у неё существенный минус. Ответы Google DiffusionGemma по качеству уступают ответам Gemma 4 – пользователь получает скорость в ущерб точности. Поэтому Google позиционирует проект как экспериментальный — он разработан для сценариев, при которых скорость ответа важнее совершенства. Например, для работы приложений ИИ в реальном времени, для встроенных помощников по написанию текста или кода и других быстрых итеративных рабочих процессов. Заменой моделей семейств Gemma и Gemini она быть не может.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
В «Яндекс Картах» появился надёжный пошаговый навигатор при нестабильном сигнале GPS 32 мин.
Teams научили отслеживать сотрудников через корпоративный Wi-Fi — Microsoft уверяет, что это не слежка 59 мин.
Double Fine, Ninja Theory и другие студии Xbox тоже оказались под угрозой закрытия, но продолжают борьбу за выживание 2 ч.
Индия заблокировала Telegram перед пересдачей аналога ЕГЭ, опасаясь утечек заданий 2 ч.
Fox купила конкурента Netflix за $22 млрд 2 ч.
Microsoft 365 Copilot приспособили для кражи корпоративных данных в хитроумной цепочке 3 ч.
Сюжетная ролевая игра The Life and Suffering of Prince Jerian получила дату выхода, новый трейлер и демоверсию в Steam 3 ч.
Microsoft ускорит встроенные в Windows 11 приложения 3 ч.
Xbox закроет студию Compulsion Games и продолжит увольнять топ-менеджеров в рамках «перезагрузки» 3 ч.
Electronic Arts запустила сервис для рекламодателей, позволяющий интегрировать рекламу в игровой процесс 5 ч.
Турция вложится в ИИ, ЦОД, облака и обучение в рамках программы AI Action Plan 21 мин.
Документы раскрыли характеристики Tesla Cybercab — роботакси проедет до 669 км на одной зарядке 33 мин.
Австралийская SharonAI Holdings купит 40 тыс. ускорителей GB300 и поделится с NVIDIA выручкой от ИИ-облака 39 мин.
TSMC получила от IMEC техпроцесс для массового выпуска 2D-транзисторов на 300-мм пластинах 40 мин.
Японская Nidec разработала 300-кВт внутристоечный CDU 46 мин.
Представлен смартфон Honor X70 Pro Max — большой экран, защита IP69K и батарея на 8560 мА·ч за $295 54 мин.
Qualcomm готовится к миру без приложений и разрабатывает более 40 ИИ-устройств 2 ч.
Чистые убытки OpenAI выросли в восемь раз в прошлом году и достигли $38,5 млрд 2 ч.
DJI представила карманную камеру Osmo Pocket 4P с двумя объективами, «киношными» функциями Ronin и стабилизатором 2 ч.
IMEC создала первый квантовый чип на High-NA EUV — квантовые компьютеры готовят к массовому производству 3 ч.