Юрий Бедрин

Топ-1
+515
с 29.05.2026

t.me/machinelearning_interview - пишу про ИИ деньги и технологии. Разработчик 17 лет стажа.

69 подписчиков
0 подписок
Основатель DeepSeek перевел весь код с NVIDIA на Huawei: зачем он это сделал и что теперь будет с китайским ИИ

Лян Вэньфэнг, основатель DeepSeek, потратил месяцы на полный перенос кодовой базы DeepSeek с чипов NVIDIA на Ascend от Huawei. Не потому что нужно было что-то исправить, а потому что он решил доказать: китайский ИИ может работать без американского железа.

89
32
3
2
1
Google убивает трансформеры: RNN снова в игре благодаря кэшу памяти

Последние семь лет вся современная генеративная индустрия держится на одной архитектуре. ChatGPT, Claude, Gemini построены поверх трансформера, и за это время он стал фактическим стандартом. Но у трансформера есть встроенная проблема, о которую все спотыкаются: чтобы удержать контекст, модель сравнивает каждый токен с каждым другим. Это квадратична…

Последние семь лет вся индустрия фактически стояла на одной архитектуре. ChatGPT, Claude, Gemini, любая заметная модель внутри устроена одинаково: это трансформер. Он выиграл гонку, потому что умеет держать в памяти весь контекст и аккуратно сопоставлять каждое слово с каждым.

У этой красоты есть цена, и она квадратичная. Чтобы запомнить конт…

1
Новые защитные механизмы Anthropic для Fable 5 выглядят невероятно.

Когда модель используют для разработки frontier LLM, она, судя по всему, не просто отказывается отвечать и не предупреждает пользователя. Вместо этого она тихо снижает собственную эффективность через техники вроде модификации промпта, steering vectors и PEFT.

1
ГД ввела штрафы до ₽700'000 для сайтов, если они разрешают вход через зарубежные сервисы — например, Gmail и другие почты.

Авторизация на российских сайтах должна работать через телефон, Госуслуги, биометрию или российские сервисы.

3

Anthropic выпустила исследование с простым, но неудобным вопросом: почему ИИ-агенты так быстро прокачались в программировании и при этом до сих пор спотыкаются в биологии. Ответ оказался не про интеллект моделей, а про инфраструктуру, в которой им приходится работать.

Авторы приводят наглядную аналогию. Софт изначально строился под машины, то…

Команда Tencent Hunyuan показала UniRL, инфраструктуру для обучения с подкреплением, которая работает поверх unified multimodal моделей. Главная фишка в том, что один и тот же цикл пост-тренинга крутится для совершенно разных семейств: диффузионных и flow matching моделей, LLM и VLM, а также для гибридных авторегрессионно-диффузионных генераторов в…

Tencent выкатила UniRL: одна RL-петля на все модальности сразу
1
⚡️ Anthropic готовится представить мощнеющую коммерческую версию Mythos

Компания находится в шаге от релиза Claude Fable 5 - публичной адаптации архитектуры Mythos, которая развивается в рамках закрытого проекта Glasswing.

1
Дания включила красные фонари, и это тихая революция против светового загрязнения

В пригороде Копенгагена под названием Гладсаксе провели эксперимент, который звучит почти как сюжет научной фантастики. Часть дорог и оживлённую велодорожку перевели на уличные фонари красного спектра вместо привычного белого света. Идея простая и при этом неожиданная: сохранить нормальную видимость для людей и одновременно убрать главный раздражит…

1
Нейросеть, которая знает, чего не знает: глубокое обучение на гауссовых процессах

Обычная нейросеть выдает одно число и молчит о том, насколько она в нем уверена. Гауссов процесс работает иначе: он задает распределение над функциями, поэтому каждый прогноз идет вместе с честной оценкой неопределенности. Gaussian Process Deep Learning соединяет это свойство с умением глубоких сетей извлекать сложные признаки из данных.

По данным The Information, Google выбрала фабрики Intel для выпуска более 3 миллионов собственных TPU в 2028 году. Для Intel это крупная победа: компания становится производителем чипов для одного из самых заметных конкурентов Nvidia на рынке ускорителей.

Главная ставка Intel в контрактном производстве звучит так: стать вторым источником чипо…

2
✔ Лидеры по найму среди стартапов Кремниевой долины

Руководитель по развитию Cursor Бен Ланг опубликовал (https://x.com/benln/status/2061075154021531733) список из 35 технологических стартапов с самыми высокими темпами найма за последние 90 дней.

1
Хакеры полностью «положили» ВТБ: клиенты жалуются, что у них не работают сайт банка и мобильное приложение

Помимо этого, что еще хуже у клиентов не отображаются вклады. В ВТБ сообщили, что банк подвергся DDoS-атаке.

1