DeepDigest
← все источники

Google Research

2 статьи на русском

Google Research

Ускорение Gemini Nano на Pixel с мультитокеновым прогнозированием

Google представила метод ускорения моделей Gemini Nano на устройствах Pixel — адаптацию прогнозирования с использованием нескольких токенов (MTP) к «замороженным» моделям Gemini Nano v3. Новая архитектура устраняет «узкое место» авторегрессивной генерации текста и оптимизирует использование памяти на мобильных устройствах. В экспериментах на Pixel 9 скорость работы выросла на 50 % и более.

LLM
читать → 1 просмотр
Google Research

Логические рассуждения в языковых моделях: как они помогают вспомнить факты

Учёные исследовали, как логические рассуждения помогают языковым моделям запоминать факты. Выявлены два механизма: эффект буфера вычислений и фактологический прайминг. Эксперименты с разными моделями и наборами данных подтвердили эффективность подхода, но также обозначили риски, связанные с возможными ошибками в генерируемых фактах.

читать → 4 просмотра