DeepDigest
arXiv cs.CV · · ~1 мин

Новый метод настройки визуальных моделей: гибридное слияние данных даёт лучший результат

Разработан метод гибридного слияния данных для настройки моделей зрения, который эффективнее прежних подходов — протестирован на 34 наборах данных, показывает лучшее соотношение точности и задержки.

Новый метод настройки визуальных моделей: гибридное слияние данных даёт лучший результат

Исследователи предложили новый подход к настройке моделей компьютерного зрения — он позволяет эффективнее сочетать текстовые подсказки с данными изображений. Вместо стандартной схемы слияния данных авторы протестировали дополнительные варианты: аффинное преобразование и перекрёстное внимание. Метод проверили на 34 наборах данных (VTAB-1k, FGVC, HTA) — он показал лучшие результаты по сравнению с существующими подходами (например, VPT-Deep). Благодаря оптимальному соотношению точности и скорости работы метод может ускорить адаптацию визуальных моделей под разные задачи.

Источник: arXiv cs.CV
1 просмотров
// поделиться Telegram VK