Новый взгляд на взаимодействие зрения и языка в ИИ: систематизированный обзор мультимодальных моделей
Авторы представили систематический обзор объединения зрительного восприятия и языкового мышления в MLLM, ввели пятиэтапную таксономию и обозначили перспективы создания унифицированного мультимодального интеллекта.
читать →
0 просмотра