DeepDigest
arXiv cs.CL · · ~1 мин

ИИ для языков с ограниченными ресурсами: новый подход на основе WordNet

Разработан метод создания диалоговых ИИ‑систем для языков с ограниченными ресурсами на базе WordNet: преобразовали Hindi WordNet в 1,25 млн пар «инструкция‑ответ», настроили языковую модель — эффективность достигла 91,0.

ИИ для языков с ограниченными ресурсами: новый подход на основе WordNet

Исследователи разработали способ создания специализированных диалоговых систем для языков, у которых мало учебных материалов. Они взяли лексическую базу данных Hindi WordNet и превратили её в 1,25 миллиона пар «инструкция-ответ». Затем настроили языковую модель с 12 млрд параметров, используя экономный метод LoRa с 4‑битным квантованием. Тест чат‑бота для изучения хинди показал, что такие системы эффективнее обычных — их педагогическая эффективность достигла 91,0 против 79,4–83,6 у моделей общего назначения. Метод может стать основой для создания ИИ‑систем на сотнях других языков, использующих ресурсы WordNet.

Источник: arXiv cs.CL
1 просмотров
// поделиться Telegram VK