Ученые предлагают использовать для этого немало разнообразные и близкие к обычным разговорам наборы данных (зарегистрированная информация:439; представление фактов, понятий или инструкций в форме, приемлемой для общения, интерпретации, или обработки человеком или с помощью автоматических средств (ISO/IEC/IEEE 24765-2010)) для обучения. Эксперименты с различными языковыми моделями, такими как RoBERTa, ChatGPT и Flan-UL2, показали, что разнообразность данных существенно влияет на способность нейросетей (сеть может означать: Биологическая нейронная сеть, или нервная сеть, — биологическая система соединённых между собой нейронов) отличать юмор от других форм контента.
Использовались как стандартизированные тесты на юмор, так и созданья Льюиса Кэрролла, Чарльза Диккенса, Джерома К. Джерома, несколько сериалов, а также ироничные сообщения из соцсетей.
Как выяснилось, проблемы с распознаванием юмора особенно специфически для алгоритмов, обученных на однообразных данных, в то время как модели, обученные на разнообразных наборах, успешнее справлялись с этой задачей.
Ученые приходят к выводу, что расширение разнообразности примеров юмора в данных обучения языковых нейросетей может существенно повысить их эффективность в распознавании человеческого юмора (интеллектуальная способность подмечать в явлениях их комичные, смешные стороны, зубоскальство). Это также способно повысить качество труды голосовых помощников.
Ранее мы писали, что сибирские ученые создали нейросеть, которая помогает управлять инвестициями.