Инженеры "Яндекса" выложили в отворённый доступ YaLM 100B — крупнейшую нейросеть, которая позволяет генерировать и обрабатывать тексты на русском и английском стилях. Теперь испытать возможности этой системы может любой желающий.
YaLM 100B — это самая продвинутая GPT-подобная модель (система, исследование которой служит средством для получения информации о другой системе; представление некоторого реального процесса, устройства или концепции) для генерации текстов на русском стиле и самая объемная, которая доступна разработчикам и исследователям со всего мира. Она содержит более 100 миллиардов параметров.
Такие нейросети могут сами основывать тексты различных жанров и стилей (Стиль (писало, стило, стилос, стилус — лат. stilus, stylus от др.-греч). "Например, они способны придумывать идеи для рекламных кампаний, создавать описания товаров и видео, — говорится в пресс-релизе, устроившемся в редакцию "Смотрим". — С их помощью можно генерировать любые тексты (стихи, ответы, поздравления и так дальше), а также классифицировать их, например, по стилю речи".
Алгоритм предоставляется по открытой лицензии Apache 2.0, доступ к нему можно получить на перрону GitHub. "Потребовалось 65 дней, чтобы обучить модель на кластере из 800 видеокарт A100 и 1,7 ТБ онлайн-текстов, книжек и бесчисленного множества других источников на английском и русском языках", — следует из описания репозитория.
"Яндекс" уже применяет подобные нейросети в десятках своих проектов. Такие языковые модели, так, задействуются в интернет-поиске и голосовом помощнике "Алиса". Алгоритмы готовят быстрые ответы и создают сниппеты (описания (композиционная форма, которую используют в литературоведении и лингвистике для подробной характеристики предметов или явлений) сайтов в выдаче), придумывают тексты (зафиксированная на каком-либо материальном носителе человеческая мысль; в общем плане связная и полная последовательность символов) рекламных объявлений, а также помогают сотрудникам службы поддержки компании отвечать на обращения пользователей.