«ВКонтакте» сгенерирует за вас новостные заголовки
Команда прикладных исследований «ВКонтакте» разработала нейросеть, которая создает новостные заголовки на русском и английском языках. Презентация работы состоялась в апреле на Европейской конференции по информационному поиску Кёльне. Об этом сообщает пресс-служба «ВКонтакте» со ссылкой на статью Корнельского Университета.
Для создания нейросети разработчики использовали архитектуру Universal Transformer и технику компрессии данных BPE (Byte Pair Encoding), которую обычно применяют в машинном переводе. Для обучения нейросети использовались тексты агентства «РИА Новости» и издания The New York Times. Модель обрабатывает его и формулирует заголовок из фрагментов слов — так она добивается правильных падежей и склонений и в итоге получает связное предложение.
По показателям нейросеть разработчиков «ВКонтакте» работает лучше, чем другие существующие подходы. Однако стандартные метрики не могут корректно оценить случаи, когда автоматические и оригинальные заголовки полностью отличаются, но смысл новости передан верно. Разработчики также провели дополнительное исследование, в котором показывали добровольцам новость и два заголовка к ней. По словам опрошенных, в 45% случаев машинный заголовок был не хуже оригинального, а в 15% — даже лучше.
Эта разработка поможет быстро выделять главную мысль из длинных текстов и можно применить для умного сокращения постов в ленте пользователя или для создания новостных дайджестов.