Обложка статьи

«ВКонтакте» сгенерирует за вас новостные заголовки

Команда прикладных исследований «ВКонтакте» разработала нейросеть, которая создает новостные заголовки на русском и английском языках. Презентация работы состоялась в апреле на Европейской конференции по информационному поиску  Кёльне. Об этом сообщает пресс-служба «ВКонтакте» со ссылкой на статью Корнельского Университета.

Для создания нейросети разработчики использовали архитектуру Universal Transformer и технику компрессии данных BPE (Byte Pair Encoding), которую обычно применяют в машинном переводе. Для обучения нейросети использовались тексты агентства «РИА Новости» и издания The New York Times. Модель обрабатывает его и формулирует заголовок из фрагментов слов — так она добивается правильных падежей и склонений и в итоге получает связное предложение.

По показателям нейросеть разработчиков «ВКонтакте» работает лучше, чем другие существующие подходы. Однако стандартные метрики не могут корректно оценить случаи, когда автоматические и оригинальные заголовки полностью отличаются, но смысл новости передан верно. Разработчики также провели дополнительное исследование, в котором показывали добровольцам новость и два заголовка к ней. По словам опрошенных, в 45% случаев машинный заголовок был не хуже оригинального, а в 15% — даже лучше.

Эта разработка поможет быстро выделять главную мысль из длинных текстов и можно применить для умного сокращения постов в ленте пользователя или для создания новостных дайджестов.

30 апреля 2019

Еще почитать по теме

«Мегабайт» поздравляет «ВКонтакте» в прямом эфире
10 октября 2016 года «ВКонтакте» празднуется десятилетие. 
«Мегабайт» поздравляет «ВКонтакте» в прямом эфире
10 октября 2016 года «ВКонтакте» празднуется десятилетие.