ВКонтакте создала нейросеть для генерации новостных заголовков

ВКонтакте создала нейросеть для генерации новостных заголовков

Команда прикладных исследований ВКонтакте разработала нейросеть, которая создаёт новостные заголовки на русском и английском языках. Об этом сообщила пресс-служба компании.

Презентация нейросети состоялась ранее в этом месяце на Европейской конференции по информационному поиску (European Conference On Information Retrieval 2019) в Кёльне.

Заголовок генерируется на основе текста новости. Модель обрабатывает его и формулирует заголовок из фрагментов слов — так она добивается правильных падежей и склонений и в итоге получает связное предложение.

Чтобы создать нейросеть, разработчики использовали архитектуру Universal Transformer и технику компрессии данных BPE (Byte Pair Encoding) — они обычно применяются в машинном переводе и позволяют ограничиться небольшим словарём для генерации заголовков. Для обучения нейросети использовались тексты агентства «РИА Новости» и издания The New York Times.

При этом сотрудники ВКонтакте – первые, кто использовал BPE для модели суммаризации текста, а также первые, кто обучал такую модель на русскоязычных новостных материалах.

Чтобы проверить качество работы модели, разработчики провели отдельное исследование, в котором показывали добровольцам новость и два заголовка к ней. По словам опрошенных, в 45% случаев машинный заголовок был не хуже оригинального, а в 15% — даже лучше.

Даниил Гаврилов, разработчик-исследователь ВКонтакте:

«Наша и другие разработки помогут быстро выделять главную мысль из длинных текстов — это действительно полезно, ведь информации вокруг нас уже много и становится только больше. Использоваться технология может для самых разных задач, связанных с удобством потребления контента — например, ВКонтакте её потенциально можно применить для умного сокращения постов в ленте пользователя или для создания новостных дайджестов».

Подробное описание того, как создавалась эта модель, доступно в статье (на английском языке).

Команда прикладных исследований ВКонтакте была создана в 2018 году. Она занимается исследованиями и разработкой методов машинного обучения и искусственного интеллекта, а также решает широкий спектр задач: от классификации видео до машинного перевода.

Похожие статьи:

Новости партнеров