Ru En
Ученые разработали программу для определения эмоциональной окраски текстов СМИ

Ученые разработали программу для определения эмоциональной окраски текстов СМИ

16.12.2022

Специалисты Национального исследовательского Томского политехнического университета создали систему, которая при помощи технологий искусственного интеллекта (ИИ) автоматически распознает тональность текстов в медиа. Разработка позволит усовершенствовать системы мониторинга медиаресурсов, которые, в частности, используют социологи.

В основе программы - набор сверточных нейронных сетей (CNN) и сетей долгой краткосрочной памяти (LSTM), на основе которых система классифицирует тексты. Авторы работы "обучили" программу на двух базах данных для английского и русского языков. Отечественный набор обучающей и тестовой выборок содержал 10 тысяч фрагментов новостных статей.

"Русскоязычная версия программы позволяет распознавать три класса тональности текстов - негативную, нейтральную и позитивную степень эмоциональной окраски. Результат точности классификации превышает 70%. Программа может использоваться для анализа текстов в средствах массовой информации в качестве дополнения к существующим метрикам оценки", - сказал руководитель проекта, профессор ТПУ Владимир Спицын.

Версия программы, предназначенная для работы с английским языком, позволяет распознавать уже не три, а пять классов тональности текстов - негативную, нейтрально-негативную, нейтральную, нейтрально-позитивную и позитивную степень эмоциональной окраски. Точность классификации в этом случае также превышает 70%, отметил ученый.

"Подобные решения позволят расширить возможности для анализа медиаресурсов, которые сегодня применяются социологами, учеными и аналитиками, специализирующимися на анализе информации из СМИ. Новый инструмент позволит создавать более точную картину влияния тех или иных событий на медиапространство, а также проводить более глубокий анализ контента в социальных сетях", - пояснил представитель ТПУ.


Ученые разработали программу для определения эмоциональной окраски текстов СМИ