To the news

Ученые разработали программу для определения эмоциональной окраски текстов СМИ

Специалисты Национального исследовательского Томского политехнического университета создали систему, которая при помощи технологий искусственного интеллекта (ИИ) автоматически распознает тональность текстов в медиа. Разработка позволит усовершенствовать системы мониторинга медиаресурсов, которые, в частности, используют социологи.

В основе программы - набор сверточных нейронных сетей (CNN) и сетей долгой краткосрочной памяти (LSTM), на основе которых система классифицирует тексты. Авторы работы "обучили" программу на двух базах данных для английского и русского языков. Отечественный набор обучающей и тестовой выборок содержал 10 тысяч фрагментов новостных статей.

"Русскоязычная версия программы позволяет распознавать три класса тональности текстов - негативную, нейтральную и позитивную степень эмоциональной окраски. Результат точности классификации превышает 70%. Программа может использоваться для анализа текстов в средствах массовой информации в качестве дополнения к существующим метрикам оценки", - сказал руководитель проекта, профессор ТПУ Владимир Спицын.

Версия программы, предназначенная для работы с английским языком, позволяет распознавать уже не три, а пять классов тональности текстов - негативную, нейтрально-негативную, нейтральную, нейтрально-позитивную и позитивную степень эмоциональной окраски. Точность классификации в этом случае также превышает 70%, отметил ученый.

"Подобные решения позволят расширить возможности для анализа медиаресурсов, которые сегодня применяются социологами, учеными и аналитиками, специализирующимися на анализе информации из СМИ. Новый инструмент позволит создавать более точную картину влияния тех или иных событий на медиапространство, а также проводить более глубокий анализ контента в социальных сетях", - пояснил представитель ТПУ.


Ученые разработали программу для определения эмоциональной окраски текстов СМИ