Этапы работы системы «ВМ ИнфоСпектр»

Работу системы мониторинга с поступающим информационным потоком можно описать тремя ключевыми этапами.

Сбор информации

Автоматический сбор данных с наилучшей полнотой с надежных, информативных и релевантных вашим задачам источников сети Интернет от крупнейших федеральных информагентств до узкопрофильных порталов.

Фильтрация

Наша система фильтров обрабатывает тексты на 8 языках. Каждый фильтр разрабатывается командой квалифицированных лингвистов, учитывая морфологические и семантические свойства слов, а также логические и синтаксические связи слов в тексте.

Рубрикация

Клиент получает персонализированное дерево рубрик без «инфошума», кроме того, при работе в интерактивном режиме пользователь имеет доступ и к отсеянной информации в рубрике «Другие», и может использовать ее для аналитической работы.


1 этап

Сбор информации

1. Источники информации

Новостные и тематические сайты на разных языках, VK, Дзен, Телеграмм, YouTube, другие социальные сети и блоги, сайты закупок, форумы,сайты-отзывики, API и многие другие.

2. Модуль скачивания

Модуль распознает значимую информацию из заданного списка источников, при этом отсекая рекламу и лишнюю информацию, и помещает ее в папку экспорта, откуда потом ее забирает модуль фильтрации.

3. Охват информации

Индивидуальный пул релевантных источников из нашей базы, более десятка тысяч Интернет-СМИ, более миллиона аккаунтов социальных медиа-каналов, и возможность добавлять любое количество новых.


2 этап

Обработка и систематизация данных

Уникальные технологии фильтрации, основанные на прикладной лингвистике, обеспечивающие тонкую и гибкую настройку пользовательского дерева рубрик/тем, позволяющего получать всю релевантную информацию. Для создания лингвистических фильтров используется специально разработанный программный комплекс, который позволяет:

  • создавать сложную многоуровневую структуру фильтра;
  • использовать для поиска понятий информацию о морфологической форме и синтаксической функции слов (задавать слово, конкретную форму слова, словоформы, объединенные одним морфологическим признаком, и даже не связанный со словом морфологический признак);
  • использовать информацию о взаимном расположении понятий в тексте;
  • использовать информацию о фактографических объектах текста;
  • использовать словари синонимов, квазисинонимов и гиперонимов для составления фильтров;
  • использовать атрибуты – заголовок, источник, дату – для установления параметров поиска;
  • задавать любые логические связи между элементами фильтра (конъюнкция, дизъюнкция, импликация, отрицание и другие);
  • задавать относительную значимость элементов, исходя из контекста.

3 этап

Предоставление результата работы системы

В зависимости от потребностей пользователя результатом может быть индивидуально настроенный дайджест, доставляемый по расписанию, или доступ к веб-интерфейсу.

Режим дайджест:
После того, как система распределит информацию по заданным параметрам, будет произведена рассылка результатов мониторинга в виде сводки на электронную почту в удобном формате: .doc, .xls или .html. Адресаты могут получать сводку по выбранным рубрикам за выбранный интервал времени (за несколько часов, дней, недель). Документ содержит титульный лист, оглавление с группировкой по темам, новости/сообщения/статьи:
1. Распределены по темам и отсортированы по важности;
2. Значимые фрагменты выделяются цветом;
3. Содержат гиперссылку на оригинал.
При необходимости есть возможность группировать новости об одном событии, но с разных ресурсов в блоки.
Вид и содержание выходных документов настраиваются индивидуально под корпоративный стиль заказчика.

Работа в интерактивном режиме:
Пользователь получает доступ с любых устройств к аккаунту веб-версии с необходимой и уже систематизированной информацией.
Набор инструментов для работы с данными:
• Круглосуточный доступ к индивидуально классифицированной информации и ее архиву
• Систематизация сообщений по релевантности, источникам, дате
• Настройка личных профилей под разные задачи
• Полнотекстовый поиск по базе новостей
• Создание отчетов и сводок в автоматизированном и ручном режимах