Сервис поставки данных

Техническое описание

 

Автоматизированный онлайн сервис поставки данных предназначен для непрерывной 24/7/365 трансляции потока цифровых данных, которые используются в различных прикладных задачах где необходим большой объем данных в реальном времени. Главное преимущество трансляции заключается в уникальности данных, объективном существовании каждого транслируемого значения и отсутствию технической возможности, а также алгоритма, позволяющих влиять на значения или предугадывать их. Это достигается благодаря использованию в архитектуре сервиса внешнего источника данных.

Подписка на использование сервиса является платной и сумма абонентской платы определяется составом информационного пакета, который Заказчик может сформировать исходя из собственных потребностей. Ниже приведены основные категории поставки данных и их описание.

 

Тип транслируемых данных

Характеристики

Индикативные котировки ценных бумаг, торгуемых на фондовом рынке Пакет услуги может включать в себя набор из 20-100 уникальных ценных бумаг, торгующихся на ММВБ или другой бирже. Коридор разброса значений составляет +/- 30 пунктов в последнем значащем разряде фактической стоимости акции.
Букмекерские коэффициенты и события LIVE Пакет включает в себя трансляцию пакета букмекерских коэффициентов на более чем 35 видов спорта, а также LIVE событий
Сентиментный анализ новостных лент Алгоритм сентиметного анализа проводит автоматическую обработку текста новости по ряду критериев для определения тональности высказывания и выставления рейтинга. Диапазон характеристик тональности, которых может быть несколько составляет диапазон 0-100.
Трансляция пакета случайных чисел и последовательностей                                  Набор сервисов для получения гарантированно случайного числа в необходимом сегменте, точности и разбросе.

 

В не зависимости от типа транслируемых данных, система обеспечивает возможность настройки плотности потока, т.е. количества значений, поступающих в 1 сек. Это преимущество обеспечивается наличием автоматического мультиплексора, генерирующего заданную плотность поставки с дополнительной функцией фильтрации для формирования необходимого типа покрытия событий на временной шкале.

Авторизованные пользователи сервиса получают поставку данных по заданному критерию и составу, а именно: состав пакета, разброс, плотность, тип покрытия на временной шкале. Для визуализации и контроля поставляемых данных разработаны виджеты, которые с легкостью интегрируются в корпоративных сайт или на отдельную web страницу.

Известно, что пакеты поставки букмекерских LIVE событий обладает периодичность в плотности. Так, например, число событий в час пик в воскресенье превышает аналогичный показатель ночью в будний день. Наш сервис отличает высокая плотность поставки событий независимо от времени суток или дня недели. Это обеспечивается внутренней методикой прогноза значений коэффициентов для обеспечения заданной плотности поставки событий. В методике применены как статические алгоритмы обработки, так и сентиметный анализ новостных тематических лент.

Несколько слов о технологии сентиметного анализа. Sentiment analysis (анализ тональности) является областью область компьютерной лингвистики, которая занимается изучением мнений и эмоций в текстовых документах. Сфера применения сентиментного анализа весьма обширна: от анализа социальных сетей и масс медиа, до машинного обучения и нейронных сетей. В основе алгоритма расчета коэффициента тональности лежит принцип построения взвешенных опорных векторов (SVM) на основе словаря. Результат работы алгоритма можно продемонстрировать на анализе новости:

В финал Гран-при по фигурному катанию были отобраны две пары из России: Евгения Тарасова и Владимир Морозов; Ксения Столбова и Федор Климов. Тарасова и Морозов по итогам шести этапов заработали 30 очков и расположились на втором месте.

Вектора слов выделены жирным шрифтом. Результат анализа составляет 68% по шкале позитивности. Один из вариантов визуализации поставляемых данных сентиментого анализа новостей спортивной тематики представлен ниже. Указанная в примере новость отображена фиолетовым символом что иллюстрирует рассчитанный коэффициент тональность на данный момент времени.

 

 

Сервис имеет API для возможности интеграции с программным обеспечением Заказчика. Технология поставки данных представляет собой json протокол. Примеры json пакетов приведены ниже.


Алгоритм авторизации клиентского ПО построен на технологии HMAC, позволяющий гарантировать то, что данные, передаваемые или хранящиеся в ненадежной среде (Internet), не были изменены посторонними лицами (атака типа «man in the middle»). Ключ для хеширования данных передается в техническую службу Заказчика после оплаты и акцепта пользовательского соглашения.

 

Все описанные в настоящем документе методики описаны и документированы. Получить доступ и ознакомиться с методиками можно по предварительному согласованию.