Большие данные

  1. «Большие данные (Big Data) – это технология извлечения знаний из огромного массива фактических данных разного формата с максимально возможной скоростью для поддержки принятия того или иного решения. Так называемые пять V больших данных (Volume, Variety, Velocity, Veracity, Value,  – объем, многообразие, динамика, достоверность, ценность).
  2. Взрыв интереса к большим данным обоснован тем, что вокруг нас появилось множество источников, их формирующих: пользовательские данные социальных сетей, множество сенсоров, снимающих показания в реальном времени, интернет-торговля и поисковики, анализирующие действия пользователей, мобильные устройства, сопровождающие людей круглосуточно. Данные из этих источников при правильном анализе могут помочь выявить закономерности, которые обычным способом увидеть невозможно.
  1. Обычные СУБД не справляются (или делают это очень долго - сутками) с обработкой объемов данных более 10 ТБ.
  2. Среди известных внедренных продуктов класса Big Data нет ни у кого лицензии ФСТЭК, что является важнейшим критерием для хранения персональных данных в России.

В таких странах, как Германия, Австралия, Испания, Япония, Бразилия и Пакистан технологии Больших Данных используются для решения вопросов национального масштаба. Данные технологии помогают органам государственной власти более эффективно предоставлять услуги населению, оказывать адресную социальную поддержку.
В России данные технологии стали осваивать такие государственные органы, как Пенсионный Фонд, Федеральная Налоговая Служба и Фонда обязательного медицинского страхования. Потенциал реализации проектов с использованием Big Data большой, данные технологии могли бы помочь в улучшении качества сервисов, и, как следствие, уровня жизни населения.

Рынок Big Data в России растет и будет расти на десятки процентов в год, что, очевидно, создаст точки роста для существующих и новых ИТ-компаний. Бизнес-сценарии, которые являются драйверами этого роста, существуют практически во всех отраслях. Это, например,

  • исследования приверженности потребителей к бренду,
  • профилактические ремонты оборудования,
  • поиск лекарств от рака, …,
  • рекомендации покупателям магазина,
  • мониторинг мошенничеств,
  • управление качеством стальной отливки, …
  • предсказание социального недовольства и т. д..

Наша компания работает над одной из самых перспективных технологий больших данных – Apache Hadoop. Здесь в первую очередь мы уделяем внимание такому важному компоненту, как безопасность данных, ведь они хранятся в системе на базе открытого ПО.

Среди большого количества применений больших данных мы работаем над кейсами, связанными с промышленностью и энергетикой:

- Росатом

- МОЭСК

- ОАК»