Владимир Овчинский

Технологии будущего против криминала


Скачать книгу

отмечают исследователи «Больших данных», сам термин «Большие данные» (Big Data) не имеет общепринятого определения даже в индустрии информационных технологий. Наиболее распространенным является раскрытие феномена «Больших данных» через указание проблем, с которыми приходится сталкиваться на современном этапе развития технологий при обработке информации. Исходя из этого «Большие данные» определяются посредством указания следующих основных характеристик: 1) большого объема, 2) разнообразия данных и 3) высокой скорости их изменения.

      Согласно указанному подходу, помимо собственно обработки больших объемов данных проблема, решаемая посредством Big Data, состоит также и в том, что большая часть потенциально ценной информации представлена в неструктурированном виде, то есть не упорядочена и содержится в различных форматах, в отличие от данных, которые наполняют традиционные базы данных. Огромные массивы разнообразной информации, например, информация с форумов и социальных сетей, видеозаписи, текстовые документы, лог-файлы или, например, данные о трафике и соединениях абонентов, содержатся в различных источниках, нередко за пределами организации. В результате правоохранительные структуры могут иметь доступ к огромному объему данных из внутренних и внешних источников и не иметь необходимых инструментов, чтобы осуществить их совместную обработку, выявив определенные взаимосвязи и сделать на их основе значимые выводы. Технологии «Больших данных» позволяют решить эту проблему, связав воедино разнородные данные.

      Другой признак «Больших данных» состоит в том, что обрабатываемая с использованием указанной технологии информация обновляется быстро (например, «потоковые данные»1, при этом необходимо принимать решения на основании их оперативного анализа.

      Анализируя различные зарубежные подходы, российский исследователь А.И. Савельев определяет «Большие данные» как совокупность инструментов и методов обработки структурированных и неструктурированных данных огромных объемов из различных источников, подверженных постоянным обновлениям, в целях повышения качества принятия управленческих решений, создания новых продуктов.

      Опыт сотрудничества IBM с правоохранительными органами свидетельствует о том, что требуются: во-первых, консолидация разрозненных источников информации в единое хранилище данных; во-вторых, применение специального ПО, позволяющего выявлять полезную информацию из разрозненных и неполных документированных данных, а также из несвязанных событий; в-третьих, использование специализированных, программно-аппаратных решений, максимально ускоряющих работу, и принятие решений при обработке огромных объемов данных структурированной и неструктурированной информации.

      Например, с этой целью в Нью-Йорке в 2007 г. было принято решение о создании централизованного операционного центра общественной безопасности. Было интегрировано более 100 разрозненных источников