Коллектив авторов

Новые медиа. Социальная теория и методология исследований


Скачать книгу

Н. Азбука медиа. М.: Издательство «Европа», 2011.

      Bolz N. Weltkommunication. Munсhen: Fink, 2001.

      Bolz N. Die Konformisten des Andersseins: Ende der Kritik. Munсhen: Fink, 1999.

      Bolz N. Das Konsumistische Manifest. Munсhen: Fink, 2002.

      Bolz N. Ratten im Labyrinth: Niklas Luhmann und die Grenzen der Aufklärung. Paderborn: Fink, 2012.

      А. Сарна

      Большие данные (big data, вялiкiя дадзеныя) – концепция (у некоторых авторов – парадигма) науки о данных, предложенная в 2008 г. Клиффордом Линчем (Clifford Lynch), редактором специального выпуска «Как могут повлиять на будущее науки технологии, открывающие возможности работы с большими объемами данных?» журнала Nature. Данная концепция предполагает одновременное использование данных не только большого объема, но также разного формата, происходящих из многих источников, которые могут находиться на удалении друг от друга. Например, «большие данные» университета могут включать административные базы данных о преподавателях; странички преподавателей на сайте университета с учебными материалами и ссылками на архивы журналов, где опубликованы их статьи, информацию о распределении нагрузки между преподавателями; странички в системах электронного обучения, информацию о проверке преподавателями студенческих работ в системе «Антиплагиат»; оценки, поставленные преподавателями студентам; оценки и отзывы студентов о работе преподавателей на сайте Рrofessorrating, а также на неофициальных студенческих сайтах и в социальных сетях, и многое другое. Некоторые из этих данных недостаточно структурированы и часто обновляются, к некоторым университет может не иметь прямого доступа. Поэтому наиболее сложным и длительным обычно становится этап подготовки данных к анализу (data processing). Сведение такого количества разнородных данных в единую базу представляется не только невозможным, но и нецелесообразным, поэтому интернет становится средой (медиумом), в которой происходит сбор, подготовка и анализ данных.

      Таким образом, «большие данные» – это метафора, которая относится не только и не столько к объему данных, сколько к доступности и сложности их структуры. Иногда для больших данных определения используют критерий четырех V: объем (volume), разнообразие (variety), скорость (velocity) и ценность (value). Появившись в качестве концепции науки о данных, большие данные также являются межотраслевой областью практической деятельности. Дрю Конвей (Drew Conwey) выделил три области компетенций, необходимых «ученому по данным» (data scientist): знание математики и статистики, наличие опыта в предметной области, а также хакерские навыки. Он также подчеркнул, что на пересечении предметной области и хакерских навыков существует «зона опасности», из чего, в частности, следует, что данные могут использоваться несанкционированно, о чем прямо говорить не принято (см. также: исследования интернета).

      Диаграмма Венна для науки о данных предложена Дрю Конвейем, 2010

      Научная проблема больших данных появилась относительно недавно, с одной стороны, в результате быстрого роста объемов цифровой информации