Александр Юрьевич Чесалов

Глоссариум по цифровой экономике. 1500 терминов и определений


Скачать книгу

(Data) Для социальных наук данные обычно представляют собой числовые файлы, полученные из методологий социальных исследований или административных записей, из которых производится статистика99.

      Данные ограниченного использования (Restricted-use data) – это данные, которые содержат конфиденциальную информацию (обычно о людях), которая может позволить идентифицировать людей. Наличие конфиденциальной информации в депонированном цифровом контенте представляет собой проблему управления для долгосрочного хранения, чтобы гарантировать, что требования к архивному хранилищу для достижения распределенной избыточности учитывают, например, требования конфиденциальности100.

      Данные тестирования (Testing Data) – подмножество доступных данных, выбранных специалистом по данным для этапа тестирования разработки модели.

      Двоичное число (Binary number) – это число, записанное в двоичной системе счисления, в которой используются только нули и единицы. Пример: Десятичное число 7 в двоичной системе счисления: 111101.

      Двоичный формат (Binary format) – это любой формат файла, в котором информация закодирована в каком-либо формате, отличном от стандартной схемы кодирования символов. Файл, записанный в двоичном формате, содержит информацию, которая не отображается в виде символов. Программное обеспечение, способное понимать конкретный метод кодирования информации в двоичном формате, должно использоваться для интерпретации информации в файле в двоичном формате. Двоичные форматы часто используются для хранения большего количества информации в меньшем объеме, чем это возможно в файле символьного формата. Их также можно быстрее искать и анализировать с помощью соответствующего программного обеспечения. Файл, записанный в двоичном формате, может хранить число «7» как двоичное число (а не как символ) всего в 3 битах (т. е. 111), но чаще используется 4 бита (т. е. 0111). Однако двоичные форматы обычно не переносимы. Файлы программного обеспечения записываются в двоичном формате. Примеры файлов с числовыми данными, распространяемых в двоичном формате, включают двоичные версии IBM файлов Центра исследований цен на ценные бумаги и Национального банка торговых данных Министерства торговли США на компакт-диске. Международный валютный фонд распространяет международную финансовую статистику в смешанном формате и двоичном (упаковано-десятичном) формате. SAS и SPSS хранят свои системные файлы в двоичном формате102.

      Дезинтермедиация (Disintermediation) – это устранение посредников между производителями и потребителями103.

      Действительный (xml) (Valid) – это XML-документ, правильность которого проверена на соответствие DTD или схеме. Процесс проверки подлинности документа называется валидацией. Обратите внимание, что это более строго, чем просто проверка правильности оформления документа104.

      Декомпрессия (Decompression) – это функция, которая используется для восстановления данных в несжатую форму после сжатия