между бинарными переменными. Автор уже давно использует в качестве такой меры величину, известную в анализе таблиц сопряженности под названием приведенных стандартизированных остатков. Есть два бинарных вектора x и y длины n; xy – вектор, образованный из первых двух путем перемножения соответствующих координат. Через |x| обозначается число единиц в векторе x (аналогичным образом это обозначение используется для других векторов). Если вектору x соответствует некий ответ на некий вопрос, то |x| – число респондентов, выбравших этот ответ на этот вопрос.
Величина известна под названием «остаток». Он равна нулю или близка к нему, если (как в нашем примере) выбор респондентами ответов x и y есть события независимые. Когда остаток exy значимо отклоняется от нуля, мы имеем основания говорить о положительной (exy больше нуля) или отрицательной (exy меньше нуля) зависимости между выбором респондентами двух ответов. Чтобы оценить статистическую значимость отклонения, от величины exy переходят к связанной с ней статистике28:
которая имеет стандартное нормальное асимптотическое распределение. Это позволяет дальше действовать следующим образом. Мы задаемся некоторой устраивающей нас доверительной вероятностью P (0,05; 0,01, 0,005 …) и используем соответствующее ей значение z – такое, что (1 – N (z)) = P, где N – функция стандартного нормального распределения в качестве порогового значения. Далее мы исключаем из сети все связи между узлами (бинарными векторами) x и y, которым соответствуют абсолютные значения статистики Axy, меньшие z. Таким образом, в сети остаются только связи между узлами со статистически значимыми зависимостями.
На данном этапе развития «нового подхода» мы не изучали всю сеть, которую можно построить на основе ответов на все вопросы некой анкеты. Описанное выше сетевое представление данных опроса использовалось для изучения локальных свойств отдельных узлов сети. Изучались все значимые связи некого узла и характеристики этой совокупности связей (например, центральность). В двух упомянутых выше статьях объектами изучения были ответы респондентов на вопросы о степени доверия к четырем институтам: к президенту, правительству, Федеральному собранию и милиции (полиции). Респонденты могли выбрать один из вариантов ответа: «Полностью доверяю», «Скорее доверяю», «Скорее не доверяю», «Совсем не доверяю». Вопросы о доверии этим институтам задавались в разные годы. В описываемом исследовании сравнивались данные 1998, 2001 и 2015 гг. В качестве меры центральности использовалась доля высоких по абсолютному значению связей во всей совокупности рассматриваемых связей. Сопоставлялись центральности (и другие характеристики) для разных вариантов ответа, разных институтов и разных годов. Этот весьма поверхностный анализ дал немало важных результатов, часть из которых будет представлена ниже.
Рис. 8.
Профили центральностей (долей больших по абсолютной