Моя недавняя реплика – «позорище!», произнесенная в стенах Общественной палаты и касающаяся протокольных данных Центризбиркома, вызвала множество вопросов. Постараюсь ответить на них кратко и понятно.
Специалист по математической обработке данных, таких как я, может на основе общедоступной информации с сайта Центризбиркома сформировать четкое представление о масштабах выборных аномалий, не прибегая к сомнительным или трудно доступным данным. Наилучший анализ этой темы недавно представил С. Шпилькин, который наглядно показал наличие в данных Центризбиркома множества артефактов – вкраплений искусственного происхождения, не вписывающихся в рамки статистических закономерностей.
Можно с уверенностью говорить о целенаправленной коррекции выборки, если, к примеру, «хвосты» распределения на больших и однородных совокупностях выглядят не по Гауссу или если априори независимые случайные величины вдруг начинают демонстрировать устойчивую корреляцию.
В качестве дополнения к этим наблюдениям, я решил представить еще один кейс. Я выбрал его с тем расчетом, что любой уверенный пользователь Microsoft Office Excel сможет воспроизвести его самостоятельно. Существует общепринятое мнение, основанное на анализе выборных кампаний в различных развитых странах: корреляция явки избирателей (столбец X) с результатами партийного списка №J (столбец Y) равна нулю. Соответствующая диаграмма показывает, что коэффициент корреляции между X и Y отличается от нуля разве что во втором знаке после запятой.
Обратимся к данным Центризбиркома. Извлечем выборку из 1000 и более УИК из общего массива в 96 тысяч. Вычислим процент явки и процент голосов за тот или иной партийный список от общего числа явившихся избирателей. Построим диаграмму и обнаружим значительные отклонения от нормы. В данных по 1000 УИК Белгородской и Брянской областей прослеживается отчетливая положительная корреляция явки и результатов списка №6, а также отрицательная корреляция явки и результатов почти всех прочих списков (за исключением №№3 и 7).
Аналогичные результаты были получены для полной московской выборки и десятков тысяч УИК, взятых наудачу. Всем желающим я рекомендую провести аналогичные расчеты и убедиться в достоверности изложенного.
Как можно интерпретировать эти странные закономерности? На поверхности лежит одно разумное объяснение: массовый вброс бюллетеней, который привел к существенному увеличению явки, пропорционально отразился на голосах за список «Единой России». Данные коэффициенты корреляции по изученным выборкам составляют 0,5-0,75, что, конечно, не дотягивает до 0,9-0,95 и дает основания для оптимизма. Вероятно, среди участников избирательного процесса нашлись те, кто избегал вбросов или действовал осторожно.
Я понимаю, что вся эта статистика не приводит к юридически значимым доказательствам. Уверен, что «правильные» политологи опровергнут наши аргументы, ссылаясь на недостатки методологии. Могу допустить, что мои более «правильные» коллеги предложат благоприятные трактовки этих закономерностей и докажут, что они соответствуют норме. Однако ситуация, когда на сайте ЦИК размещены данные, сопоставимые по правдоподобию с «чудом Джинса», вызывает сомнения. Чудо Джинса – это ситуация, когда вода в чайнике на горячей плите не вскипает, а замерзает; вероятность этого события, хотя и не равна нулю, крайне мала.
Таким образом, некорректность официальных итогов прошедших выборов – очевидный факт для образованной публики. Однако гораздо менее очевиден ответ на вопрос о последствиях признания этого арифметического факта. Как говаривал Станислав Ежи Лец: «Вот ты и пробил головой стену. Что будешь делать в соседней камере?»