Дисклеймер: Автор не является профессионалом в кластерном анализе, электоральной статистике, политологии и прочих областях, упоминаемых в этом материале. Любая конструктивная критика приветствуется. Ниже для краткости все кандидаты именуются по фамилиям.
Предмет анализа: Предпочтения избирателей в КС. Мы исследуем кластеры (группы) избирателей с общими предпочтениями.
Входные данные: Расшифрованный протокол из 81691 голосов. В нем присутствуют отфильтрованные ЦВК голоса МММщиков, а также использованы самоорганизующиеся карты Кохонена (SOM-карты).
Что такое SOM-карты:
Карта представляет собой двумерную сетку, по которой распределяются бюллетени с голосами. При этом:
- В каждой ячейке располагаются максимально похожие бюллетени.
- Чем ближе ячейка A к ячейке B, тем больше сходства между бюллетенями из этих ячеек.
Абсолютно одинаковые бюллетени окажутся в одной ячейке, а существенно непохожие — на разных концах карты. Другого физического смысла координаты в данной карте не имеют.
Результат распределения бюллетеней: Цвет ячеек показывает, насколько кластер отличается от соседних. Чем темнее ячейка, тем больше она отличается от соседних: от темно-синего (в ячейке никто не голосовал за кандидата) до темно-красного (в ячейке все голосовали за кандидата).
Теперь, когда бюллетени отсортированы, фиксируем интересующего нас кандидата X и анализируем, в каких ячейках за него голосовали, а в каких — нет. На карту количество проголосовавших в ячейке наносим цветом.
Рассмотрим карты Гудкова старшего (слева) и Гудкова младшего (справа). Оказалось, что почти все избиратели, голосовавшие за одного из Гудковых, голосовали и за другого. Логично.
А вот карты кандидатов Курамшина, Лаврова, Агишева и Аверьянова. Здесь видно, что подавляющее большинство избирателей голосовали за одного из них и за остальных. Все четверо входят в список МММ. Остальные кандидаты «списка Мавроди» образуют четкий кластер в левом верхнем углу карты. По разным подсчетам в этом кластере 16908 — 17393 бюллетеней, что соответствует оценкам ЦВК.
Глядя на карты кандидатов из этого списка, можно легко понять, за кого голосовали только МММщики, а за кого еще и представители других групп. Например, Пряников имеет мало избирателей, и они не образуют явно выраженный кластер. В то время как у Гельфанда ситуация кардинально иная. Среди победителей по гражданскому списку больше голосов от МММ ни у кого нет.
Кластеры кандидатов:
Перейдем к карте Удальцова. Интересно сравнить ее с картой Гельфанда. Избиратели Гельфанда и Удальцова представлены на одной карте: красная область — Удальцов, синяя — Гельфанд. Темно-синяя область — голоса МММ за Гельфанда. Явно за Гельфанда и Удальцова голосуют в основном разные люди.
Так как левых кандидатов в КС прошло достаточно мало, для сравнения добавим карты Удальцовой и Пономарева, не прошедших в КС. На одной карте представлены Шеин (слева), Удальцова (посередине) и Пономарев (справа). У Гудковых карты также проходят через оба места притяжения, хотя и более широко.
Блок 7 дел:
По картам видно, что Блок 7 дел: Албуров, Ашурков, Наганов, Соболь, работает слаженно. За них голосовали как единое целое. Наличие двух кластеров может свидетельствовать о наличии двух групп избирателей, которые голосовали за этот блок или не означать ничего — такое на SOM-картах бывает.
Кроме того, видно, что разные стороны этого кластера коррелируют с кластерами других кандидатов. Правая часть явно коррелирует с голосами за Адагамова и Каца.
Журналисты и либералы:
В этом кластере можно выделить Пархоменко, Дзядко и Романову. Сильный кластер справа и хвост снизу, рядом с Немцовым и Илларионовым. С небольшими натяжками можно отметить Пионтковского и Кара-Мурзу. Обратите внимание на провал в районе правого кластера блока 7 дел.
Для сравнения представлены Албуров (красный) и Кара-Мурза (синий) на одной карте.
Гражданская платформа:
Лазарева и Щац представляют устойчивую пару, в отличие от пары Собчак — Яшин, предпочтения избирателей коих скорей соотносятся с Быковым.
Навальный:
Избиратели Навального представляют собой широкий спектр, включая либералов, националистов и левых. Бюллетени в правом верхнем углу, по-видимому, относятся только к Навальному. Интересно понять, кто не голосует за него. В левом верхнем углу можно увидеть МММщиков.
Структура кластера справа-сверху не была идентифицирована, однако в левом середине наблюдается группа, состоящая из Бароновой, Янкаускаса, Макгоева, Осенина, Сангаева, Смирнова, Щербакова, Ясина, Галямина, Колюцкого и Левченко. Этот кластер не поддерживает гражданскую платформу, предположительно, это молодые «не-медийные» политики.
Широкий фронт:
В этом сегменте представлены прочие кандидаты, за которых голосовала не компактная группа, а более широкий коалиционный состав избирателей. Чирикова, Каспаров и Яшин показывают схожие результаты, аналогичные Гудковым в начале исследования.
Среди успешных кандидатов по общегражданскому списку остаются Винокуров, Газарян и Мирзоев. В голосовании по куриям МММщики нанесли наибольший вред, вероятно, из-за большого протестного голосования по их спискам.
Чтобы лучше увидеть реальные голоса за конкретных кандидатов, подсветим кластер МММ. Все ячейки, которые в него не войдут, будем считать реальными голосами, среди которых можно выделить Бондарика, Артемова и Константинова, у последнего которых наблюдаются свои избиратели.
Что касается Тора и Крылова, то они не получили голоса от МММ, однако видно, что за них голосовали схожие группы людей. Бюллетени за Поткина и Демушкина, не прошедших в КС, находятся в том же кластере. В целом видно, что бюллетени избирателей, голосовавших за список националистов, схожи, их кластер проще увидеть на карте Крылова.
Левая курия:
Националисты провели 3 кандидата с помощью МММ, в то время как среди левых прошли 4 из 5. На данный момент можно утверждать, что только двое прошли с помощью МММ. Николаев, Палчаев, Аитова и Гаскаров — это те, кто прошел благодаря этому. Только Развозжаев прошел самостоятельно, его кластер хорошо коррелирует с «левыми» кластерами Удальцова, Шейна и Пономарева.
Либералы:
У либералов ситуация лучше, так как Мавроди не оказал влияния, и МММщики не имели столь значительного влияния. Видно, что за либералов голосовали разнообразные группы, без явной доминирующей.
Кандидаты Давидис, Долгих и Царьков также не образуют единого кластера.
Результаты:
Попробуем объединить кластеры избирателей на одной картинке. Кластеры достаточно точно различимы, однако националисты и левые оказались в одной области.
В целом ничего неожиданного в данных не наблюдается, что косвенно подтверждает честность выборов. Основные выводы заключаются в том, что МММщики в куриях нанесли больше ущерба, чем предполагалось. За Навального голосуют практически все группы избирателей, кандидаты из блока 7 дел встречаются в бюллетенях вместе.
Существует отдельный кластер молодых политиков, в основном не прошедших в КС.
Дальнейшая работа:
Планируется более комплексный анализ полученных данных, а также создание аналогичных карт по протоколу без МММщиков. Будут построены карты большей размерности и несколько раз SOM-карты по тем же данным, что может выявить новые аспекты.
Скоро будет опубликован пост с техническими деталями и инструментами, которые использовались в анализе, а также карты по всем кандидатам.
