Не выступая за внесенные в российскую Конституцию поправки либо против них (т.к. это вообще тема отдельного разговора, не относящегося к сути данного материала), т.е. выходя за рамки политологических интерпретаций происходящих сегодня в России процессов, хотелось бы привести ряд рассуждений относительно сформировавшегося в последнее время устойчивого стереотипа о том, что результаты любого голосования должны иметь исключительно «нормальное гауссовское распределение», а ненормальность такого распределения свидетельствует о явных фальсификациях и вбросах.
Нам представляется необходимым прояснить ряд моментов, связанных с этим представлением, используя максимально доступный для аудитории язык. Безусловно, данная позиция является исключительно личной и основанной на собственных представлениях и рассуждениях о сути вопроса (автор защитил кандидатскую диссертацию по теме моделирования современных политических процессов, и проблема «нормальности» распределений результатов голосований еще в 1990-е годы прошлого века представляла для нас определенный научный интерес). При этом многие тезисы, приведенные здесь, можно в более подробном виде найти на просторах Сети. Основной целью для нас стало не убедить кого-то, но лишь представить иную точку зрения на закон Гаусса, который зачастую используется в актуальной практике в качестве не столько математического, сколько политического инструмента.
В целом идея соотношения социологических распределений (шкал, выборок, коэффициентов корреляции) с нормальным распределением является довольно популярной и широко тиражируемой в российском сегменте интернет-пространства в последние годы. Однако этот формально-математический подход не имеет содержательного обоснования в реальной социологии и политологии. В современной науке вообще не существует однозначных аргументов, обосновывающих гипотезу о том, почему определенный вид того или иного реального распределения должен подчиняться нормальному распределению.
Как писал в свое время известный советский и российский социолог, математик, один из основателей и первый декан факультета социологии Государственного университета — Высшей школы экономики (ГУ ВШЭ), специалист по методике социологических исследований и методологии анализа социологических данных Александр Крыштановский, «во многих случаях предположение о нормальности обосновать довольно трудно, а подчас можно точно сказать, что распределение резко отличается от нормального».
Сходного мнения придерживался также советский и российский математик и экономист, статистик, социолог, кибернетик Александр Орлов, говоря о том, что «как показали многочисленные исследования, почти все распределения реальных данных не принадлежат ни к одному из известных параметрических семейств».
В целом многие авторы отмечают, что в реальной практике нормальное распределение встречается редко. Какие-то из эмпирических распределений могут иметь вид, близкий к нормальному, но это может происходить не в силу закономерности, а вследствие вариативности распределений, то есть «по совпадению». Таким образом, можно предположить, что идея нормального распределения в социологии и реальной политике является необоснованной.
Тем не менее ряд методов измерения и анализа данных в социологии основывается на гипотезе нормального распределения. Однако поскольку сама гипотеза «нормальности» не находит научного обоснования и подтверждения среди большинства специалистов, то и методы, на ней основанные, могут быть недостаточно достоверными, если мы пытаемся применить их к реальным общественно-политическим процессам, обладающим высокой степенью сложности и непредсказуемости, зависящим от бесчисленного количества реальных факторов, влияющих на итоговые параметры того или иного распределения.
Следует заметить, что во многих работах и публикациях вообще не указывается, распределение по каким шкалам может подчиняться закону Гаусса. Например, распределения по атрибутивным шкалам не могут рассматриваться на предмет соответствия нормальному распределению, так как это независимые шкалы и у них не может быть среднего значения и, соответственно, отклонений от него. Порядковые шкалы также не имеют корректного среднего значения, потому также не могут соотноситься с нормальным распределением. Среди распределений по абсолютным шкалам также не наблюдается типов распределений, соответствующих нормальному. Распределения респондентов по зарплате, доходам, распределения брачующихся и мигрантов по возрасту и другие подобные распределения имеют, как правило, правоскошенный характер.
Кроме того, на наш взгляд, распределения Гаусса в случае, когда случайная величина (например, явка) по определению принимает значения только в определенном диапазоне, быть не может вообще.
Также отметим, что нормальное распределение применимо к случайным величинам. Оно прекрасно может иллюстрировать некоторые физические процессы, но не осознанный выбор миллионов людей, различающихся по месту проживания, достатку, национальности и другим атрибутам. Если бы людей приписывали к случайно выбранным участкам, тогда мог бы быть четкий «гаусс». Но раз участки выбираются не случайно, а по территориальному признаку, то распределение обязано зависеть от географических неоднородностей предпочтений электората. Чтобы получить ровный гладкий «гаусс», нужно, чтобы все «бросания монетки» происходили в идентичных условиях. В реальности же условия более чем неидентичны. Люди голосуют не случайно, заполняя бюллетень, никто монетку не бросает. Поэтому попытки описать результаты голосования законом, который действует для абсолютно случайных, ни от чего не зависящих величин, представляются спорными.
Несколько слов необходимо сказать и об однородности той выборки, которую мы исследуем на предмет «нормальности распределения». Одним из ключевых допущений при попытке описать реальные распределения в социологии и политологии, к которому мы относимся с определенной долей скепсиса, является утверждение о том, что «российское общество весьма однородно: оно находится в однородном информационном поле, созданном телевизором, и мало различается по воспитанию и образованию». На самом деле, по нашему мнению, российское общество весьма неоднородно. Например, информационное поле разнородно хотя бы на уровне потребления россиянами информации посредством телевидения и интернета (например, пенсионеры из российской глубинки с высокой долей вероятности в качестве источника общественно-политической информации используют не новостную ленту Facebook, а новостные телевизионные программы, равно как и столичная молодежь не использует в своем большинстве в качестве источника информации традиционную прессу). Кроме того, люди проживают на разных территориях со своими культурными особенностями. Например, по итогам голосования за поправки в Конституцию России Ненецкий автономный округ, как мы все хорошо знаем, стал единственным регионом, в котором жители проголосовали против принятия поправок в Конституцию. Данное обстоятельство, по мнению многих экспертов, связано как раз с территориальными особенностями — протестом, который был в последнее время сконцентрирован против объединения НАО с Архангельской областью, что и повлияло на результаты голосования по поправкам. Можно было бы и дальше рассуждать о неоднородности российского общества, приводя различные аргументы, выделяя критерии неоднородности и т.д., но эта неоднородность, на наш взгляд, и так является вполне очевидным фактом.
Необходимо при этом отметить, что гауссовское распределение вполне закономерно не встречается и в большинстве стран, которые мы традиционно относим к свободным, демократическим. В качестве примера можно привести несколько результатов голосования за рубежом. Мы намеренно приведем данные разных лет, чтобы показать «ненормальность» распределения не на одном конкретном временном участке и не в одной стране.
Так, в Израиле на выборах в кнессет 2009 года распределение результатов голосования по разным избирательным участкам (קלפי) не было похожим на классическое гауссовское. Скорее наоборот, распределение имело сразу два максимума. Первый — в районе 0%, отражающий наличие большого числа мусульманских избирательных участков, в которых победившая партия совсем не пользуется популярностью. Это мусульманские избирательные участки. Одновременно с этим у харедимных партий есть незначительный локальный максимум в районе 100%.
Результаты предварительных выборов Республиканской партии США 2008 года в 19 штатах, где голосование прошло в один день (супервторник), также демонстрируют весьма любопытное распределение голосов за четырех ведущих кандидатов по 1162 округам (counties).
У Хакаби вышло двугорбое распределение с одним пиком на 15% и другим на 35%. Междугорбие в два раза ниже горбов. У распределения Маккейна один пик на 35%, а другой на 80%. Между пиками распределение спадает почти до нуля. У Ромни один пик на 25%, а другой на 90%. Рон Пол получил экспоненциальное распределение.
Президентские выборы США 2000 года. Результаты в штате Калифорния. Распределение голосов за кандидатов по 21 970 избирательным участкам (precincts) также далеко не гауссовское. Скорее это комбинированная кривая из распределения Гора до 50% и распределения Буша после 50%. Если применить модель гауссовского распределения, то можно доказать, что Гор украл голоса у Буша.
Иными словами, результаты американских выборов тоже противоречат основополагающей работе Гаусса по статистике.
Можно также привести примеры и из Европы. Так, например, результаты выборов в парламент Великобритании – 2010 по трем лидирующим партиям — Консервативной, Лейбористской и Либерал-демократической — также не похожи на гауссовское распределение.
Таким образом, мы либо можем сделать вывод о том, что зарубежная практика выборов имеет признаки регулярной долговременной фальсификации во многих странах, либо же согласиться с тем, что подход Гаусса в сложных общественно-политических процессах не работает в изначальном виде. Впрочем, как и большинство существующих формальных теорий. Еще Пуанкаре писал о том, что в основе деятельности математика лежит интуиция, а сама наука не допускает полного аналитического обоснования. По мнению Пуанкаре, основные положения любой научной теории или модели не являются ни синтетическими истинами, ни отражением реальности.
Таким образом, нам представляется, что для решения задачи по достоверному анализу результатов массовых волеизъявлений и выявлению фальсификаций на выборах необходима разработка инструментария, позволяющего соблюсти выдвинутый тем же Пуанкаре принцип конвенционализма. Важно разработать такие модели и решения, которые будут признаваться большинством специалистов как рабочие и позволяющие корректно решать требуемый класс задач.
В противном случае при неоднозначности и противоречивости оценок существующих на сегодняшний день моделей анализа результатов выборов существует серьезный риск манипуляций при оперировании имеющимися статистическими данными. Целями подобных манипуляций могут быть в первую очередь делегитимация итогов выборов и рост социально-политической напряженности в обществе.
Автор — профессор кафедры государственной политики факультета политологии МГУ
Позиция редакции может не совпадать с мнением автора.