?

Log in

Записи Френдолента Календарь Инфо Назад Назад Вперёд Вперёд
Ответный удар на ответный удар - ДНЕВНИК ЭКОНОМИСТА
ksonin
ksonin
Ответный удар на ответный удар
Уолтер Мебейн и Кирилл Калинин из Мичиганского университета, крупнейшие эксперты в области комплексной диагностики фальсификаций на выборах, опубликовали в блоге Monkey Cage результаты своего анализа российских парламентских выборов 2016 года. Масштаб фальсификаций, скажем не удивляет - выборы и не были свободными (что снижает масштаб фальсификаций, к слову), и не выглядели свободными. Всё равно интересно читать - потому что много методологических ссылок на конкретные инструменты диагностики - скажем, стандартное предположение человека, не занимающегося профессионально статистикой, состоит в том, что в случайных данных отдельные цифры в каких-то знаках после запятой появляются равномерно (то есть шанс увидеть 0 или 1 такой же, как 8 или, скажем, 9. А это совсем не так - "маленькие" цифры встречаются чаще "больших".

Однако "вишенкой на торте" новых результатов Мебейна и Калинина является то, что, судя по всему, фальсификаторы в 2016 году использовали то, про что прочли в предыдущих материалах комплексной диагностики (например, тех же Мебейна и Калинина про выборы 2003-04 и 2007-08). Конкретно, два показателя (один как раз связанный с частотностью появления "маленьких" цифр) в данных, аггрегирующих показатели со ста тысяч участков, совпадают с методологическими требованиями для идеальных выборов. Всё остальное не совпадает, но кто-то постарался подогнать эти два показателя (к слову, довольно продвинутых - при Чурове в ЦИКе и при нём хоть сколько-то статистически грамотных людей не было). То есть, похоже, вся область "комплексной диагностики выборных фальсификаций" движется к чему-то типа борьбы с допингом или стандартами по охране окружающей среды - регуляторы и регулируемые вовлечены в бесконечное совершенствование методов борьбы.

А пока Кирилл и Уолтер могут подать на конкурс на "лучшую работу на тему избирательного права и избирательного процесса". Победителям оплатят расходы на исследование и дадут премию - и, если Кирилл и Уолтер этот конкурс выиграют, это будет лучший расход бюджетных денег.
32 мнений // Ваше мнение?
Comments
magda_zitta From: magda_zitta Date: Январь, 12, 2017 18:16 (UTC) (Ссылка)

Интересно.

kluchnikov_a From: kluchnikov_a Date: Январь, 12, 2017 18:16 (UTC) (Ссылка)

А где можно почитать работу про фальсификации на нынешних президентских выборах в Америке? Никто из ваших студентов не хочет сделать?

From: abba65 Date: Январь, 12, 2017 18:30 (UTC) (Ссылка)
Насколько известно, фальсификации на нынешних президентских выборах в США примерно такие же, как обычно. А обычные давном-давно исследованы.
Так что неинтересно.

Альтернатива - почитать мнение известного российского "волшебника":
http://www.politonline.ru/interpretation/22888129.html
ksonin From: ksonin Date: Январь, 12, 2017 18:35 (UTC) (Ссылка)
Почитайте Мебейна - там множество исследований на американском материале: http://www-personal.umich.edu/~wmebane/.

Вот здесь практически вся книга посвящена разбору одних конкретных выборов (в Сенат от Техаса 1948 года), исход которых решила, видимо, фальсификация: https://www.amazon.com/Means-Ascent-Years-Lyndon-Johnson/dp/1501264346.

Вот подробный разбор фальсификаций в губернаторских выборах 1982 года: http://www.heritage.org/research/reports/2008/04/where-theres-smoke-theres-fire-100000-stolen-votes-in-chicago. 63 человека были признаны виновными в фальсификациях.
kingeugen From: kingeugen Date: Январь, 23, 2017 16:34 (UTC) (Ссылка)
В США нет фальсификаций, займитесь уже своей Россией.
zlata_gl From: zlata_gl Date: Январь, 12, 2017 18:17 (UTC) (Ссылка)

"маленькие" цифры встречаются чаще "больших".

Я понимаю, что маленькие цифры появляются чаще больших в первом знаке (слева), может даже во втором немножко.
Но какая может быть причина разной частоты знаков ДАЛЬШЕ ?
Не верю.
ksonin From: ksonin Date: Январь, 12, 2017 18:36 (UTC) (Ссылка)

Re: "маленькие" цифры встречаются чаще "больших".

Читайте, разбирайтесь: https://en.wikipedia.org/wiki/Benford's_law .

Edited at 2017-01-12 18:44 (UTC)
zlata_gl From: zlata_gl Date: Январь, 12, 2017 20:16 (UTC) (Ссылка)

Re: "маленькие" цифры встречаются чаще "больших".

Ну и получается то, что я говорила.
У первой значащей цифры вероятности сильно отличаются, у второй - меньше, а дальше - уже почти одинаковы.

Не важно, до запятой эта "первая значащая цифра" или после.
Например, площади стран иквартир можно измерять в кв. км, в кв.милях и в кв. дюймах.
Это не важно.
sevabashirov From: sevabashirov Date: Январь, 12, 2017 18:44 (UTC) (Ссылка)

Re: "маленькие" цифры встречаются чаще "больших".

Чтобы не искать, имелся в виду этот раздел статьи: https://en.wikipedia.org/wiki/Benford's_law#Generalization_to_digits_beyond_the_first

То есть для следующих знаков тоже есть отклонение от 10% на цифру, но с отдалением от первой цифры эти отклонения быстро падают. Но суть не в этом. Закон Бенфорда работает для множества чисел на бесконечном интервале - обычно это положительная полуось. И при таких параметрах, что числа охватывают множество десятичных порядков, то есть от единицы до миллиона, например. Для нормализованных величин в интервале 0...100% этот закон неприменим. И если исследователь этого факта не знает, ему просто не следует заниматься статистикой.

Edited at 2017-01-12 18:46 (UTC)
ksonin From: ksonin Date: Январь, 12, 2017 18:47 (UTC) (Ссылка)

Re: "маленькие" цифры встречаются чаще "больших".

Там у Мебейна с Калининым есть ссылки на модификацию для того, чтобы использовать закон для цифр в знаках после запятой (это не они придумали, конечно, это уже лет пятьдесят).
sevabashirov From: sevabashirov Date: Январь, 12, 2017 19:09 (UTC) (Ссылка)

Re: "маленькие" цифры встречаются чаще "больших".

Тут? http://www-personal.umich.edu/~wmebane/falsificacii_reo.pdf

Да, верно, и там не "знаки после запятой", а вторые (третьи, четвертые) значащие цифры в случае, (дословно) "если числа взяты из реального мира". Для абсолютных чисел явки или голосов за определенного кандидата все это работает, и именно для этого они и применяли метод.

Однако - совершенно справедливо - там ни слова о том, что перекос в сторону меньших цифр должен быть в распределении процентных значений из ограниченного интервала. То есть постулат, что цифра десятитысячных долей процента распределяется равномерно, они не опровергают - и правильно делают.

То есть они взяли для анализа абсолютные данные, проверяемые по Бенфорду, а относительные данные так и должны проверяться по равномерности, то есть нельзя обвинять исследователей относительных данных в том, что они не учитывают Бенфорда - они и не должны его учитывать, это просто другой метод.

Edited at 2017-01-12 19:11 (UTC)
zlata_gl From: zlata_gl Date: Январь, 12, 2017 20:17 (UTC) (Ссылка)

там не "знаки после запятой", а вторые (третьи, четверты

Именно так.
oude_rus From: oude_rus Date: Январь, 13, 2017 21:37 (UTC) (Ссылка)

Re: "маленькие" цифры встречаются чаще "больших".

так Мебейн сам писал в 2015, что Бенфорд не работает.
вон, внизу barouh даже ссылку подогнал.
о чем вообще речь-то?
nikitamur From: nikitamur Date: Январь, 12, 2017 22:38 (UTC) (Ссылка)

Re: "маленькие" цифры встречаются чаще "больших".

(Удалённый комментарий)
maxdz From: maxdz Date: Январь, 12, 2017 19:42 (UTC) (Ссылка)
Во-во. Те же мысли. :)
oude_rus From: oude_rus Date: Январь, 12, 2017 21:13 (UTC) (Ссылка)
С Бенфордом они уже один раз налажали.
Предположение, что подогнали Бенфорда, оставив все остальное, просто смешно.

UPD Они еще радостно нарисовали пики на 1/2, 2/3 и т.п. Послушайте, это уже ни в какие ворота не лезет.

Edited at 2017-01-13 21:32 (UTC)
barouh From: barouh Date: Январь, 13, 2017 01:12 (UTC) (Ссылка)
Честно признаюсь, что я не смог понять математическую идею построений Мебейна, но результат доверия не вызывает: оценки объемов фальсификаций для России на порядок меньше тех оценок, которые получаются другими методами

Так что на мой взгляд, finite mixture model для оценки электоральных фальсификаций не подходит. Не берусь судить, почему именно - но по России результаты явно неадекватные
dmitrykogan From: dmitrykogan Date: Январь, 13, 2017 08:28 (UTC) (Ссылка)
Не надоест им велосипед изобретать, да еще трехколесный, да еще на государственный грант? Нашли аж 2 миллиона приписок! Российские статистики обнаружили как минимум 10 тремя независимыми методами
corbulon From: corbulon Date: Январь, 13, 2017 13:19 (UTC) (Ссылка)
В статье Калинина и Мабейна две грубые ошибки.
1.Среднее значение второй цифры и сам вид распределения сильно зависит от распределения участков по численности. Закон Бенфорда вообще неприменим к числам, ограниченны сверху,

2. Среднее значение последней цифры вообще мало что характеризует: на выборах-2016 частота появления нулей (и пятерок) много выше вероятной, за счет других цифр. Подсчитанная по Пирсону вероятность (хи-квадрат распределение) дает, что случайным такое распределение последних цифр может с вероятностью всего лишь 0.007% (!).

(Впрочем это понятно и без сложной математики: если из 100 000 чисел половина кончается нулем, а половина девяткой, то среднее значение окажется идеальным, 4.5. Но случайным такое распределение никак не назовешь.)
zlata_gl From: zlata_gl Date: Январь, 13, 2017 13:29 (UTC) (Ссылка)
ИМХО, прямые приписки на участках - не главный метод фальсификации выборов даже в России, не говоря уже о США.
В России это - административное давление на неугодных кандидатов, запреты митингов, закрытие газет и сайтов, придирки к подписям за выдвижение кандидатов и очень короткий срок сбора подписей итп.

А США - крайний либерализм к голосованию без документов, с легкостью позволяющий избирателю проголосовать на нескольких участках.
Я как-то пыталась понять, как они голосуют без ID с фоткой - да так и не поняла.
http://rusam.livejournal.com/4015027.html
From: suminfinity Date: Январь, 13, 2017 14:58 (UTC) (Ссылка)
Да так и голосуют: говоришь адрес фамилию и выдают листок для голосования. Так происходит у нас на участке. ID не просят показать. Наверное если бы кто то не смог проголосовать из-за того что за него кто-то уже проголосовал, то стали бы спрашивать ID. Наверное америкaнцы очень законопослушные и потом там камеры и это видимо уголовное преступление, а наказание за любое преступление здесь жесче чем в дугих странах. Не зря US входит в три топ страны с per capita prison population. Другие две Украина и Россия.
zlata_gl From: zlata_gl Date: Январь, 13, 2017 18:31 (UTC) (Ссылка)

Наверное америкaнцы очень законопослушные

Ага
Недавно прочла "Фрикономику" Левитта

Подумайте над тем, что произошло одной весенней ночью 1987 года, когда внезапно исчезли семь миллионов американских детей. Что это было? Самая большая волна похищений людей в истории? Вряд ли. Это случилось в полночь 15 апреля, после того как Налоговое управление США поменяло правила своей работы. Вместо простого перечисления находящихся на иждивении детей люди отныне должны были указывать номер социального страхования каждого ребенка. В один миг семь миллионов детей (десятая часть малолетних иждивенцев США), которые существовали только на бумаге, в отчетах за прошедший год, исчезли [5].
В этой книжке еще много интнрнсных историй. В частности - как учителя подделывают результаты тестов. Не хуже, чем в России "три пишем, два в уме".

Представляете, сколько зарегистрировано фиктивных избирателей ?
From: chinilprimus Date: Январь, 13, 2017 19:34 (UTC) (Ссылка)

Re: Наверное америкaнцы очень законопослушные

В работе 2014 года количество неграждан голосовавших на выборах президента 2008 года оценивается в интервале <38000, 2.8 млн>.
См. http://www.sciencedirect.com/science/article/pii/S0261379414000973
Таким образом, оценка влияния неграждан на выборы 2016 будет дана нескоро. Так как подавляющее большинство неграждан голосуют за демократов, то победа ослов на 3 миллиона голосов пока что ешё под вопросом.
Кстати, в своих выводах учёные пишут, что "Non-citizen votes likely gave Senate Democrats the pivotal 60th vote needed to overcome filibusters in order to pass health care reform and other Obama administration priorities in the 111th Congress." (Это при том, что 90% акдемического мира тоже - за демократов).


Edited at 2017-01-13 19:36 (UTC)
zlata_gl From: zlata_gl Date: Январь, 13, 2017 20:50 (UTC) (Ссылка)

Re: Наверное америкaнцы очень законопослушные

Не полезла разбираться, как они оценивают это число.
Но понятно, что при таком либерализме можно не только 3 миллионам неграждан проголосовать, но и миллионам граждан сходить на пяток участков.

А если нынче у республиканцев обе палаты + президент - они не собираются что-то изменить в этой области ?
From: chinilprimus Date: Январь, 13, 2017 22:42 (UTC) (Ссылка)

Re: Наверное америкaнцы очень законопослушные

Республиканцы уже давно предлагали ввести идентификацию избирателей, но во-первых, это упирается в деньги, а в во-вторых, якобы победители popular vote сопротивляются изо всех сил. Правда, надо признать что многим настолько наплевать, что дополнительное условие типа пойти или поехать сфотографироваться (бесплатно) может быть достаточной причиной не участвовать в выборах. Постепенно те или иные документы с фото всё-таки будут введены, а кое в каких штатах это уже сделано.
zlata_gl From: zlata_gl Date: Январь, 14, 2017 07:19 (UTC) (Ссылка)

многим настолько наплевать

А скольким настолько НЕ наплевать, что могут не полениться и зарегистрироваться на пяти участках с разными адресами ?
barouh From: barouh Date: Январь, 13, 2017 15:26 (UTC) (Ссылка)
Вообще странная история. Мебейн и Калинин используют тест 2BL (распределение второй значащей цифры), который сам же Мебейн оценил как неработающий в статье 2015 года



ссылка на Google Books: http://bit.ly/2ikMQQb
oude_rus From: oude_rus Date: Январь, 13, 2017 21:34 (UTC) (Ссылка)
именно про это я и написал наверху.
papa_lyosha From: papa_lyosha Date: Январь, 13, 2017 19:01 (UTC) (Ссылка)
А на какой странице это написано?
basoff From: basoff Date: Январь, 14, 2017 11:33 (UTC) (Ссылка)

Выборы?

"А пока Кирилл и Уолтер могут подать на конкурс на "лучшую работу на тему избирательного права и избирательного процесса". Победителям оплатят расходы на исследование и дадут премию - и, если Кирилл и Уолтер этот конкурс выиграют, это будет лучший расход бюджетных денег."

Да-а, за доказательство, что никаким выбором там и не пахнет премии там не дадут.

"В чём главный стержень демократии? Выборность некоторых должностных лиц государства для осуществления теми трудовой деятельности по управлению и законотворчеству в соответствии с должностными обязанностями, штатным расписанием и в рабочее время. Но ведь для выбора нужны критерии для сравнения, чтобы определить преимущества того, кто для нас предпочтительнее. Они есть?

Демократия известна давно и мы на основе исторического и собственного опыта с уверенностью можем сказать, что никаких критериев для объективного выбора у населения нет. Почему? Из-за лукавости претендентов на должности. Результат-то один. Вот и главный порок демократии – возможность и неизбежность ложных намерений при приёме на работу. Иными словами, никакого выбора на самом деле здесь нет. Ведь население затребует достоверную информацию о претендентах на государственные должности, а ему подсовывают ложную. Из ложного можно выбрать только ложь, но не правду, следовательно, выбором это называть нельзя.

Выбор претендента на государственный пост и вступление его в должность – это трудовой найм. Условия найма в Системе разделения труда в принципе очень просты. В исключительной компетенции нанимателя находится следующее.
1. Определение работника как конкретной личности.
2. Выяснение его пригодности.
3. Установление должностных функций, обязанностей.
4. Установление ему оплаты труда.
5. Утверждение в должности.
6. Снижение оплаты труда в случае некомпетентности работника и нанесения ущерба нанимателю.
7. Увольнение работника в случае ущерба и непригодности.

Что же из перечисленного находится в возможностях гражданина при демократических выборах?
П. 1 находится в возможностях.
П. 2 невозможен из-за лживости кандидата.
По п. 3 возможность избирателю не предоставляется.
По п. 4 избиратели об этом никогда даже и не слышали. Утверждение, что раз гражданин платит общие налоги, то этим он платит и зарплаты чиновникам, нанимая их, недостоверно. У гражданина нет ни права, ни возможности указать кому, за что и сколько он платит.
П. 5 можно считать доступным в виде протокола голосования.
По п. 6 ситуация простая. Раз гражданин оплату труда не определяет, то он не может её и регулировать.
По п. 7 явное отсутствие возможности. Простота увольнения в СРТ при наличии причин несопоставима со сложностью отзыва выборного лица сейчас.

Иными словами, гражданин нанимателем не является, ибо в его компетенции кратковременно находятся лишь два наименее существенных условия найма из обязательных семи, а после выборов нет уже и совсем никаких. Однако вся ответственность за найм и поведение нанятого почему-то возлагается именно на граждан. А если ты не наниматель, то и никакого влияния на "нанимаемых" у тебя быть не может. Так что демократия, если разбираться по существу не более чем благообразно обряженная диктатура.

Здесь нарушен принцип нормального и естественного трудового найма, существующий в общественных отношениях. Соответственно, "нанятый" свободен от каких-либо обязательств в отношении "нанимателя". Налицо лишь декларативная зависимость. Конечно же, можно заявить, что обман на выборах и так известен и очевиден. Пожалуй, но дело в другом. Ощущение и наблюдение обмана – это одно, а доказательство, механика обмана – это другое. Как видим, трудовой анализ вытаскивает на свет ответ на вопрос, в чём ущербна система демократии и приводит этому убедительное доказательство."

И это только верхушка айсберга...


Edited at 2017-01-14 11:34 (UTC)
speshuric From: speshuric Date: Январь, 16, 2017 19:02 (UTC) (Ссылка)
Это ж движется к классическому вопросу разведки, популярно описанному у Нила Стивенсона в Криптономииконе :) Если у вас есть дешифратор сообщений противника, то вы не можете просто использовать полученную информацию, потому что тогда будет неестественное распределение, поэтому (как вариант) придётся делать кучу "дополнительных" событий, скрывающих статистический выброс.
penartur2 From: penartur2 Date: Январь, 16, 2017 19:28 (UTC) (Ссылка)
Кроме уже приведённых в этом обсуждении конкретных аргументов за то, что нельзя делать такие выводы из этих показателей, приведу ещё один общий.

Просто так говорить "тут какие-то странные числа получаются - значит, были фальсификации" (а тем более, делать далеко идущие выводы вида "результаты специально нарисовали такими, чтобы показать, как им плевать на исследователей") нельзя. Как минимум, нужно хотя бы минимально реалистично выглядящее объяснение того, откуда могли появиться такие результаты при фальсификациях. И такое объяснение не только не придумано авторами выводов - но даже если подумать, его не удаётся найти.

Известны разные способы фальсификаций на уровне конкретных УИКов / ТИКов, но они дадут совершенно другой эффект. Даже если бы ЦИК спустил команду, как именно рисовать - был бы другой эффект. Остаётся только предположить, что результаты фальсифицировали непосредственно в ГАС "Выборы", уже в ЦИКе - просто нарисовали для каждого участка такие числа, чтобы в итоге и результат ЕР получился нужный, и над "крупнейшими экспертами" поглумиться. Только с такими теориями надо сначала жидорептилоидов с планеты Нибиру победить (это не говоря уж о том, что на достаточно большом количестве участков официальные результаты совпадают с результатами из протоколов, полученных наблюдателями). Или ещё один вариант той же степени бредовости - в ЦИКе заранее, ещё до выборов, посчитали нужные результаты, и спустили в УИКи указания, какие именно числа нужно нарисовать в протоколах.

Но нет, "крупнейшие эксперты" никакого объяснения тому, как именно могли бы получиться такие результаты, не дают. Зато есть вполне реалистичное объяснение, о котором они не говорят - а именно, что "крупнейшие эксперты" неверно проинтерпретировали эти результаты, и из них никоим образом не следует "When the Russians fake their election results, they may be giving us the statistical finger".

И из всего этого можно сделать только один вывод. "Крупнейшие эксперты" не только неправильно применили конкретные математические методы (о чём тут уже достаточно написали люди, разбирающиеся в теме), но и не смогли применить общенаучные методы. Не просто ошиблись как математики, но показали свою несостоятельность как учёные в целом.
Хотя можно ещё надеяться, что они всего лишь посчитали данные, удивились, и не более того; а все эти интерпретации - дело рук журналистов.
32 мнений // Ваше мнение?