?

Log in

No account? Create an account
Записи Френдолента Календарь Инфо Назад Назад Вперёд Вперёд
Страшно помыслить, хотя и возможно понять - ДНЕВНИК ЭКОНОМИСТА
ksonin
ksonin
Страшно помыслить, хотя и возможно понять
Для тех, кто в прошлом году следил за избирательной кампанией Трампа и прогнозами аналитиков. Подробный отчёт Нейта Кона, статистического аналитика NYT, о результатах исследования почему результаты выборов оказались большим сюрпризом. Там много интересного - как и во всех дискуссиях на Upshot, 538 и RCP, на которые я давал ссылки по ходу кампании.

Очень коротко - во-первых, опросы по отдельным штатам использовали, как показали итоги выборов, неправильные (никакие) веса для групп с разным уровнем образования. Эта причина обсуждалась Нейтом Сильвером и "по горячим следам". Национальные опросы их использовали и поэтому оказались точными, правильно предсказав перевес Клинтон. Но победитель определяется в голосовании по штатам, так что точность национальных прогнозов не скорректировала ошибку при использовании опросов на уровне штатов. А на уровне штатов веса для групп с разным уровнем образования не использовались, потому что уровень образования избирателей на уровне штатов никогда не играл никакой значимой роли. А в 2016 году сыграл - и это стандартный пример "систематической ошибки", которую нельзя обнаружить, увеличивая, например, размер выборки. Во-вторых, явка оценивалась неправильно - по более тонким причинам. (Если бы уровень образования был правильно учтён, то прогнозы были бы гораздо точнее.) Я в январе давал ссылку на большой обзор Шона Тренда, в котором показаны рекордно низкие показатели Клинтон за пределами больших и средних городов.

Кон использует бейсбольный пример, чтобы проиллюстрировать статистическое содержание прогноза. Я во всех, кажется, своих записях, говоря о минимальных шансах Трампа, использовал примеры "Зенит" - "Томь" или ЦСКА - "Крылья Советов". Минимальные - не значит, что такое периодически не случается.

Метки:

1 мнение // Ваше мнение?
Comments
alextr98 From: alextr98 Date: Июнь, 1, 2017 16:14 (UTC) (Ссылка)

то прогнозы были бы гораздо точнее

Да, после сокрушительного облома с предсказаниями все предсказатели легко находят ошибки в своих расчётах и обещают, что уж в следующий-то раз они не накосячат.
Но никто же не отвечает за базар.
ksonin From: ksonin Date: Июнь, 1, 2017 16:54 (UTC) (Ссылка)

Re: то прогнозы были бы гораздо точнее

Не было никакого сокрушительного облома. "Томь" периодически, хотя и редко, побеждает ЦСКА.
zomaho From: zomaho Date: Июнь, 1, 2017 16:17 (UTC) (Ссылка)
Как я и говорил раньше, медианный социолог хреново представлял себе текущую стратификацию общества.
(Удалённый комментарий)
alextr98 From: alextr98 Date: Июнь, 1, 2017 18:44 (UTC) (Ссылка)

подгонка под правильный ответ

Или тщательное придуманное объяснение, почему ответ был неправильный.
oude_rus From: oude_rus Date: Июнь, 1, 2017 17:47 (UTC) (Ссылка)
//и это стандартный пример "систематической ошибки", которую нельзя обнаружить, увеличивая, например, размер выборки. //

Нельзя ли чуть поподробнее, почему нельзя?
Поскольку в предельном случае (=опрошены все) систематическая ошибка равна нулю.
iv_an_ru From: iv_an_ru Date: Июнь, 1, 2017 18:40 (UTC) (Ссылка)
Предположу, что имеется в виду выпадение параметров из рассмотрения вообще. Примерно как если опросить случайные 1%, или 10% или хоть все 100% точек окружности насчёт их координат, а потом построить линейную регрессию только по первому порядку, то она бодро покажет отсутствие зависимости между x и y. И только если добавить ранее выпавшие из рассмотрения x*x и y*y, то появится основание для предсказаний одной кооординаты по другой.

Edited at 2017-06-01 18:41 (UTC)
(Удалённый комментарий)
buddha239 From: buddha239 Date: Июнь, 1, 2017 19:32 (UTC) (Ссылка)
Спросить всех можно - чисто теоретически - но они не будут голосовать так же, как ответили. А половина не ответит вообще. Как раз из-за этого подобного рода опросы и превращаются в гадание на кофейной гуще.:)
vit_r From: vit_r Date: Июнь, 2, 2017 14:12 (UTC) (Ссылка)
Просто никто не знал, что при сборе данных надо следить за этим параметром. Наверняка, выборки репрезентативные, а не медиальные. Смесь рабочих и профессоров имеет разные пропорции в опросах и в реальности.

Плюс разные группы по-разному врали. Что опять же не позволяет ввести поправочные коэффициенты, когда их нет.

Главное, что всё в пределах ошибки прогноза и "Оп-с!" можно теперь называть "недостаточным уточнением".
viacheslav_sn From: viacheslav_sn Date: Июнь, 1, 2017 19:22 (UTC) (Ссылка)

А сколько еще всякого не учли? В экономике в том числе...

buddha239 From: buddha239 Date: Июнь, 1, 2017 19:33 (UTC) (Ссылка)
Самый интересный вопрос тут - можно ли это неучтенное хоть как-то учесть, или хватит гадать.:)
(Удалённый комментарий)
From: karajel Date: Июнь, 2, 2017 06:27 (UTC) (Ссылка)
Даже больше половины!!!
k_150 From: k_150 Date: Июнь, 2, 2017 03:00 (UTC) (Ссылка)
Гораздо удивительнее, что Тесла стоит 60 миллиардов.
yozhig From: yozhig Date: Июнь, 2, 2017 20:07 (UTC) (Ссылка)

Да, все дело в образовании, но только ли образовании тех, кто организует опросы?

1 мнение // Ваше мнение?