Как людей вводят в заблуждение

Как людей вводят в заблуждение

Зашел мужик в лавку, вяло посмотрел на прилавок, собрался уже уходить.
Вдруг видит: у входа кошечка молоко пьет, а блюдечко – Тутанхамон! 7-ой век до нашей эры!
Мужик возвращается к продавцу:
– Извините, я одинокий человек, живу без друзей. Вот ваша кошечка мне так приглянулась. Вы не могли бы мне ее отдать?
– Нет, нет. Ее так мои дети любят.
– Ну, я такой одинокий. Я вам 10 долларов дам.
– Нет, нет, не продается.

Наконец, на 150 долларов сторговались. Мужик уходит, уже в дверях оборачивается:
– Ваша кошечка, наверно, привыкла пить из этого блюдечка, вы не отдадите?
– Нет, нет.
– Я вам 10 долларов за него дам.
– Ну, что вы, это же Тутанхамон, 7-ой век до нашей эры… Я так уже 87 кошечек продал.
(с)
* *

… несколько слов о том, как людей вводят в заблуждение.
Один из самых известных способов – статистика.
Жители крупных городов любят “точность” и больше верят текстам, в которых есть какие-то цифры, хорошо, если это процент.
Но и “среднее значение” сойдет.

Пример.
Все мы слышали выражение “средняя пенсия в стране A составляет 14 тысяч рублей”.
Или “средняя зарплата в стране В составляет 30,8 тысяч рублей”.
Или я в учебнике прочитала: “среднестатистическая европейская семья в день производит 12 кг мусора”.
Что не так с этими числами?

Вы, наверное, удивитесь, но в математической статистике средняя величина для предоставления результатов ПОЧТИ НИКОГДА НЕ ИСПОЛЬЗУЕТСЯ, особенно, как самостоятельный результат.
Она нужна для дальнейших расчетов.

Если же она и представляется, как результат, то только вместе с гаусовой кривой и таблицей распределения результатов.

Почему? Понять очень просто.
Моя начальница на работе объясняла мне так:
Представь себе купе в поезде. В нем четыре пассажира. Их средний возраст 25 лет. Кто едет в вагоне?
“Молодежь”, – отвечаю я.
“Нет, – говорит начальница. Это две бабушки с внучками”.

Помните фразу про “среднюю температуру по больнице”?
А откуда она взята?
Она взята из анекдота:
“Во время эпидемии сельская больница отчитывается в райком: у нас все здоровы, средняя температура по больнице 36,6!
А в больнице половина больных в горячке, а вторая половина – в морге. А средняя – таки 36, 6 и это ПРАВДА!”

Человек так устроен, что, когда ему показывают какие-то средние результаты, он склонен думать, что таких результатов БОЛЬШИНСТВО. И ведь что интересно, так и должно быть – гаусова кривая называется еще НОРМАЛЬНЫМ распределением.
То есть мы ждем, что если в вагоне едут люди, средний возраст которых 20 лет, мы представляем вагон с молодежью. Спортивной командой, например. Или студентами.

Таким образом происходит подмена понятий. Среднее выдается за большинство.

Хотя так ли это, покажет таблица распределения результатов – каких результатов больше, и ложатся ли они в эту самую гаусову кривую.

А на самом деле может оказаться так, что результатов, аналогичных среднему, не только НЕ БОЛЬШИНСТВО, а их вообще НИ ОДНОГО – как в примере с бабушкой и внуками в купе.

Средний возраст 25 лет – а ни один из четырех пассажиров даже близко не приближается туда.
Может быть, в стране В никто не получает пенсию в 14 тысяч. Большинство получает 7-10, и несколько тысяч человек – под сотню. Может быть, никто не получает зарплату в 30 тысяч рублей. Получают 20, 40, 200, 800…
Может быть, ни одна семья в Европе не производит 12 кг мусора (среднеевропейская семья! Это кто вообще? В какой стране, сколько человек? Не, не спрашиваем – “среднеевропейская” прокатывает!)

Зачем же нам рассказывают про эти цифры?
Это просто.

С помощью средних величин отлично можно манипулировать сознанием.
Например, те самые 14 тысяч пенсии.

Моя мама получает 8, но, услышав про среднюю в 14, я могу думать, что другим бабушкам, БОЛЬШИНСТВУ других бабушек повезло больше и в принципе дела не так уж плохи.
Это если людей надо успокоить и создать ощущение стабильности.

А если наоборот, взвинтить, то можно сделать выборку по регионам и насчитать среднюю 5,5.

Теперь про выборки.
В статистике – серьезной статистике, а не в жонглировании цифрами – большую роль играет именно то, кого взяли для того, чтобы вести подсчеты.

Есть известный анекдот про опрос “пользуетесь ли вы интернетом?” 100% ответов “да”.
Опрос произведен в интернете:)

Это никого не волнует: опрос проведен, результат получен.
100% опрошенных пользуются Интернетом, значит, в нашей стране все пользуются интернетом:)

Вот, казалось бы: сравнение результатов школ по ЕГЭ.
Берется средний балл выпускников и сравнивается, в какой школе лучше готовят к ЕГЭ.
Вроде бы это корректное исследование.
Ведь ЕГЭ это уже выборка: возраст, уровень образования, одинаковые условия самого экзамена.

Но данный средний балл даст только информацию о том, каков средний балл по ЕГЭ в данной школе.
И всё.

Что останется за кадром?
Во-первых, количество учеников.
В одной школе 20 выпускников, в другой – 150. И там, и там по 10 отличников.
Соответственно, там, где детей мало, эти 10 отличников сильно повлияют на картину, а там, где выпускников 150, влияние отличников будет меньше.

Второе: мы не знаем вообще, сколько детей занимались с репетиторами. И чья вообще заслуга эти 10 отличников.

Третье: мы не знаем, сколько детей учились в этой школе хотя бы последние 2 года, а сколько пришли из других школ.

То есть для того, чтобы сравнивать показатели средних значений и делать выводы о школе, нужно взять одинаковые группы по полу, возрасту, подготовке, количеству лет у одного педагога, уровню успеваемости, и отсутствию репетиров.

Да, именно так проводятся психологические эксперименты.
Именно так собираются экспериментальные группы, чтобы можно было всерьез оценивать результаты исследований.

Данные в процентах очень сильно зависят от выборки.
Кого исследовали, когда, зачем, где.

В любом серьезном психологическом тесте есть таблица валидности результатов.

Там записаны результаты разных групп людей: мужчин и женщин – отдельно, по возрастам и уровню образования.

Соответственно, для студентки швейного ПТУ средним будет один результат, а для 50-тилетнего инженера – другой.

Вот, собственно, всё, что я хотела сказать.

Не приравнивание средние значения к большинству (и вообще не ведитесь на него, чаще всего средний – это несуществующий).

И интересуйтесь выборкой исследуемых, когда вам представляют результат в процентах.

Это я сейчас не коснулась вопроса, что большинство представляемых данных вообще результат фальсификации, а не исследований. Но это и так ясно. Мы живем в эпоху смерти информации, сказал какой-то умный человек, не знаю, кто именно.
Ольга Златогорская