Зашел мужик в лавку, вяло посмотрел на прилавок, собрался уже уходить.
Вдруг видит: у входа кошечка молоко пьет, а блюдечко – Тутанхамон! 7-ой век до нашей эры!
Мужик возвращается к продавцу:
– Извините, я одинокий человек, живу без друзей. Вот ваша кошечка мне так приглянулась. Вы не могли бы мне ее отдать?
– Нет, нет. Ее так мои дети любят.
– Ну, я такой одинокий. Я вам 10 долларов дам.
– Нет, нет, не продается.
Наконец, на 150 долларов сторговались. Мужик уходит, уже в дверях оборачивается:
– Ваша кошечка, наверно, привыкла пить из этого блюдечка, вы не отдадите?
– Нет, нет.
– Я вам 10 долларов за него дам.
– Ну, что вы, это же Тутанхамон, 7-ой век до нашей эры… Я так уже 87 кошечек продал.
(с)
* *
… несколько слов о том, как людей вводят в заблуждение.
Один из самых известных способов – статистика.
Жители крупных городов любят “точность” и больше верят текстам, в которых есть какие-то цифры, хорошо, если это процент.
Но и “среднее значение” сойдет.
Пример.
Все мы слышали выражение “средняя пенсия в стране A составляет 14 тысяч рублей”.
Или “средняя зарплата в стране В составляет 30,8 тысяч рублей”.
Или я в учебнике прочитала: “среднестатистическая европейская семья в день производит 12 кг мусора”.
Что не так с этими числами?
Вы, наверное, удивитесь, но в математической статистике средняя величина для предоставления результатов ПОЧТИ НИКОГДА НЕ ИСПОЛЬЗУЕТСЯ, особенно, как самостоятельный результат.
Она нужна для дальнейших расчетов.
Если же она и представляется, как результат, то только вместе с гаусовой кривой и таблицей распределения результатов.
Почему? Понять очень просто.
Моя начальница на работе объясняла мне так:
Представь себе купе в поезде. В нем четыре пассажира. Их средний возраст 25 лет. Кто едет в вагоне?
“Молодежь”, – отвечаю я.
“Нет, – говорит начальница. Это две бабушки с внучками”.
Помните фразу про “среднюю температуру по больнице”?
А откуда она взята?
Она взята из анекдота:
“Во время эпидемии сельская больница отчитывается в райком: у нас все здоровы, средняя температура по больнице 36,6!
А в больнице половина больных в горячке, а вторая половина – в морге. А средняя – таки 36, 6 и это ПРАВДА!”
Человек так устроен, что, когда ему показывают какие-то средние результаты, он склонен думать, что таких результатов БОЛЬШИНСТВО. И ведь что интересно, так и должно быть – гаусова кривая называется еще НОРМАЛЬНЫМ распределением.
То есть мы ждем, что если в вагоне едут люди, средний возраст которых 20 лет, мы представляем вагон с молодежью. Спортивной командой, например. Или студентами.
Таким образом происходит подмена понятий. Среднее выдается за большинство.
Хотя так ли это, покажет таблица распределения результатов – каких результатов больше, и ложатся ли они в эту самую гаусову кривую.
А на самом деле может оказаться так, что результатов, аналогичных среднему, не только НЕ БОЛЬШИНСТВО, а их вообще НИ ОДНОГО – как в примере с бабушкой и внуками в купе.
Средний возраст 25 лет – а ни один из четырех пассажиров даже близко не приближается туда.
Может быть, в стране В никто не получает пенсию в 14 тысяч. Большинство получает 7-10, и несколько тысяч человек – под сотню. Может быть, никто не получает зарплату в 30 тысяч рублей. Получают 20, 40, 200, 800…
Может быть, ни одна семья в Европе не производит 12 кг мусора (среднеевропейская семья! Это кто вообще? В какой стране, сколько человек? Не, не спрашиваем – “среднеевропейская” прокатывает!)
Зачем же нам рассказывают про эти цифры?
Это просто.
С помощью средних величин отлично можно манипулировать сознанием.
Например, те самые 14 тысяч пенсии.
Моя мама получает 8, но, услышав про среднюю в 14, я могу думать, что другим бабушкам, БОЛЬШИНСТВУ других бабушек повезло больше и в принципе дела не так уж плохи.
Это если людей надо успокоить и создать ощущение стабильности.
А если наоборот, взвинтить, то можно сделать выборку по регионам и насчитать среднюю 5,5.
Теперь про выборки.
В статистике – серьезной статистике, а не в жонглировании цифрами – большую роль играет именно то, кого взяли для того, чтобы вести подсчеты.
Есть известный анекдот про опрос “пользуетесь ли вы интернетом?” 100% ответов “да”.
Опрос произведен в интернете:)
Это никого не волнует: опрос проведен, результат получен.
100% опрошенных пользуются Интернетом, значит, в нашей стране все пользуются интернетом:)
Вот, казалось бы: сравнение результатов школ по ЕГЭ.
Берется средний балл выпускников и сравнивается, в какой школе лучше готовят к ЕГЭ.
Вроде бы это корректное исследование.
Ведь ЕГЭ это уже выборка: возраст, уровень образования, одинаковые условия самого экзамена.
Но данный средний балл даст только информацию о том, каков средний балл по ЕГЭ в данной школе.
И всё.
Что останется за кадром?
Во-первых, количество учеников.
В одной школе 20 выпускников, в другой – 150. И там, и там по 10 отличников.
Соответственно, там, где детей мало, эти 10 отличников сильно повлияют на картину, а там, где выпускников 150, влияние отличников будет меньше.
Второе: мы не знаем вообще, сколько детей занимались с репетиторами. И чья вообще заслуга эти 10 отличников.
Третье: мы не знаем, сколько детей учились в этой школе хотя бы последние 2 года, а сколько пришли из других школ.
То есть для того, чтобы сравнивать показатели средних значений и делать выводы о школе, нужно взять одинаковые группы по полу, возрасту, подготовке, количеству лет у одного педагога, уровню успеваемости, и отсутствию репетиров.
Да, именно так проводятся психологические эксперименты.
Именно так собираются экспериментальные группы, чтобы можно было всерьез оценивать результаты исследований.
Данные в процентах очень сильно зависят от выборки.
Кого исследовали, когда, зачем, где.
В любом серьезном психологическом тесте есть таблица валидности результатов.
Там записаны результаты разных групп людей: мужчин и женщин – отдельно, по возрастам и уровню образования.
Соответственно, для студентки швейного ПТУ средним будет один результат, а для 50-тилетнего инженера – другой.
Вот, собственно, всё, что я хотела сказать.
Не приравнивание средние значения к большинству (и вообще не ведитесь на него, чаще всего средний – это несуществующий).
И интересуйтесь выборкой исследуемых, когда вам представляют результат в процентах.
Это я сейчас не коснулась вопроса, что большинство представляемых данных вообще результат фальсификации, а не исследований. Но это и так ясно. Мы живем в эпоху смерти информации, сказал какой-то умный человек, не знаю, кто именно.
Ольга Златогорская