Один из основателей исследовательского агентства Data Insight аналитик Борис Овчинников объяснил, почему коронавирусная статистика в России, с его точки зрения, фальсифицируется на федеральном и региональном уровнях. Пост с подробным разбором данных о заболевших он разместил у себя в фейсбуке.
Овчинников проанализировал количество заболевших за 25 дней — с 30 апреля до 24 мая. Он заметил, что в этот отрезок число выявленных случаев COVID-19 четыре раза заканчивалось на 99. Вероятность подобного случайного совпадения крайне мала, хоть и не исключена, написал аналитик, — 0,011%, или один случай на 9350 попыток. Овчинников высчитал ее через биноминальное распределение.
Увеличив отрезок на 10 дней и начав отсчет с 20 апреля, он увидел, что в статистике по 85 регионам часто фигурировали цифры, заканчивающиеся на 98 или 99, а кратные 5 или 10 — почти никогда. Аналитик оценил вероятность подобной аномалии в десятые доли процента, а вероятность одновременного их появления еще меньше. Размышляя над этим, он предположил два объяснения. Согласно первому произошедшее — невероятная случайность.
«Или число выявленных за сутки больных, которое потом озвучивается гражданам, не считается через суммирование данных из регионов, а определяется сверху — в формате указания типа «покажите прирост около 8600». Дальше перед публикацией эта цифра «дезокругляется» — часто просто вычитанием единицы или двойки, что, кстати, требует дальше корректировки цифр по регионам или даже их рисования с нуля», — уточнил Овчинников.
Аналитик отметил, что фальсификация данных на региональном уровне не вызывала у него сомнений. Он привел в пример ситуации, когда в восьми регионах сразу число выявленных зараженных равнялось 97–98, а в Краснодарском крае 12 дней подряд количество новых случаев составляло от 96 до 99.
«Похоже, что фальсификация статистики по количеству выявленных больных — это не отдельные локальные инициативы, а единая многоуровневая система, где первична придуманная общероссийская цифра, а региональные цифры уже подгоняются под нее. Официальные цифры по количеству заболевших можно выбросить в мусорное ведро: нет никаких оснований считать, что они адекватно показывают динамику эпидемии. Может быть, показывают, может быть, нет — неизвестно. Качество рисованных цифр невозможно и абсурдно оценивать», — уточнил Овчинников.
Фальсификация федеральной статистики означает, что вероятность того, что в каждом отдельном регионе честные цифры, снижается, считает аналитик. «Цифры, например, по Москве и Новосибирску можно было рассматривать без связки с рисованием в Краснодаре — но можно ли их рассматривать без связки с рисованием федеральных цифр?» — написал он.
За актуальной информацией о COVID-19 можно следить на сайте «Стопкоронавирус.рф», в нашем телеграм-канале и онлайн-трансляции.