Приемы альтернативной математической статистики
для регионального анализа

Г.А. Гольц, Г.Г. Гольц

Доказывается необходимость в региональных транспортных исследованиях перейти от стандартной математической статистики к альтернативной математической статистике.

 

Введение. Суть альтернативной математической статистики (АМС) заключается в попытке преодоления препятствий к практическому использованию стандартной математической статистики (СМС), основанной на теории вероятностей. Парадоксально, что вероятностные представления зародились еще в XIV веке и использовались для подсчета шансов игроков в азартных играх, далее  расширительное использование приходится на страховые и демографические расчеты. В 40-х гг. XIX века снова возрос интерес к использованию вероятностного подхода в баллистике. Получены формулы расчета необходимого числа снарядов для поражения целей на плоскости и в пространстве. Затем, в конце XIX века стали пробовать эти идеи для расчета деловой активности и спекуляции на биржах. Здесь, пожалуй, впервые стало отчетливо ясно, что применение простых вероятностных схем не дает адекватных результатов; особенно это видно было при неудаче консультационных фирм, которые не смогли предвидеть большой мировой кризис 1929-1933 гг. в целом и по отдельным странам. Однако необходимость предвидения скачкообразных процессов деловой активности, потребовало изобретения нового подхода, который к настоящему времени оформился в виде методов, так называемого, технического анализа – симуляционные математические модели интуитивного характера, использующие знания коллективной психологии. Тем не менее, мы пошли другим путем.

В чем же корень неадекватности подходов СМС к жизненным процессам и явлениям? Дело в том, что теория вероятностей, развитая во второй половине XIX века и в XX веке, превратилась в такую строгую математическую теорию с выдающими интеллектуальными достижениями, что ее представители, по большей части, мало интересовались практическим применением и всецело ушли в красоту и непротиворечивость математических построений. Главные аксиомы теории вероятностей, взятой на вооружение СМС, состоят в следующем: рассматриваемые события случайны; они независимы друг от друга; их совокупность распределяется по нормальному закону распределения вероятностей.

На практике эти фундаментальные условия категорически не выполнимы. Поэтому по существу многочисленные учебники, руководства и т.п. по СМС остаются прекрасной иллюстрацией  человеческой интеллектуальной деятельности и пригодны лишь для учебных целей. Нельзя сказать, что эти слабости прекрасно организованной СМС не были не замечены. Еще Парсонс в 10-х гг. XX века писал о том, что он не имеет возможности использовать СМС для предвидения деловой активности. Среди исследований последнего времени можно отметить книгу Светунькова [1] . Складывается общее впечатление, что очарованные строгостью построений теории вероятностей, люди, по большей части, лаже не помышляли о том, что ее практическое воплощение весьма далеко от действительности. Такое положение сохраняется по настоящее время.

Основные положения АМС. Исходной позицией при конструировании АМС явился отказ от трех вышеизложенных аксиом. Если эти условия не выполнимы, то значит и следствия их также будут не выполнимы. Общеизвестно формальное следствие применения этих аксиом на практике: мультиколлинеарность, автокорреляция и др. Из всего багажа СМС берем на вооружение уровень тесноты связи (коэффициенты корреляции и детерминации) и вид функции (функция регрессии) этой связи. В практических приложениях самым главным является отклонение теоретической функции регрессии от фактических данных отдельно по каждому региону и на каждый год, т.к. для реальных исследований главным является уровень отклонений, вид распределения этих отклонений. Простые соображения хороши для обучения студентов («обнаружен тренд или хорошая зависимость на уровне коэффициента корреляции 0,8») и совершенно не пригодны для практических целей и только уводят в область поклонения гениям, создавшим стройное здание классической теории вероятностей. По существу, это фантом или мираж, весьма далек от действительности.

Поэтому, были введены два критерия адекватности получаемых функций:

1) максимальное отклонение теоретической функции от эмпирически наблюдаемой, не должно превышать по каждому региону или году 15-20%;

2) распределение отклонений должно приближаться к нормальному. Тогда при выполнении этого условия среднее отклонение факта от теории будет близко к 5-7%. Техника вычисления таких аппроксимирующих функций предполагает их нелинейность, наилучшим приближением по опыту проведения многочисленных экспериментальным расчетов является квадратичная поверхность.

Техника расчетов. Сначала строится матрица коэффициентов корреляции между изучаемыми переменными. Пример такой матрицы дан в табл. 1.

Табл. 1.Матрица коэффициентов корреляции между переменными

Эта таблица по 66 регионам РФ на 1995 г. составлена по электронному банку данных Росстата. Набор 17 переменных дает возможность экономического, экологического, транспортного анализа в совокупности регионов. С учетом направленности конференции, выбираем транспортный анализ. В качестве зависимого переменного возьмем перевозки грузов автотранспортом, млн. т, независимые – выработку электроэнергии, млрд. кВт.-ч и сумму перевозок грузов, млн. т. Соответствующая двухфакторная зависимость показана на рис.1.

Рис.1

По этой статистической поверхности рассчитаны отклонения факта от теории, рис. 2. По оси абсцисс отложены порядковые номера регионов по общему списку.

Рис.2

Наибольшие выбросы в отклонениях достаточно хорошо содержательно объясняются тем, что в этих регионах значителен объем перевозок морским транспортом, который не был нами учтен в исходной информации.

Далее дадим функции распределения отклонений в сравнении с нормальным распределением, рис. 3.

Рис. 3

Содержательное обсуждение полученных результатов. До сих пор эконом-географы, регионалисты, транспортники при анализе региональных различий в исключительных случаях доходили до универсальных зависимостей, в лучшем случае они ограничивались типологией. На основе принципиально новой технологии обработки статистических данных впервые получена единообразная функция для всего множества регионов РФ. Кроме того, показана устойчивость в динамике этой двухфакторной зависимости. Для транспортных расчетов особенно важна количественная оценка объема автотранспортных грузовых перевозок, по которым обычно нет достоверной отчетности. Можно предположить, что в дальнейшем с помощью описанного подхода можно найти много новых неизвестных до сих пор региональных универсальных зависимостей. Новое знание поможет в понимании, прогнозировании, планировании и проектировании региональных социально-экономических процессов.


© S.Waksman 2002