Методы уравнивания данных интенсивности транспортного потока на сетях

Р.Ю Лагерев

Учитывая специфику сбора данных о транспортных потоках, предлагается обзор методов калибровки данных обследования интенсивности движения

Основной для выполнения проектов ОДД и имитационного моделирования потоков являются данные интенсивности движения, замеры которой обычно выполняются на перекрестках в пиковые часы с подсчетом интенсивности движения по отдельным направлениям. При использовании данных обследований интенсивности движения на отдельных элементах сети, неизбежно возникают ошибки: по данным замеров на смежных перекрестках величины входящего и выходящего потоков имеют разные значения. Эти ошибки вызваны проведением замеров в разные дни и ошибками самих подсчетов (рис. 1):

 

Рис.1. Схема входящего и выходящего потоков

Учитывая специфику сбора данных о транспортных потоках в российских условиях, в статье предлагается обзор следующих методов калибровки данных интенсивности потока: 1) наименьших квадратов; 2) максимального правдоподобия; 3) размытой регрессии; 4)метод размытой оптимизации; 5) интервальный регрессионный.

Алгоритм задач можно представить следующим образом: даны значения интенсивности  потоков на дугах транспортной сети. Необходимо откорректировать значения потоков с учетом сохранения баланса и других ограничений. 

Метод наименьших квадратов (МНК) основан на минимизации суммы разностей квадратов между наблюдаемыми и оцененными значениями интенсивности потоков:

(1)

при условии сохранения потоков и других ограничений. Для больших сетей метод может оказаться слишком громоздким в вычислительном отношении, однако не требует дополнительных предположений и допущений. Он может быть приведен к взвешенному МНК, в котором веса определяют для каждого квадратного члена. 

Табл. 1. Методы уравнивания данных интенсивности транспортного потока на сетях

 

 

1 - Схематичное представление для МНК; 2 - Метод максимального правдоподобия; 3 - Метод «размытой» регрессии; 4 - Методом «размытой» оптимизации; 5 - Интервальный регрессионный метод

Метод максимального правдоподобия используют, когда наблюдаемое значение  можно представить в виде случайного, распределенного с вероятностью , где   - параметр распределения вероятности, подлежащий оцениванию. Необходимо определить такие параметры распределения  , при которых вероятность получения наблюдаемых значений будет максимальной, с учетом соответствующих ограничений  на . Van Zuylen и Branston [3] предложили функцию вероятности , зависящую только от значений  и , и предложили оценивать параметры в виде: ,      (3)

следовательно:   (4) 

Приняв,  - распределение Пуассона, решением задачи будет:       (5)

где - множитель Лагранжа, определяется заменой решения (5) ограничениями (например,  и т.д.). Индекс  определяет число ограничений. В случае  - функция нормального распределения с постоянной дисперсией ( ), решение (5) эквивалентно решению МНК (1), если дисперсия для каждого наблюдаемого значения  различна (учитывается величина разности между замерами) решение сводится к решению взвешенного МНК.

Для риc.1 целевая функция: 

при условии: ,  ,  , 

Если  принимается как функция распределения Пуассона, на оцениваемые параметры ограничения по знаку не налагаются.

 

 

 

 

 

 

Где значение  определяется решением системы ограничений

 

для

 

 

для

для

 

 

 

Willumsen и van Zuylen [3,4] первоначально использовали данный алгоритм для определения матриц корреспонденций транспортных потоков. Для того чтобы решение сходилось, необходимо условие сохранения потоков. Принималось, что суммарный объем исходящего потока равнялся входящему. С логической точки зрения этот метод наиболее подходит в случаях независимости и случайности наблюдаемых значений. В нашем случае значения потоков на дугах графа сети коррелированны.

Willumsen [4] модифицировал метод до максимизации энтропии, аналогичной МНК (который, в свою очередь, эквивалентен методу максимума правдоподобия, при ) с весами.

 

Метод «размытой» регрессии подобен методу максимального правдоподобия.  Различие в том, что вместо функции распределения вероятности, метод предполагает наличие некоторого размытого разброса данных (fuzzy cloud) с центром . Под размытостью понимается «около », даже если значение  неизвестно. Центром функции принадлежности «около », принимается оценка . При этом  принадлежит размытому множеству, близость которого  к  определяется величиной . Метод сводится к поиску оценок  максимизирующих  для всех , при минимальном  и соответствующих ограничениях. Ввиду чего, функция принадлежности отображает допустимое отклонение между  и :   для всех , (6)

где   - оценка близости  к , в размытом множестве;

По образу треугольника, функция принадлежности имеет экстремум в  и определяется справой  и слевой сторон треугольника:  для и  для  соответственно, - основание треугольника (устанавливается аналитически).

 Для риc. 1 целевая функция имеет вид:  , при ограничениях: ,  для всех , где   для всех ;   для всех ;  ;   ;   . 

Метод «размытой» оптимизации относится к группе задач, в которых исходные данные рассматриваются как аппроксимированные, оценки которых расположены внутри некоторого интервала наблюдаемых. Здесь используется понятие «приближенное  », как размытое множество около . Первоначально идея метода заложена Kikuchi [5] и в дальнейшем усовершенствована совместно с Miljkovic [5]. Предполагается наличие функции принадлежности размытого множества  вокруг , внутри которого расположены значения оценок. Функция принадлежности определяется аналитически в зависимости от допустимого отклонения  между  и  . Необходимо отметить, метод размытой регрессии использует функцию принадлежности  , в то время как метод размытой оптимизации . Это различие определяет степень «размытости»  в наблюдаемых значениях и в оценках соответственно, что приводит к разным экстремумам функции принадлежности рассмотренных методов.

Задав функцию принадлежности «около », величиной , оценки  могут быть получены двумя способами: максимум при минимуме ; максимум суммы :

 или 

 

(7)

 при условии сохранения потоков и других ограничений.

В обоих случаях алгоритм решения представляет собой задачу линейного программирования. В табл. 1 задача формируется следующим образом: для целевая функция  ; в случае  целевая функция: ,

при условии: ;  для  ;  ;   ;   , где  и  отображают правую и левую стороны треугольной функции принадлежности, соответственно:

 для всех    для всех , где - основание функции принадлежности.

Интервальный регрессионный метод . В нем отдельные значения  конвертируют в диапазон ( ) – диапазон достоверности, в котором исследуются оценки    при условии соответствующих ограничений. В свою очередь оценки   расположены в интервале   Алгоритм сводится к нахождению таких оценок , при которых достигается максимум суммы диапазонов .

 (8)

при условии: ;   для всех  и других ограничений накладываемых на исследуемые потоки, где интервал данных . Значение  принимается аналитически в зависимости от достоверности данных.   диапазон оценок с центром .

 Для риc. 1 целевая функция задачи: , при условии ;   для  ; ;   ;   ,  .

 В случае отсутствия предварительной информации о достоверности исходных данных справедливо использовать однородный диапазон, пределы которого устанавливаются аналитически с учетом неопределенности данных. Слишком узкий интервал разброса, может оказаться не пригодным для решения задачи. Слишком большой приведет к значительным расхождениям между наблюдаемыми и рассчитанными значениями интенсивности потока.

Среди вышерассмотренных методов первые два являются легко интерпретируемыми, поскольку относятся к классу классических задач по оценке параметров. Метод размытой регрессии наибольшим образом подойдет, если оценки носят статистической характер, если зависимость между  и  определяется функцией вероятности.

 Последние два метода направлены на поиск оценок в некотором диапазоне исходных данных, устанавливаемого аналитическим путем в зависимости от достоверности данных и допустимого разброса между наблюдаемыми и оцененными значениями интенсивности потока. Метод размытой оптимизации может учитывать «мягкие» ограничения относительно взаимосвязи исходных данных. Введение таких  предположений в модель  возможно благодаря теории «размытого» множества. Интервальный регрессионный метод производит поиск решения внутри жестко ограниченного диапазона исходных данных и не может включать  «мягкие» условия. Данный метод, как правило, используется в случае низкой достоверности исходных данных.

Литература

1.         Zhao, M., Garrick, N. W., and Achenie, L.K., Data Reconciliation- Based Traffic Count analysis System, Transportation Research Record, 1625, TRB, National Research Council, Washington, D.C., 1998, pp. 12-17.

2.         Henk J. van Zuylen and David M Branston. Consistent link flow estimation from counts. Transportation Research, Vol. 16B, 1982, pp. 473 – 476.

3.         Henk J. van Zuylen and Luis G. Willumsen. The Most Likely Trip Matrix Estimated From Traffic Counts. Transportation Research, Vol. 14B, 1980, pp. 281-293.

4.         Kikuchi, S. and Miljkovic, D. A Method to Pre-process Observed Traffic Data for Consistency: Application of Fuzzy optimization Concept. Presented at the 78th Annual Meeting of the Transportation Research Board, Washington, D.C., Jan. 1999.


© S.Waksman, 2002