Учитывая специфику сбора данных о транспортных потоках, предлагается обзор методов калибровки данных обследования интенсивности движения
Основной для выполнения проектов ОДД и имитационного моделирования потоков являются данные интенсивности движения, замеры которой обычно выполняются на перекрестках в пиковые часы с подсчетом интенсивности движения по отдельным направлениям. При использовании данных обследований интенсивности движения на отдельных элементах сети, неизбежно возникают ошибки: по данным замеров на смежных перекрестках величины входящего и выходящего потоков имеют разные значения. Эти ошибки вызваны проведением замеров в разные дни и ошибками самих подсчетов (рис. 1):
|
|
Рис.1. Схема входящего и выходящего потоков
Учитывая специфику сбора данных о транспортных потоках в российских условиях, в статье предлагается обзор следующих методов калибровки данных интенсивности потока: 1) наименьших квадратов; 2) максимального правдоподобия; 3) размытой регрессии; 4)метод размытой оптимизации; 5) интервальный регрессионный.
Алгоритм задач можно представить следующим образом: даны значения интенсивности потоков на дугах транспортной сети. Необходимо откорректировать значения потоков с учетом сохранения баланса и других ограничений.
Метод наименьших квадратов (МНК) основан на минимизации суммы разностей квадратов между наблюдаемыми и оцененными значениями интенсивности потоков:
(1)
при условии сохранения потоков и других ограничений. Для больших сетей метод может оказаться слишком громоздким в вычислительном отношении, однако не требует дополнительных предположений и допущений. Он может быть приведен к взвешенному МНК, в котором веса определяют для каждого квадратного члена.
Табл. 1. Методы уравнивания данных интенсивности транспортного потока на сетях
1 - Схематичное представление для МНК; 2 - Метод максимального правдоподобия; 3 - Метод «размытой» регрессии; 4 - Методом «размытой» оптимизации; 5 - Интервальный регрессионный метод
Метод максимального правдоподобия используют, когда наблюдаемое значение можно представить в виде случайного, распределенного с вероятностью , где - параметр распределения вероятности, подлежащий оцениванию. Необходимо определить такие параметры распределения , при которых вероятность получения наблюдаемых значений будет максимальной, с учетом соответствующих ограничений на . Van Zuylen и Branston [3] предложили функцию вероятности , зависящую только от значений и , и предложили оценивать параметры в виде: , (3)
следовательно: (4)
Приняв, - распределение Пуассона, решением задачи будет: (5)
где - множитель Лагранжа, определяется заменой решения (5) ограничениями (например, и т.д.). Индекс определяет число ограничений. В случае - функция нормального распределения с постоянной дисперсией ( ), решение (5) эквивалентно решению МНК (1), если дисперсия для каждого наблюдаемого значения различна (учитывается величина разности между замерами) решение сводится к решению взвешенного МНК.
Для риc.1 целевая функция:
при условии: , , ,
Если принимается как функция распределения Пуассона, на оцениваемые параметры ограничения по знаку не налагаются.
|
|
|
|
|
|
|
|
|
|
||
Где значение определяется решением системы ограничений
для
|
|
|
для
для |
|
|
Willumsen и van Zuylen [3,4] первоначально использовали данный алгоритм для определения матриц корреспонденций транспортных потоков. Для того чтобы решение сходилось, необходимо условие сохранения потоков. Принималось, что суммарный объем исходящего потока равнялся входящему. С логической точки зрения этот метод наиболее подходит в случаях независимости и случайности наблюдаемых значений. В нашем случае значения потоков на дугах графа сети коррелированны.
Willumsen [4] модифицировал метод до максимизации энтропии, аналогичной МНК (который, в свою очередь, эквивалентен методу максимума правдоподобия, при ) с весами.
Метод «размытой» регрессии подобен методу максимального правдоподобия. Различие в том, что вместо функции распределения вероятности, метод предполагает наличие некоторого размытого разброса данных (fuzzy cloud) с центром . Под размытостью понимается «около », даже если значение неизвестно. Центром функции принадлежности «около », принимается оценка . При этом принадлежит размытому множеству, близость которого к определяется величиной . Метод сводится к поиску оценок максимизирующих для всех , при минимальном и соответствующих ограничениях. Ввиду чего, функция принадлежности отображает допустимое отклонение между и : для всех , (6)
где - оценка близости к , в размытом множестве;
По образу треугольника, функция принадлежности имеет экстремум в и определяется справой и слевой сторон треугольника: для и для соответственно, - основание треугольника (устанавливается аналитически).
Для риc. 1 целевая функция имеет вид: , при ограничениях: , для всех , где для всех ; для всех ; ; ; .
Метод «размытой» оптимизации относится к группе задач, в которых исходные данные рассматриваются как аппроксимированные, оценки которых расположены внутри некоторого интервала наблюдаемых. Здесь используется понятие «приближенное », как размытое множество около . Первоначально идея метода заложена Kikuchi [5] и в дальнейшем усовершенствована совместно с Miljkovic [5]. Предполагается наличие функции принадлежности размытого множества вокруг , внутри которого расположены значения оценок. Функция принадлежности определяется аналитически в зависимости от допустимого отклонения между и . Необходимо отметить, метод размытой регрессии использует функцию принадлежности , в то время как метод размытой оптимизации . Это различие определяет степень «размытости» в наблюдаемых значениях и в оценках соответственно, что приводит к разным экстремумам функции принадлежности рассмотренных методов.
Задав функцию принадлежности «около », величиной , оценки могут быть получены двумя способами: максимум при минимуме ; максимум суммы :
или
|
(7) |
при условии сохранения потоков и других ограничений.
В обоих случаях алгоритм решения представляет собой задачу линейного программирования. В табл. 1 задача формируется следующим образом: для целевая функция ; в случае целевая функция: ,
при условии: ; для ; ; ; , где и отображают правую и левую стороны треугольной функции принадлежности, соответственно:
для всех для всех , где - основание функции принадлежности.
Интервальный регрессионный метод . В нем отдельные значения конвертируют в диапазон ( ) – диапазон достоверности, в котором исследуются оценки при условии соответствующих ограничений. В свою очередь оценки расположены в интервале Алгоритм сводится к нахождению таких оценок , при которых достигается максимум суммы диапазонов .
(8)
при условии: ; для всех и других ограничений накладываемых на исследуемые потоки, где интервал данных . Значение принимается аналитически в зависимости от достоверности данных. диапазон оценок с центром .
Для риc. 1 целевая функция задачи: , при условии ; для ; ; ; , .
В случае отсутствия предварительной информации о достоверности исходных данных справедливо использовать однородный диапазон, пределы которого устанавливаются аналитически с учетом неопределенности данных. Слишком узкий интервал разброса, может оказаться не пригодным для решения задачи. Слишком большой приведет к значительным расхождениям между наблюдаемыми и рассчитанными значениями интенсивности потока.
Среди вышерассмотренных методов первые два являются легко интерпретируемыми, поскольку относятся к классу классических задач по оценке параметров. Метод размытой регрессии наибольшим образом подойдет, если оценки носят статистической характер, если зависимость между и определяется функцией вероятности.
Последние два метода направлены на поиск оценок в некотором диапазоне исходных данных, устанавливаемого аналитическим путем в зависимости от достоверности данных и допустимого разброса между наблюдаемыми и оцененными значениями интенсивности потока. Метод размытой оптимизации может учитывать «мягкие» ограничения относительно взаимосвязи исходных данных. Введение таких предположений в модель возможно благодаря теории «размытого» множества. Интервальный регрессионный метод производит поиск решения внутри жестко ограниченного диапазона исходных данных и не может включать «мягкие» условия. Данный метод, как правило, используется в случае низкой достоверности исходных данных.
Литература
1. Zhao, M., Garrick, N. W., and Achenie, L.K., Data Reconciliation- Based Traffic Count analysis System, Transportation Research Record, 1625, TRB, National Research Council, Washington, D.C., 1998, pp. 12-17.
2. Henk J. van Zuylen and David M Branston. Consistent link flow estimation from counts. Transportation Research, Vol. 16B, 1982, pp. 473 – 476.
3. Henk J. van Zuylen and Luis G. Willumsen. The Most Likely Trip Matrix Estimated From Traffic Counts. Transportation Research, Vol. 14B, 1980, pp. 281-293.
4.
Kikuchi,
S. and Miljkovic, D. A Method to Pre-process Observed
Traffic Data for Consistency: Application of Fuzzy optimization
Concept. Presented at the 78th Annual Meeting of the
Transportation Research Board,