論文の概要: Statistical inference of travelers' route choice preferences with
system-level data
- arxiv url: http://arxiv.org/abs/2204.10964v1
- Date: Sat, 23 Apr 2022 00:38:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-27 10:27:55.631539
- Title: Statistical inference of travelers' route choice preferences with
system-level data
- Title(参考訳): システムレベルデータを用いた旅行者の経路選択選好の統計的推定
- Authors: Pablo Guarda, Sean Qian
- Abstract要約: 本研究では,システムレベルのデータを用いて旅行者の実用機能を複数の属性で推定する手法を開発した。
合成データを用いた実験では、係数は一貫して回復され、仮説テストはどの属性が旅行者の経路選択の決定要因であるかを特定する信頼できる統計量であることが示されている。
この方法論は、新型コロナウイルスの感染拡大時に収集された実際のFresnoworldマルチソースデータを使用して、大規模に展開される。
- 参考スコア(独自算出の注目度): 4.120057972557892
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Traditional network models encapsulate travel behavior among all
origin-destination pairs based on a simplified and generic utility function.
Typically, the utility function consists of travel time solely and its
coefficients are equated to estimates obtained from stated preference data.
While this modeling strategy is reasonable, the inherent sampling bias in
individual-level data may be further amplified over network flow aggregation,
leading to inaccurate flow estimates. This data must be collected from surveys
or travel diaries, which may be labor intensive, costly and limited to a small
time period. To address these limitations, this study extends classical
bi-level formulations to estimate travelers' utility functions with multiple
attributes using system-level data. We formulate a methodology grounded on
non-linear least squares to statistically infer travelers' utility function in
the network context using traffic counts, traffic speeds, traffic incidents and
sociodemographic information, among other attributes. The analysis of the
mathematical properties of the optimization problem and of its pseudo-convexity
motivate the use of normalized gradient descent. We also develop a hypothesis
test framework to examine statistical properties of the utility function
coefficients and to perform attributes selection. Experiments on synthetic data
show that the coefficients are consistently recovered and that hypothesis tests
are a reliable statistic to identify which attributes are determinants of
travelers' route choices. Besides, a series of Monte-Carlo experiments suggest
that statistical inference is robust to noise in the Origin-Destination matrix
and in the traffic counts, and to various levels of sensor coverage. The
methodology is also deployed at a large scale using real-world multi-source
data in Fresno, CA collected before and during the COVID-19 outbreak.
- Abstract(参考訳): 従来のネットワークモデルは、シンプルで汎用的なユーティリティ関数に基づいて、すべての原点と終点のペア間の移動挙動をカプセル化する。
通常、実用関数は旅行時間のみで構成され、その係数は記述された嗜好データから得られる推定値に等しくなる。
このモデリング戦略は妥当であるが、個々のレベルのデータの固有のサンプリングバイアスは、ネットワークフローの集約よりもさらに増幅され、不正確なフロー推定につながる可能性がある。
このデータは、労働集約的で費用がかかり、短い期間に限定された調査や旅行日記から収集する必要がある。
これらの制約に対処するため,システムレベルのデータを用いて旅行者の実用機能を推定するために,古典的二段階定式化を拡張した。
我々は,交通数,交通速度,交通事故,社会デマログラフ情報などの属性を用いて,旅行者の実用機能を統計的に推定するために,非線形最小二乗法に基づく手法を定式化した。
最適化問題の数学的性質と擬凸性の解析は、正規化勾配降下の利用を動機付ける。
また,ユーティリティ関数係数の統計特性を検証し,属性選択を行うための仮説テストフレームワークを開発した。
合成データを用いた実験では、係数は一貫して回復され、仮説テストは旅行者の経路選択の決定要因となる属性を特定する信頼できる統計値であることが示されている。
さらに、モンテカルロ実験は、統計的推論が起源-運命行列のノイズや交通量、様々なレベルのセンサカバレッジに頑健であることを示唆している。
この方法論は、新型コロナウイルスの感染拡大前後に収集された、カリフォルニア州フレズノの実際のマルチソースデータを使って、大規模に展開される。
関連論文リスト
- Downstream-Pretext Domain Knowledge Traceback for Active Learning [138.02530777915362]
本稿では、下流知識と事前学習指導のデータ相互作用をトレースするダウンストリーム・プレテキスト・ドメイン知識トレース(DOKT)手法を提案する。
DOKTは、トレースバックの多様性指標とドメインベースの不確実性推定器から構成される。
10のデータセットで行った実験は、我々のモデルが他の最先端の手法よりも優れていることを示している。
論文 参考訳(メタデータ) (2024-07-20T01:34:13Z) - Causal Feature Selection via Transfer Entropy [59.999594949050596]
因果発見は、観察データによる特徴間の因果関係を特定することを目的としている。
本稿では,前向きと後向きの機能選択に依存する新たな因果的特徴選択手法を提案する。
精度および有限サンプルの場合の回帰誤差と分類誤差について理論的に保証する。
論文 参考訳(メタデータ) (2023-10-17T08:04:45Z) - Approximating Counterfactual Bounds while Fusing Observational, Biased
and Randomised Data Sources [64.96984404868411]
我々は、複数の、偏見のある、観察的、介入的な研究からのデータを統合するという問題に対処する。
利用可能なデータの可能性は局所的な最大値を持たないことを示す。
次に、同じアプローチが複数のデータセットの一般的なケースにどのように対処できるかを示す。
論文 参考訳(メタデータ) (2023-07-31T11:28:24Z) - Measuring Statistical Dependencies via Maximum Norm and Characteristic
Functions [0.0]
本稿では, 連接関数と積対角特性関数の差の最大ノルムに基づく統計的依存度尺度を提案する。
提案手法は、2つの異なる次元のランダムベクトル間の任意の統計的依存を検出することができる。
シミュレーションデータと実データの両方を用いて実験を行う。
論文 参考訳(メタデータ) (2022-08-16T20:24:31Z) - A Data-Driven Method for Automated Data Superposition with Applications
in Soft Matter Science [0.0]
我々は任意の座標変換で実験データを重畳するデータ駆動非パラメトリック法を開発した。
本手法は, 材料分類, 設計, 発見などの応用を通知する, 解釈可能なデータ駆動モデルを生成する。
論文 参考訳(メタデータ) (2022-04-20T14:58:04Z) - Data-SUITE: Data-centric identification of in-distribution incongruous
examples [81.21462458089142]
Data-SUITEは、ID(In-distriion)データの不連続領域を特定するためのデータ中心のフレームワークである。
我々は,Data-SUITEの性能保証とカバレッジ保証を実証的に検証する。
論文 参考訳(メタデータ) (2022-02-17T18:58:31Z) - Selecting the suitable resampling strategy for imbalanced data
classification regarding dataset properties [62.997667081978825]
医学、情報検索、サイバーセキュリティ、ソーシャルメディアなどの多くのアプリケーションドメインでは、分類モデルの導入に使用されるデータセットは、各クラスのインスタンスの不平等な分布を持つことが多い。
この状況は不均衡データ分類と呼ばれ、少数民族の例では予測性能が低い。
オーバーサンプリングとアンダーサンプリングの技術は、各クラスの例の数とバランスをとることでこの問題に対処する、よく知られた戦略である。
論文 参考訳(メタデータ) (2021-12-15T18:56:39Z) - Efficient Multidimensional Functional Data Analysis Using Marginal
Product Basis Systems [2.4554686192257424]
多次元関数データのサンプルから連続表現を学習するためのフレームワークを提案する。
本研究では, テンソル分解により, 得られた推定問題を効率的に解けることを示す。
我々は、ニューロイメージングにおける真のデータ応用で締めくくっている。
論文 参考訳(メタデータ) (2021-07-30T16:02:15Z) - Feature Shift Detection: Localizing Which Features Have Shifted via
Conditional Distribution Tests [12.468665026043382]
軍用センサーネットワークでは、ユーザーがセンサーの1つ以上の障害を検知する。
まず、この問題の形式化を複数の条件分布仮説テストとして定義する。
効率性と柔軟性の両面から,密度モデルスコア関数に基づくテスト統計法を提案する。
論文 参考訳(メタデータ) (2021-07-14T18:23:24Z) - Learning summary features of time series for likelihood free inference [93.08098361687722]
時系列データから要約機能を自動的に学習するためのデータ駆動型戦略を提案する。
以上の結果から,データから要約的特徴を学習することで,手作りの値に基づいてLFI手法よりも優れる可能性が示唆された。
論文 参考訳(メタデータ) (2020-12-04T19:21:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。