論文の概要: To Analyze and Regulate Human-in-the-loop Learning for Congestion Games
- arxiv url: http://arxiv.org/abs/2501.03055v1
- Date: Mon, 06 Jan 2025 14:41:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-07 17:06:22.442794
- Title: To Analyze and Regulate Human-in-the-loop Learning for Congestion Games
- Title(参考訳): 混雑ゲームのためのループ学習の分析と制御
- Authors: Hongbo Li, Lingjie Duan,
- Abstract要約: 混雑ゲームでは、利己的なユーザは最短経路に群がり、ソーシャルプランナーは情報や支払いインセンティブを通じて、そのような利己的なルーティングを規制する仕組みを設計する。
我々は,到着時パスを過度に発見しようとする場合にのみ最新の交通情報を公開すると同時に,過度に発見したい場合にその情報を隠蔽する,新しい選択情報開示機構を提案する。
- 参考スコア(独自算出の注目度): 17.986928810925686
- License:
- Abstract: In congestion games, selfish users behave myopically to crowd to the shortest paths, and the social planner designs mechanisms to regulate such selfish routing through information or payment incentives. However, such mechanism design requires the knowledge of time-varying traffic conditions and it is the users themselves to learn and report past road experiences to the social planner (e.g., Waze or Google Maps). When congestion games meet mobile crowdsourcing, it is critical to incentivize selfish users to explore non-shortest paths in the best exploitation-exploration trade-off. First, we consider a simple but fundamental parallel routing network with one deterministic path and multiple stochastic paths for users with an average arrival probability $\lambda$. We prove that the current myopic routing policy (widely used in Waze and Google Maps) misses both exploration (when strong hazard belief) and exploitation (when weak hazard belief) as compared to the social optimum. Due to the myopic policy's under-exploration, we prove that the caused price of anarchy (PoA) is larger than \(\frac{1}{1-\rho^{\frac{1}{\lambda}}}\), which can be arbitrarily large as discount factor \(\rho\rightarrow1\). To mitigate such huge efficiency loss, we propose a novel selective information disclosure (SID) mechanism: we only reveal the latest traffic information to users when they intend to over-explore stochastic paths upon arrival, while hiding such information when they want to under-explore. We prove that our mechanism successfully reduces PoA to be less than~\(2\). Besides the parallel routing network, we further extend our mechanism and PoA results to any linear path graphs with multiple intermediate nodes.
- Abstract(参考訳): 混雑ゲームでは、利己的なユーザは最短経路に群がり、ソーシャルプランナーは情報や支払いインセンティブを通じて、そのような利己的なルーティングを規制する仕組みを設計する。
しかし、そのようなメカニズム設計には時間的な交通条件の知識が必要であり、過去の道路経験をソーシャルプランナー(例えば、WazeやGoogle Maps)に学習し報告することがユーザ自身である。
混雑ゲームがモバイルのクラウドソーシングに適合する場合には、利己的なユーザに対して、最高の搾取と探索のトレードオフにおいて、非ショートパスを探求するインセンティブを与えることが重要である。
まず,1つの決定論的経路と,平均到着確率$\lambda$を持つユーザのための複数の確率的経路を持つ,単純だが基本的な並列ルーティングネットワークを検討する。
現状の筋電図ルーティングポリシー(WazeやGoogle Mapsで広く使われている)は,社会的最適性と比較して,探索(強い危険信念)と搾取(弱い危険信念)の両方を欠いていることを証明している。
筋電図政策の探索不足により、引き起こされるアナーキー(PoA)の価格が \(\frac{1}{1-\rho^{\frac{1}{\lambda}}}\) より大きいことが証明され、これは割引係数 \(\rho\rightarrow 1\) として任意に大きい。
このような大きな効率損失を軽減するため、我々は新しい選択情報開示機構(SID)を提案し、到着時に確率的経路を過度に発見しようとする場合にのみ最新の交通情報をユーザに公開し、過度に発見したい場合にその情報を隠蔽する。
この機構がPoAを~\(2\)以下に抑えることを証明した。
並列ルーティングネットワークの他に、複数の中間ノードを持つ任意の線形パスグラフに対して、我々のメカニズムとPoA結果をさらに拡張する。
関連論文リスト
- Human-in-the-loop Learning for Dynamic Congestion Games [17.986928810925686]
本研究では, 利用者が交通条件を学習し, 交通条件を変更する方法について検討する。
提案手法は,経路の過度な探索に繋がることを示す。
本研究では,選択したユーザグループからすべての情報を隠蔽するための複合的な隠蔽・確率的レコメンデーション(CHAR)機構を提案する。
論文 参考訳(メタデータ) (2024-04-24T02:23:12Z) - Implicit Occupancy Flow Fields for Perception and Prediction in
Self-Driving [68.95178518732965]
自動運転車(SDV)は、周囲を認識でき、他の交通参加者の将来の行動を予測できなければならない。
既存の作業は、検出されたオブジェクトの軌跡が続くオブジェクト検出を実行するか、シーン全体の密度の高い占有とフローグリッドを予測するかのいずれかである。
これは、認識と将来の予測に対する統一されたアプローチを動機付け、単一のニューラルネットワークで時間とともに占有とフローを暗黙的に表現します。
論文 参考訳(メタデータ) (2023-08-02T23:39:24Z) - TransPath: Learning Heuristics For Grid-Based Pathfinding via
Transformers [64.88759709443819]
探索の効率を顕著に向上させると考えられる,インスタンス依存のプロキシを学習することを提案する。
私たちが最初に学ぶことを提案するプロキシは、補正係数、すなわち、インスタンスに依存しないコスト・ツー・ゴの見積もりと完璧な見積もりの比率である。
第2のプロキシはパス確率であり、グリッドセルが最も短いパスに横たわっている可能性を示している。
論文 参考訳(メタデータ) (2022-12-22T14:26:11Z) - Online Learning for Traffic Routing under Unknown Preferences [30.83342068243601]
トラフィックネットワークに料金を設定するオンライン学習手法を提案し、異種ユーザをシステム効率のよいトラフィックパターンに向けて異なる時間的価値で駆動する。
特に,ネットワークの道路上で観測された集合フローに基づいて,各時間ごとの料金を調整できる簡易かつ効果的なアルゴリズムを開発した。
論文 参考訳(メタデータ) (2022-03-31T16:21:29Z) - Road Network Guided Fine-Grained Urban Traffic Flow Inference [108.64631590347352]
粗いトラフィックからのきめ細かなトラフィックフローの正確な推測は、新たな重要な問題である。
本稿では,道路ネットワークの知識を活かした新しい道路対応交通流磁化器(RATFM)を提案する。
提案手法は,高品質なトラフィックフローマップを作成できる。
論文 参考訳(メタデータ) (2021-09-29T07:51:49Z) - Distributed Deep Reinforcement Learning for Intelligent Traffic
Monitoring with a Team of Aerial Robots [3.04585143845864]
本研究では,航空ロボットチームによる道路ネットワークにおける交通監視問題について検討する。
深層強化学習に基づく分散スケーラブルなアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-07-10T22:41:32Z) - Learning to Route via Theory-Guided Residual Network [27.440532972814783]
我々は,交通シミュレータにおいて最も重要な部分の一つである人間のルーティングモデルを学習することを提案する。
残余のネットワークは限られたデータから人間のルーティングモデルを学ぶことができる。
我々は,複数の実世界のデータセットについて広範な実験を行い,モデルの優れた性能を示す。
論文 参考訳(メタデータ) (2021-05-18T05:07:34Z) - Neural Pruning via Growing Regularization [82.9322109208353]
プルーニングの2つの中心的な問題:プルーニングのスケジュールと重み付けの重要度だ。
具体的には, ペナルティ要因が増大するL2正規化変種を提案し, 精度が著しく向上することを示した。
提案アルゴリズムは,構造化プルーニングと非構造化プルーニングの両方において,大規模データセットとネットワークの実装が容易かつスケーラブルである。
論文 参考訳(メタデータ) (2020-12-16T20:16:28Z) - Deep Reinforcement Learning Based Dynamic Route Planning for Minimizing
Travel Time [8.234463661266169]
歩行者の深い強化学習に基づく経路計画アルゴリズムを設計する。
本稿では,道路渋滞を回避するため,エージェントが深層Qネットワークを通じて戦略を学習する動的調整可能な経路計画法を提案する。
シミュレーションの結果,DARPアルゴリズムは,従来の最短経路計画アルゴリズムと比較して,混雑条件下で52%の時間を節約できることがわかった。
論文 参考訳(メタデータ) (2020-11-03T15:10:09Z) - Local Differential Privacy based Federated Learning for Internet of
Things [72.83684013377433]
Internet of Vehicles (IoV)は、Waze、Uber、Amazon Mechanical Turkなど、さまざまなクラウドソーシングアプリケーションをシミュレートする。
これらのアプリケーションのユーザは、ユーザの報告したトラフィック情報に基づいて機械学習モデルをトレーニングするクラウドサーバに、リアルタイムのトラフィック情報を報告する。
本稿では,機械学習モデルを実現するためのクラウドソーシングアプリケーションを容易にするために,フェデレーション学習とローカルディファレンシャルプライバシ(LDP)を統合することを提案する。
論文 参考訳(メタデータ) (2020-04-19T14:03:10Z) - It Is Not the Journey but the Destination: Endpoint Conditioned
Trajectory Prediction [59.027152973975575]
フレキシブルな人間の軌道予測のための予測条件付きネットワーク(PECNet)を提案する。
PECNetは長距離マルチモーダル軌道予測を支援するために遠方のエンドポイントを推論する。
我々は、PECNetがスタンフォードドローン軌道予測ベンチマークの最先端性能を20.9%改善し、ETH/UCYベンチマークの40.8%向上したことを示す。
論文 参考訳(メタデータ) (2020-04-04T21:27:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。