論文の概要: Don't Freeze, Don't Crash: Extending the Safe Operating Range of Neural Navigation in Dense Crowds
- arxiv url: http://arxiv.org/abs/2603.06729v1
- Date: Fri, 06 Mar 2026 03:15:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:12.998798
- Title: Don't Freeze, Don't Crash: Extending the Safe Operating Range of Neural Navigation in Dense Crowds
- Title(参考訳): 冷やすな, クラッシュするな - 群衆の安全運転範囲を拡大する
- Authors: Jiefu Zhang, Yang Xu, Vaneet Aggarwal,
- Abstract要約: 学習に基づく群集ナビゲーションは、密度に敏感な観察正規化により、分布外な群集サイズで動作することができる。
ゼロショット密度一般化を実現する高密度可変密度ナビゲーションのための強化学習手法を提案する。
- 参考スコア(独自算出の注目度): 44.223491175769105
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Navigating safely through dense crowds requires collision avoidance that generalizes beyond the densities seen during training. Learning-based crowd navigation can break under out-of-distribution crowd sizes due to density-sensitive observation normalization and social-cost scaling, while analytical solvers often remain safe but freeze in tight interactions. We propose a reinforcement learning approach for dense, variable-density navigation that attains zero-shot density generalization using a density-invariant observation encoding with density-randomized training and physics-informed proxemic reward shaping with density-adaptive scaling. The encoding represents the distance-sorted $K$ nearest pedestrians plus bounded crowd summaries, keeping input statistics stable as crowd size grows. Trained with $N\!\in\![11,16]$ pedestrians in a $3\mathrm{m}\times3\mathrm{m}$ arena and evaluated up to $N\!=\!21$ pedestrians ($1.3\times$ denser), our policy reaches the goal in $>99\%$ of episodes and achieves $86\%$ collision-free success in random crowds, with markedly less freezing than analytical methods and a $>\!60$-point collision-free margin over learning-based benchmark methods. Codes are available at \href{https://github.com/jznmsl/PSS-Social}{https://github.com/jznmsl/PSS-Social}.
- Abstract(参考訳): 密集した群衆を安全に航行するには衝突回避が必要であり、訓練中に見られる密度を超えて一般化する。
学習ベースの群集ナビゲーションは、密度に敏感な観察正規化と社会的コストのスケーリングによって、分布外の群集サイズで破壊されることがあるが、分析的解法はしばしば安全であるが、密接な相互作用では凍結する。
本研究では,密度ランダム化学習を用いた密度不変観測と,密度適応スケーリングによる物理インフォームド・プロキセミック・リワード・シェーピングを用いたゼロショット密度一般化を実現することを目的とした,密度密度密度ナビゲーションのための強化学習手法を提案する。
エンコーディングは、最寄りの歩行者に100ドル(約1万2000円)の距離を割り出し、群衆の規模が大きくなるにつれて、入力統計は安定している。
学費は$N\!
イン!
3.11,16]$ pedestrians in a $3\mathrm{m}\times3\mathrm{m}$ arena and evaluation to $N\!
=\!
21ドルの歩行者(1.3\times$ denser)、われわれのポリシーは99\%のエピソードで目標に達し、ランダムな群衆の衝突のない成功を8,6\%で達成している。
学習ベースのベンチマーク手法よりも60$ポイントの衝突のないマージン。
コードは \href{https://github.com/jznmsl/PSS-Social}{https://github.com/jznmsl/PSS-Social} で公開されている。
関連論文リスト
- Spectral Sentinel: Scalable Byzantine-Robust Decentralized Federated Learning via Sketched Random Matrix Theory on Blockchain [0.0]
ビザンチンのクライアントは、不均一な(Non-IID)データの下での濃度勾配を中毒する。
本稿では,ビザンチン検出・集約フレームワークであるSpectral Sentinelを提案する。
Polygonネットワーク上でブロックチェーンを統合することで,完全なシステムを実現しています。
論文 参考訳(メタデータ) (2025-12-14T09:43:03Z) - MaskPro: Linear-Space Probabilistic Learning for Strict (N:M)-Sparsity on Large Language Models [53.36415620647177]
半構造化された空間は、M$M$の重みからN$の要素を戦略的に保持することで、有望なソリューションを提供する。
既存の(N:M)互換のアプローチは通常、かなりのエラーに悩まされるルールベースの階層的な欲求探索と、禁止的なトレーニングコストを引き起こす勾配駆動学習の2つのカテゴリに分類される。
MaskProという新しい線形空間確率的フレームワークを提案する。これは、M$連続重みごとに事前のカテゴリー分布を学習し、その後、この分布を活用して(N:M)スパーシリティを$N$-wayサンプリングを通じて生成することを目的としている。
論文 参考訳(メタデータ) (2025-06-15T15:02:59Z) - A Generalized Shuffle Framework for Privacy Amplification: Strengthening Privacy Guarantees and Enhancing Utility [4.7712438974100255]
パーソナライズされたプライバシパラメータで$(epsilon_i,delta_i)$-PLDP設定をシャッフルする方法を示す。
shuffled $(epsilon_i,delta_i)$-PLDP process approximately saves $mu$-Gaussian Differential Privacy with mu = sqrtfrac2sum_i=1n frac1-delta_i1+eepsilon_i-max_ifrac1-delta_i1+e
論文 参考訳(メタデータ) (2023-12-22T02:31:46Z) - Scalable Primal-Dual Actor-Critic Method for Safe Multi-Agent RL with
General Utilities [12.104551746465932]
安全マルチエージェント強化学習について検討し、エージェントはそれぞれの安全制約を満たしつつ、局所的な目的の総和をまとめて最大化しようとする。
我々のアルゴリズムは、$mathcalOleft(T-2/3right)$のレートで1次定常点(FOSP)に収束する。
サンプルベースの設定では、高い確率で、我々のアルゴリズムは、$epsilon$-FOSPを達成するために$widetildemathcalOleft(epsilon-3.5right)$サンプルが必要です。
論文 参考訳(メタデータ) (2023-05-27T20:08:35Z) - $CrowdDiff$: Multi-hypothesis Crowd Density Estimation using Diffusion Models [26.55769846846542]
群集カウントは群集分析の基本的な問題であり、群集密度マップを推定し、群集密度値の和を和らげることが典型的である。
逆拡散過程として群衆密度マップを生成するCrowdDiff$を提示する。
また,拡散モデルの性質から,数量化性能を向上させるため,複数の密度マップを作成することを提案する。
論文 参考訳(メタデータ) (2023-03-22T17:58:01Z) - Scale-Aware Crowd Counting Using a Joint Likelihood Density Map and
Synthetic Fusion Pyramid Network [15.882525477601183]
本研究では,クラウドカウントのためのスケールアウェアロス関数を設計したSPF-Net(Synthetic Fusion Pyramid Network)を開発した。
既存のクラウドカウント手法では、トレーニングアノテーションポイントが正確であると仮定し、ノイズの多いアノテーションが大きなモデル学習バイアスや誤差のカウントにつながることを無視する。
この研究は、エンド・ツー・エンドの損失設計において複数のスケールでこのようなノイズを適切に処理し、群衆に最先端のノイズを数えさせる最初のものである。
論文 参考訳(メタデータ) (2022-11-13T06:52:47Z) - STCrowd: A Multimodal Dataset for Pedestrian Perception in Crowded
Scenes [78.95447086305381]
3D空間における歩行者の正確な検出と追跡は、回転、ポーズ、スケールの大きなバリエーションのために困難である。
既存のベンチマークは2Dアノテーションのみを提供するか、あるいは低密度の歩行者分布を持つ限定的な3Dアノテーションを持つ。
混み合ったシナリオにおける歩行者認識アルゴリズムをよりよく評価するために,大規模なマルチモーダルデータセットSTCrowdを導入する。
論文 参考訳(メタデータ) (2022-04-03T08:26:07Z) - LDC-Net: A Unified Framework for Localization, Detection and Counting in
Dense Crowds [103.8635206945196]
視覚的群集分析の急速な発展は、単に密度マップを要約するのではなく、位置決めや検出によって人を数える傾向を示している。
群集の局所化と検出に関する最近の研究には,1) 群集を扱えない典型的な検出法と,大規模に変化する群集を扱えないこと,2) 密度マップ法は,特に高密度群集や大規模群集において,位置とボックスの予測における性能不足に悩まされていること,の2つの制限がある。
論文 参考訳(メタデータ) (2021-10-10T07:55:44Z) - Learning with User-Level Privacy [61.62978104304273]
ユーザレベルの差分プライバシー制約下での学習課題を,アルゴリズムを用いて解析する。
個々のサンプルのプライバシーのみを保証するのではなく、ユーザレベルのdpはユーザの貢献全体を保護します。
プライバシコストが$tau$に比例した$K$適応的に選択されたクエリのシーケンスにプライベートに答えるアルゴリズムを導き出し、私たちが検討する学習タスクを解決するためにそれを適用します。
論文 参考訳(メタデータ) (2021-02-23T18:25:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。