論文の概要: Subequivariant Reinforcement Learning in 3D Multi-Entity Physical Environments
- arxiv url: http://arxiv.org/abs/2407.12505v1
- Date: Wed, 17 Jul 2024 11:37:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-07-18 17:17:27.327940
- Title: Subequivariant Reinforcement Learning in 3D Multi-Entity Physical Environments
- Title(参考訳): 3次元多要素物理環境における準変分強化学習
- Authors: Runfa Chen, Ling Wang, Yu Du, Tianrui Xue, Fuchun Sun, Jianwei Zhang, Wenbing Huang,
- Abstract要約: 本稿では,階層型階層型ニューラルネットワーク(SHNN)を提案する。
SHNNはまずグローバル空間をタスク割り当てによってローカルエンティティレベルのグラフに動的に分離する。
その後、局所的なエンティティレベルのグラフを渡って、局所的な参照フレームを考案する。
- 参考スコア(独自算出の注目度): 31.437047774153037
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning policies for multi-entity systems in 3D environments is far more complicated against single-entity scenarios, due to the exponential expansion of the global state space as the number of entities increases. One potential solution of alleviating the exponential complexity is dividing the global space into independent local views that are invariant to transformations including translations and rotations. To this end, this paper proposes Subequivariant Hierarchical Neural Networks (SHNN) to facilitate multi-entity policy learning. In particular, SHNN first dynamically decouples the global space into local entity-level graphs via task assignment. Second, it leverages subequivariant message passing over the local entity-level graphs to devise local reference frames, remarkably compressing the representation redundancy, particularly in gravity-affected environments. Furthermore, to overcome the limitations of existing benchmarks in capturing the subtleties of multi-entity systems under the Euclidean symmetry, we propose the Multi-entity Benchmark (MEBEN), a new suite of environments tailored for exploring a wide range of multi-entity reinforcement learning. Extensive experiments demonstrate significant advancements of SHNN on the proposed benchmarks compared to existing methods. Comprehensive ablations are conducted to verify the indispensability of task assignment and subequivariance.
- Abstract(参考訳): 3D環境における多元性システムの学習ポリシーは、エンティティの数が増加するにつれて、グローバルな状態空間が指数関数的に拡張されるため、単一元性シナリオに対してはるかに複雑である。
指数複雑性を緩和する潜在的な解決策の1つは、大域空間を変換や回転を含む変換に不変な独立局所ビューに分割することである。
そこで本研究では,多義性ポリシー学習を容易にするために,サブ平等な階層型ニューラルネットワーク(SHNN)を提案する。
特にSHNNは,まずグローバルスペースを,タスク割り当てを通じてローカルエンティティレベルのグラフに動的に分離する。
第二に、局所的な実体レベルグラフを渡る準変分メッセージを利用して、局所的な参照フレームを考案し、特に重力の影響のある環境で、表現の冗長性を著しく圧縮する。
さらに、ユークリッド対称性の下でのマルチエンタリティシステムの微妙さを捉える上で、既存のベンチマークの限界を克服するために、幅広いマルチエンタリティ強化学習のための新しい環境スイートであるMulti-entity Benchmark(MEBEN)を提案する。
大規模な実験は、既存の手法と比較して提案したベンチマークにおいて、SHNNの大幅な進歩を示している。
タスク割り当てとサブ平等の不必要性を検証するために、包括的改善を行う。
関連論文リスト
- Cross-view geo-localization, Image retrieval, Multiscale geometric modeling, Frequency domain enhancement [1.6686955491488273]
クロスビュージオローカライゼーション(CVGL)は、異なる視点から撮影された画像間の空間的対応を確立することを目的としている。
CVGLは、厳密な幾何学的非対称性、画像領域間のテクスチャの不整合、および識別的局所情報の段階的な劣化により、依然として困難なままである。
本稿では、空間領域と周波数領域の相補表現を利用した空間周波数領域拡張ネットワーク(SFDE)を提案する。
論文 参考訳(メタデータ) (2026-03-03T08:25:35Z) - AINet: Anchor Instances Learning for Regional Heterogeneity in Whole Slide Image [61.54860340942449]
本稿では,その地域(地域)に代表されるインスタンスのコンパクトなサブセットであるアンカーインスタンス(AI)の概念を導入し,バッグ(グローバル)レベルで識別する。
これらのAIは、地域間の相互作用をガイドする意味的な参照として機能し、地域多様性を維持しながら非差別的なパターンを修正する。
我々は、単純な予測器を使用し、FLOPやパラメータを著しく少なくした最先端の手法を超越した、簡潔で効果的なフレームワークであるAINetを開発した。
論文 参考訳(メタデータ) (2026-02-21T09:36:27Z) - RegionReasoner: Region-Grounded Multi-Round Visual Reasoning [69.75509909581133]
RegionReasonerは視覚的推論のための強化学習フレームワークである。
これは、それぞれの推論トレースに対応する参照境界ボックスを明示的に引用することを要求することによって、根拠付き推論を強制する。
RegionReasonerは、基礎となる忠実さとグローバルなセマンティックアライメントを組み合わせた構造化された報酬で最適化されている。
論文 参考訳(メタデータ) (2026-02-03T16:52:16Z) - Learning Topology-Driven Multi-Subspace Fusion for Grassmannian Deep Network [31.003374497881968]
グラスマン多様体は幾何学的表現学習のための強力なキャリアを提供する。
本稿では,グラスマン多様体上での適応的部分空間協調を実現するトポロジ駆動型多部分空間融合フレームワークを提案する。
我々の研究は幾何学的深層学習を推進し、ユークリッドネットワークの証明されたマルチチャネル相互作用の哲学を非ユークリッド領域に適用する。
論文 参考訳(メタデータ) (2025-11-09T10:33:13Z) - BEVUDA++: Geometric-aware Unsupervised Domain Adaptation for Multi-View 3D Object Detection [56.477525075806966]
視覚中心のBird's Eye View (BEV) の認識は、自律運転にかなりの可能性を秘めている。
近年の研究では、効率性や精度の向上が優先されているが、ドメインシフトの問題は見過ごされている。
本稿では,この問題を解消するために,革新的な幾何学的学習支援フレームワークであるBEVUDA++を紹介する。
論文 参考訳(メタデータ) (2025-09-17T16:31:40Z) - IGL-DT: Iterative Global-Local Feature Learning with Dual-Teacher Semantic Segmentation Framework under Limited Annotation Scheme [3.440487702095727]
Semi-Supervised Semantic (SSSS)は、ラベル付き画像の小さなセットとラベルなしデータのより大きなプールを活用することにより、セグメンテーションの精度を向上させることを目的としている。
IGL-DTという2つの教師戦略を取り入れた新しい三分岐半教師付きセグメンテーションフレームワークを提案する。
本手法では,Global Context Learning と ResUnet を通した高レベルの意味指導にSwinUnet を用い,局所的学習を通じて詳細な特徴改善を行う。
論文 参考訳(メタデータ) (2025-04-14T01:51:29Z) - PFSD: A Multi-Modal Pedestrian-Focus Scene Dataset for Rich Tasks in Semi-Structured Environments [73.80718037070773]
本稿では, 半構造化シーンに, nuScenesの形式を付加したマルチモーダルなPedestrian-Focused Sceneデータセットを提案する。
また,密集・隠蔽シナリオにおける歩行者検出のためのHMFN(Hybrid Multi-Scale Fusion Network)を提案する。
論文 参考訳(メタデータ) (2025-02-21T09:57:53Z) - Deep Modularity Networks with Diversity--Preserving Regularization [4.659251704980846]
本稿では、クラスタ間分離のための距離ベース、クラスタ内多様性のための分散ベース、バランスの取れた割り当てのためのエントロピーベースという3つの新しい正規化用語を導入し、多様性を保ったDMoN-DPR(Deep Modularity Networks with Diversity-Preserving Regularization)を提案する。
本手法は,ベンチマークデータセットのクラスタリング性能を向上し,正規化相互情報(NMI)とF1スコアの大幅な改善を実現している。
これらの結果は、特に特徴豊富なデータセットにおいて、有意義で解釈可能なクラスタの作成において、多様性を保った正規化を組み込むことの有効性を示す。
論文 参考訳(メタデータ) (2025-01-23T08:05:59Z) - Spatial Semantic Recurrent Mining for Referring Image Segmentation [63.34997546393106]
高品質なクロスモーダリティ融合を実現するために,Stextsuperscript2RMを提案する。
これは、言語特徴の分散、空間的意味的再帰的分離、パーセマンティック・セマンティック・バランシングという三部作の作業戦略に従う。
提案手法は他の最先端アルゴリズムに対して好適に機能する。
論文 参考訳(メタデータ) (2024-05-15T00:17:48Z) - Semantic-Rearrangement-Based Multi-Level Alignment for Domain Generalized Segmentation [11.105659621713855]
異なるローカルセマンティック領域は、ソースドメインからターゲットドメインへの異なる視覚的特性を示す。
本稿では,Semantic-Rearrangement-based Multi-Level Alignment (SRMA)を提案する。
論文 参考訳(メタデータ) (2024-04-21T16:05:38Z) - Equivariant Local Reference Frames for Unsupervised Non-rigid Point Cloud Shape Correspondence [29.58888279920068]
EquiShapeは空間的および意味的整合性の両方に大域的な構造的手がかりを持つペアワイズLRFを学習するための新しい構造である。
また,LRF法に適用可能な最適化手法であるLRF-Refineを提案する。
われわれのフレームワークは3つのベンチマークで最先端の手法をはるかに上回っている。
論文 参考訳(メタデータ) (2024-04-01T06:59:56Z) - DCN-T: Dual Context Network with Transformer for Hyperspectral Image
Classification [109.09061514799413]
複雑な撮像条件による空間変動のため,HSI分類は困難である。
本稿では,HSIを高品質な三スペクトル画像に変換する三スペクトル画像生成パイプラインを提案する。
提案手法は,HSI分類における最先端手法よりも優れている。
論文 参考訳(メタデータ) (2023-04-19T18:32:52Z) - DuAT: Dual-Aggregation Transformer Network for Medical Image
Segmentation [21.717520350930705]
トランスフォーマーベースのモデルはコンピュータビジョンタスクで成功することが広く実証されている。
しかし、それらはしばしば大きなパターンの特徴によって支配され、局所的な詳細が失われる。
本稿では、2つの革新的な設計を特徴とするDuATと呼ばれるDual-Aggregation Transformer Networkを提案する。
大腸内視鏡画像における皮膚病変像とポリープの分画における最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2022-12-21T07:54:02Z) - Continuous-Time and Multi-Level Graph Representation Learning for
Origin-Destination Demand Prediction [52.0977259978343]
本稿では,原位置需要予測(CMOD)のための連続時間および多段階動的グラフ表現学習法を提案する。
状態ベクトルは、過去のトランザクション情報を保持し、最近発生したトランザクションに従って継続的に更新される。
北京地下鉄とニューヨークタクシーの2つの実世界のデータセットを用いて実験を行い、そのモデルが最先端のアプローチに対して優れていることを実証した。
論文 参考訳(メタデータ) (2022-06-30T03:37:50Z) - Learning to Aggregate Multi-Scale Context for Instance Segmentation in
Remote Sensing Images [28.560068780733342]
特徴抽出のプロセスを改善するために,新しいコンテキスト集約ネットワーク(CATNet)を提案する。
提案モデルは,高密度特徴ピラミッドネットワーク(DenseFPN),空間コンテキストピラミッド(SCP),階層的関心抽出器(HRoIE)の3つの軽量プラグアンドプレイモジュールを利用する。
論文 参考訳(メタデータ) (2021-11-22T08:55:25Z) - HS3: Learning with Proper Task Complexity in Hierarchically Supervised
Semantic Segmentation [81.87943324048756]
本稿では,タスクの複雑さによって意味のある表現を学習するためのセグメンテーションネットワークの中間層を監督するトレーニングスキームである階層的意味論(Hierarchically Supervised Semantic,HS3)を提案する。
提案するHS3-Fuseフレームワークはセグメンテーション予測をさらに改善し、2つの大きなセグメンテーションベンチマークであるNYUD-v2とCityscapesで最先端の結果を得る。
論文 参考訳(メタデータ) (2021-11-03T16:33:29Z) - G$^2$DA: Geometry-Guided Dual-Alignment Learning for RGB-Infrared Person
Re-Identification [3.909938091041451]
RGB-IRの人物再識別は、異種間の興味のある人物を検索することを目的としている。
本稿では,サンプルレベルのモダリティ差に対処するための幾何誘導デュアルアライメント学習フレームワーク(G$2$DA)を提案する。
論文 参考訳(メタデータ) (2021-06-15T03:14:31Z) - A Unified Theory of Decentralized SGD with Changing Topology and Local
Updates [70.9701218475002]
分散通信方式の統一収束解析を導入する。
いくつかの応用に対して普遍収束率を導出する。
私たちの証明は弱い仮定に依存している。
論文 参考訳(メタデータ) (2020-03-23T17:49:15Z) - Universal-RCNN: Universal Object Detector via Transferable Graph R-CNN [117.80737222754306]
我々はUniversal-RCNNと呼ばれる新しいユニバーサルオブジェクト検出器を提案する。
まず、すべてのカテゴリの高レベルなセマンティック表現を統合することで、グローバルなセマンティックプールを生成する。
ドメイン内推論モジュールは、空間認識GCNによってガイドされる1つのデータセット内のスパースグラフ表現を学習し、伝播する。
論文 参考訳(メタデータ) (2020-02-18T07:57:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。