論文の概要: DRoPE: Directional Rotary Position Embedding for Efficient Agent Interaction Modeling
- arxiv url: http://arxiv.org/abs/2503.15029v1
- Date: Wed, 19 Mar 2025 09:23:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-20 15:22:19.279674
- Title: DRoPE: Directional Rotary Position Embedding for Efficient Agent Interaction Modeling
- Title(参考訳): DRoPE:効率的なエージェント相互作用モデリングのための方向回転位置埋め込み
- Authors: Jianbo Zhao, Taiyu Ban, Zhihao Liu, Hangning Zhou, Xiyang Wang, Qibin Zhou, Hailong Qin, Mu Yang, Lei Liu, Bin Li,
- Abstract要約: Directional Rotary Position Embedding (DRoPE) は、もともと自然言語処理で開発されたRotary Position Embedding (RoPE) の新規な適応である。
DRoPEは、RoPEの2次元回転変換に均一なIDスカラーを導入することで制限を克服する。
実験的な評価により、DRoPEの性能は良好であり、空間の複雑さは著しく低下した。
- 参考スコア(独自算出の注目度): 9.86959003425198
- License:
- Abstract: Accurate and efficient modeling of agent interactions is essential for trajectory generation, the core of autonomous driving systems. Existing methods, scene-centric, agent-centric, and query-centric frameworks, each present distinct advantages and drawbacks, creating an impossible triangle among accuracy, computational time, and memory efficiency. To break this limitation, we propose Directional Rotary Position Embedding (DRoPE), a novel adaptation of Rotary Position Embedding (RoPE), originally developed in natural language processing. Unlike traditional relative position embedding (RPE), which introduces significant space complexity, RoPE efficiently encodes relative positions without explicitly increasing complexity but faces inherent limitations in handling angular information due to periodicity. DRoPE overcomes this limitation by introducing a uniform identity scalar into RoPE's 2D rotary transformation, aligning rotation angles with realistic agent headings to naturally encode relative angular information. We theoretically analyze DRoPE's correctness and efficiency, demonstrating its capability to simultaneously optimize trajectory generation accuracy, time complexity, and space complexity. Empirical evaluations compared with various state-of-the-art trajectory generation models, confirm DRoPE's good performance and significantly reduced space complexity, indicating both theoretical soundness and practical effectiveness. The video documentation is available at https://drope-traj.github.io/.
- Abstract(参考訳): エージェント相互作用の高精度かつ効率的なモデリングは、自律運転システムの中核である軌道生成に不可欠である。
既存の手法、シーン中心、エージェント中心、クエリ中心のフレームワークは、それぞれ異なる利点と欠点を示し、精度、計算時間、メモリ効率で不可能な三角形を生成する。
この限界を打破するために、元々自然言語処理で開発された回転位置埋め込み(RoPE)の新たな適応である方向回転位置埋め込み(DRoPE)を提案する。
空間の複雑さをもたらす従来の相対的位置埋め込み(RPE)とは異なり、RoPEは複雑性を明示的に増大させることなく効率よく相対的位置を符号化するが、周期性による角情報処理の固有の制限に直面している。
DRoPEはこの制限を克服し、RoPEの2次元回転変換に均一なアイデンティティスカラーを導入し、回転角を現実的なエージェントの方向と整列させ、相対角情報を自然に符号化する。
DRoPEの精度と効率を理論的に解析し、軌道生成精度、時間複雑性、空間複雑さを同時に最適化する能力を示す。
DRoPEの優れた性能と空間の複雑さを大幅に低減し、理論的健全性と実用性の両方を示している。
ビデオ資料はhttps://drope-traj.github.io/.com/で公開されている。
関連論文リスト
- Benchmarking Rotary Position Embeddings for Automatic Speech Recognition [17.360059094663182]
RoPE(Rotary Position Embedding)は、Transformerベースのモデルにおいて、相対的および絶対的な位置情報を符号化する。
RoPEは、現在広く使われている相対的な位置埋め込みと比較して、一貫して低い誤差率を達成する。
さらなる研究を容易にするため、我々はSpeechBrainツールキットを通じて、実装とすべての実験的なレシピをリリースする。
論文 参考訳(メタデータ) (2025-01-10T15:30:46Z) - Bench2Drive-R: Turning Real World Data into Reactive Closed-Loop Autonomous Driving Benchmark by Generative Model [63.336123527432136]
我々は,リアクティブ閉ループ評価を可能にする生成フレームワークであるBench2Drive-Rを紹介する。
既存の自動運転用ビデオ生成モデルとは異なり、提案された設計はインタラクティブなシミュレーションに適したものである。
我々は、Bench2Drive-Rの生成品質を既存の生成モデルと比較し、最先端の性能を達成する。
論文 参考訳(メタデータ) (2024-12-11T06:35:18Z) - CARE Transformer: Mobile-Friendly Linear Visual Transformer via Decoupled Dual Interaction [77.8576094863446]
本稿では,新しいdetextbfCoupled dutextbfAl-interactive lineatextbfR atttextbfEntion (CARE) 機構を提案する。
まず,非対称な特徴分離戦略を提案し,非対称的に学習プロセスを局所帰納バイアスと長距離依存に分解する。
分離学習方式を採用し,特徴間の相補性を完全に活用することにより,高い効率性と精度を両立させることができる。
論文 参考訳(メタデータ) (2024-11-25T07:56:13Z) - Real-Time Motion Prediction via Heterogeneous Polyline Transformer with
Relative Pose Encoding [121.08841110022607]
既存のエージェント中心の手法は、公開ベンチマークで顕著な性能を示した。
K-nearest neighbor attention with relative pose encoding (KNARPE) は、トランスフォーマーがペアワイズ相対表現を使用できる新しいアテンション機構である。
エージェント間でコンテキストを共有し、変化しないコンテキストを再利用することで、私たちのアプローチはシーン中心のメソッドと同じくらい効率的になり、最先端のエージェント中心のメソッドと同等に実行されます。
論文 参考訳(メタデータ) (2023-10-19T17:59:01Z) - SPE-Net: Boosting Point Cloud Analysis via Rotation Robustness
Enhancement [118.20816888815658]
SPE-Netという名前の3Dポイントクラウドアプリケーションに適した新しいディープアーキテクチャを提案する。
埋め込みSelective Position variant' の手順は、入力の根底にある回転条件に効果的に対応できる注意機構に依存している。
SPE-Netと関連する仮説の利点を4つのベンチマークで示し、SOTA法よりも回転試験データと回転試験データの両方に明らかな改善点を示した。
論文 参考訳(メタデータ) (2022-11-15T15:59:09Z) - Joint Spatial-Temporal and Appearance Modeling with Transformer for
Multiple Object Tracking [59.79252390626194]
本稿ではTransSTAMという新しい手法を提案する。Transformerを利用して各オブジェクトの外観特徴とオブジェクト間の空間的時間的関係の両方をモデル化する。
提案手法はMOT16, MOT17, MOT20を含む複数の公開ベンチマークで評価され, IDF1とHOTAの両方で明確な性能向上を実現している。
論文 参考訳(メタデータ) (2022-05-31T01:19:18Z) - Attention-based Proposals Refinement for 3D Object Detection [0.0]
本稿では、注意機構を用いたROI特徴抽出に対して、よりデータ駆動的なアプローチをとる。
KITTIのテキスト検証実験により, クラスカーの84.84 APの競争性能を適度に向上することを示した。
論文 参考訳(メタデータ) (2022-01-18T15:50:31Z) - Rethinking and Improving Relative Position Encoding for Vision
Transformer [61.559777439200744]
リレーショナル位置符号化(RPE)は、トランスフォーマーが入力トークンのシーケンス順序をキャプチャする上で重要である。
画像RPE(iRPE)と呼ばれる2次元画像専用の新しい相対的位置符号化法を提案する。
論文 参考訳(メタデータ) (2021-07-29T17:55:10Z) - Conformer-based End-to-end Speech Recognition With Rotary Position
Embedding [11.428057887454008]
畳み込み強化変圧器(コンフォーマ)に回転位置埋め込み(RoPE)を導入する。
RoPEは、絶対位置情報を回転行列によって入力シーケンスにエンコードし、自然に明示的な相対位置情報を自己保持モジュールに組み込む。
提案モデルでは,LbriSpeechコーパスの試験クリーンおよびテスト他のセットに対して,コンバータの単語誤り率を8.70%,コンバータの7.27%削減する。
論文 参考訳(メタデータ) (2021-07-13T08:07:22Z) - RoFormer: Enhanced Transformer with Rotary Position Embedding [9.01819510933327]
位置情報を効果的に活用するためのRotary Position Embedding(RoPE)という新しい手法を提案する。
RoPEは絶対位置を回転行列でエンコードし、一方、自己アテンションの定式化に明示的な相対位置依存性を組み込む。
様々な長文分類ベンチマークデータセットを用いて、回転位置埋め込み(RoFormer)と呼ばれる拡張変換器の評価を行った。
論文 参考訳(メタデータ) (2021-04-20T09:54:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。