Fugu-MT 論文翻訳(概要): RedMotion: Motion Prediction via Redundancy Reduction

論文の概要: RedMotion: Motion Prediction via Redundancy Reduction

arxiv url: http://arxiv.org/abs/2306.10840v2
Date: Thu, 5 Oct 2023 16:13:17 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-06 22:01:36.526103
Title: RedMotion: Motion Prediction via Redundancy Reduction
Title（参考訳）: RedMotion:冗長化による動き予測
Authors: Royden Wagner, Omer Sahin Tas, Marvin Klemp, Carlos Fernandez Lopez
Abstract要約: 動作予測のための変換モデルであるRedMotionを導入する。第1の冗長性低減は、内部トランスデコーダによって誘導され、可変サイズの道路環境トークンセットを縮小する。第2の冗長性低減は, 自己指導型学習目標であり, 道路環境の拡張ビューから生成された埋め込みに冗長性低減原理を適用した。
参考スコア（独自算出の注目度）: 13.530817610569448
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Predicting the future motion of traffic agents is vital for self-driving vehicles to ensure their safe operation. We introduce RedMotion, a transformer model for motion prediction that incorporates two types of redundancy reduction. The first type of redundancy reduction is induced by an internal transformer decoder and reduces a variable-sized set of road environment tokens, such as road graphs with agent data, to a fixed-sized embedding. The second type of redundancy reduction is a self-supervised learning objective and applies the redundancy reduction principle to embeddings generated from augmented views of road environments. Our experiments reveal that our representation learning approach can outperform PreTraM, Traj-MAE, and GraphDINO in a semi-supervised setting. Our RedMotion model achieves results that are competitive with those of Scene Transformer or MTR++. We provide an open source implementation that is accessible via GitHub (https://github.com/kit-mrt/red-motion) and Colab (https://colab.research.google.com/drive/1Q-Z9VdiqvfPfctNG8oqzPcgm0lP3y1il).
Abstract（参考訳）: 交通機関の将来の動きを予測することは、自動運転車の安全な運転を確保するために不可欠である。 2種類の冗長性低減を組み込んだ動作予測用トランスモデルであるredmotionを提案する。第1の冗長性低減は、内部変圧器デコーダによって誘導され、エージェントデータ付き道路グラフなどの道路環境トークンの可変サイズのセットを固定サイズの埋め込みに還元する。第2の冗長性低減は, 自己指導型学習目標であり, 道路環境の拡張ビューから生成された埋め込みに冗長性低減原理を適用した。実験の結果,PreTraM,Traj-MAE,GraphDINOを半教師付き環境下で,表現学習手法が優れていることがわかった。我々のRedMotionモデルは、Scene TransformerやMTR++と競合する結果を得る。 github(https://github.com/kit-mrt/red-motion)とcolab(https://colab.research.google.com/drive/1q-z9vdiqvfpfctng8oqzgm0lp3y1il)からアクセスできるオープンソース実装を提供する。

関連論文リスト

Reconstruction-Anchored Diffusion Model for Text-to-Motion Generation [34.87535133080741]
拡散モデルは、テキスト駆動の人間の動き生成と関連するタスクに広く採用されている。現在の動き拡散モデルは、運動固有情報を持たない事前訓練されたテキストエンコーダによって引き起こされる表現的ギャップと、反復的復調過程におけるエラー伝播の2つの大きな制限に直面している。本稿では,これらの課題に対処するため,再構成型拡散モデル(RAM)を提案する。
論文参考訳（メタデータ） (2026-01-21T09:11:45Z)
Driving on Registers [95.27138642798472]
DrivoRは、エンドツーエンドの自動運転のためのシンプルで効率的なトランスフォーマーベースのアーキテクチャである。提案手法は、事前訓練された視覚変換器(ViT)上に構築され、マルチカメラ機能をコンパクトなシーン表現に圧縮するカメラ対応レジスタトークンを導入している。この結果から,純変圧器アーキテクチャと目標トークン圧縮を組み合わせることで,高精度で適応的なエンド・ツー・エンド・ドライブを実現するのに十分であることが示唆された。
論文参考訳（メタデータ） (2026-01-08T16:28:24Z)
GEnSHIN: Graphical Enhanced Spatio-temporal Hierarchical Inference Network for Traffic Flow Prediction [0.7605656525323705]
本稿では,交通流予測における複雑な時間依存性を扱うためのグラフ拡張S時間階層推論ネットワーク(GEnSHIN)を提案する。公開データセットMETR-LAの実験では、GEnSHINが複数のメトリクスで比較モデルのパフォーマンスを上回ることが示されている。
論文参考訳（メタデータ） (2026-01-08T03:27:10Z)
ReCoM: Realistic Co-Speech Motion Generation with Recurrent Embedded Transformer [58.49950218437718]
音声に同期した高忠実で一般化可能な人体動作を生成するための効率的なフレームワークであるReCoMを提案する。 Recurrent Embedded Transformer (RET)は、動的埋め込み正規化(DER)をViT(Vit)コアアーキテクチャに統合する。モデルロバスト性を高めるため,ノイズ抵抗とクロスドメイン一般化の二重性を持つモデルに,提案したDER戦略を取り入れた。
論文参考訳（メタデータ） (2025-03-27T16:39:40Z)
Unified Human Localization and Trajectory Prediction with Monocular Vision [64.19384064365431]
MonoTransmotionはトランスフォーマーベースのフレームワークで、モノクロカメラのみを使用して、ローカライゼーションと予測タスクを共同で解決する。両タスクを統合フレームワークで共同でトレーニングすることにより,ノイズの多い入力による実環境シナリオにおいて,我々の手法がより堅牢であることを示す。
論文参考訳（メタデータ） (2025-03-05T14:18:39Z)
Mitigating Covariate Shift in Imitation Learning for Autonomous Vehicles Using Latent Space Generative World Models [60.87795376541144]
World Model(ワールドモデル)は、エージェントの次の状態を予測できるニューラルネットワークである。エンド・ツー・エンドのトレーニングでは、人間のデモで観察された状態と整合してエラーから回復する方法を学ぶ。クローズドループ試験における先行技術に有意な改善がみられた定性的,定量的な結果を示す。
論文参考訳（メタデータ） (2024-09-25T06:48:25Z)
OFMPNet: Deep End-to-End Model for Occupancy and Flow Prediction in Urban Environment [0.0]
環境中の全ての動的オブジェクトの将来の挙動を予測するために,エンド・ツー・エンドのニューラルネットワーク手法を提案する。本稿では, 終点誤差の大幅な低減を図った新しい時間重み付きモーションフロー損失を提案する。
論文参考訳（メタデータ） (2024-04-02T19:37:58Z)
JointMotion: Joint Self-Supervision for Joint Motion Prediction [10.44846560021422]
JointMotionは、自動運転車における関節運動予測のための自己教師付き事前訓練手法である。提案手法は,Wayformer,HPTR,Scene Transformerの各モデルにおける最終変位誤差を,それぞれ3%,8%,12%削減する。
論文参考訳（メタデータ） (2024-03-08T17:54:38Z)
MTR++: Multi-Agent Motion Prediction with Symmetric Scene Modeling and Guided Intention Querying [110.83590008788745]
自律運転システムにとって、複雑な運転シナリオを理解し、情報的な決定を下すためには、動きの予測が不可欠である。本稿では,これらの課題に対処するためのMotion TRansformer (MTR) フレームワークを提案する。最初のMTRフレームワークは、学習可能な意図クエリを備えたトランスフォーマーエンコーダ-デコーダ構造を利用する。複数のエージェントに対するマルチモーダル動作を同時に予測するMTR++フレームワークを導入する。
論文参考訳（メタデータ） (2023-06-30T16:23:04Z)
CEMFormer: Learning to Predict Driver Intentions from In-Cabin and External Cameras via Spatial-Temporal Transformers [5.572431452586636]
CEM(Cross-View Episodic Memory Transformer)と呼ばれる新しいフレームワークを導入する。 CEMは統合メモリ表現を使用して、ドライバーの意図予測を改善する。本稿では,運転コンテキストを補助的監視信号として組み込んで予測性能を向上させる新しいコンテキスト一貫性損失を提案する。
論文参考訳（メタデータ） (2023-05-13T05:27:36Z)
Motion Transformer with Global Intention Localization and Local Movement Refinement [103.75625476231401]
動き TRansformer (MTR) は、大域的意図の局所化と局所的な動きの洗練の合同最適化として、動き予測をモデル化する。 MTRは、限界運動予測と関節運動予測の両方において最先端の性能を達成する。
論文参考訳（メタデータ） (2022-09-27T16:23:14Z)
Road Network Guided Fine-Grained Urban Traffic Flow Inference [108.64631590347352]
粗いトラフィックからのきめ細かなトラフィックフローの正確な推測は、新たな重要な問題である。本稿では,道路ネットワークの知識を活かした新しい道路対応交通流磁化器(RATFM)を提案する。提案手法は,高品質なトラフィックフローマップを作成できる。
論文参考訳（メタデータ） (2021-09-29T07:51:49Z)
Multi-Modal Fusion Transformer for End-to-End Autonomous Driving [59.60483620730437]
画像表現とLiDAR表現を注目で統合する,新しいマルチモードフュージョントランスフォーマであるTransFuserを提案する。本手法は, 衝突を76%低減しつつ, 最先端駆動性能を実現する。
論文参考訳（メタデータ） (2021-04-19T11:48:13Z)
Trajectory Prediction in Autonomous Driving with a Lane Heading Auxiliary Loss [1.1470070927586014]
本稿では,全ての予測モードにおいて予測駆動ルールを強制することにより,軌道予測モデルを強化する損失関数を提案する。軌道予測への我々の貢献は2倍であり、オフロードレート計量の故障事例に対処する新しい指標を提案する。次に、この補助損失を用いて、MTP(Multiple trajectory Prediction)モデルとMultiPathモデルを拡張する。
論文参考訳（メタデータ） (2020-11-12T22:51:25Z)
TPNet: Trajectory Proposal Network for Motion Prediction [81.28716372763128]
Trajectory Proposal Network (TPNet) は、新しい2段階の動作予測フレームワークである。 TPNetはまず、仮説の提案として将来の軌道の候補セットを生成し、次に提案の分類と修正によって最終的な予測を行う。 4つの大規模軌道予測データセットの実験は、TPNetが定量的かつ定性的に、最先端の結果を達成することを示した。
論文参考訳（メタデータ） (2020-04-26T00:01:49Z)
Improving Movement Predictions of Traffic Actors in Bird's-Eye View Models using GANs and Differentiable Trajectory Rasterization [12.652210024012374]
自動運転パズルの最も重要なピースの1つは、周囲の交通機関の将来の動きを予測するタスクである。一方はトップダウンのシーン化と他方はGAN(Generative Adrial Networks)に基づく手法が特に成功したことが示されている。本稿では,これら2つの方向に基づいて,Aversa-based conditional GANアーキテクチャを提案する。提案手法を実世界の大規模データセット上で評価し,最先端のGANベースラインよりも優れていることを示す。
論文参考訳（メタデータ） (2020-04-14T00:41:17Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。