論文の概要: A survey on deep learning approaches for data integration in autonomous
driving system
- arxiv url: http://arxiv.org/abs/2306.11740v2
- Date: Thu, 13 Jul 2023 04:04:01 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-14 17:17:17.482823
- Title: A survey on deep learning approaches for data integration in autonomous
driving system
- Title(参考訳): 自律運転システムにおけるデータ統合のためのディープラーニング手法の検討
- Authors: Xi Zhu, Likang Wang, Caifa Zhou, Xiya Cao, Yue Gong, Lei Chen
- Abstract要約: 本稿では,自律走行システムにおける認識モジュールに適用される最新のディープラーニング統合技術について検討する。
統合の新たな分類法が提案され、マルチビュー、マルチモダリティ、マルチフレームの3つの次元に基づいている。
- 参考スコア(独自算出の注目度): 7.308971969530509
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The perception module of self-driving vehicles relies on a multi-sensor
system to understand its environment. Recent advancements in deep learning have
led to the rapid development of approaches that integrate multi-sensory
measurements to enhance perception capabilities. This paper surveys the latest
deep learning integration techniques applied to the perception module in
autonomous driving systems, categorizing integration approaches based on "what,
how, and when to integrate". A new taxonomy of integration is proposed, based
on three dimensions: multi-view, multi-modality, and multi-frame. The
integration operations and their pros and cons are summarized, providing new
insights into the properties of an "ideal" data integration approach that can
alleviate the limitations of existing methods. After reviewing hundreds of
relevant papers, this survey concludes with a discussion of the key features of
an optimal data integration approach.
- Abstract(参考訳): 自動運転車の知覚モジュールは、環境を理解するためにマルチセンサーシステムに依存している。
近年のディープラーニングの進歩は、知覚能力を高めるためにマルチセンサー計測を統合するアプローチの急速な発展につながった。
本稿では,自律走行システムにおける認識モジュールに適用される最新のディープラーニング統合技術を調査し,「何,どのように,いつ,一体化すべきか」に基づいて,統合アプローチを分類する。
統合の新たな分類法が提案され、マルチビュー、マルチモダリティ、マルチフレームの3つの次元に基づいている。
統合操作とその長所と短所は要約され、既存のメソッドの制限を緩和できる"理想的な"データ統合アプローチの特性に関する新たな洞察を提供する。
何百もの関連論文をレビューした後、この調査は最適なデータ統合アプローチの重要な特徴に関する議論で締めくくります。
関連論文リスト
- Multimodal Alignment and Fusion: A Survey [7.250878248686215]
マルチモーダル統合により、モデルの精度と適用性が改善される。
我々は既存のアライメントと融合の手法を体系的に分類し分析する。
この調査は、ソーシャルメディア分析、医療画像、感情認識といった分野の応用に焦点を当てている。
論文 参考訳(メタデータ) (2024-11-26T02:10:27Z) - Hierarchical and Decoupled BEV Perception Learning Framework for Autonomous Driving [52.808273563372126]
本稿では,基本認識モジュールとユーザフレンドリなグラフィカルインタフェースのライブラリの提供を目的とした,新しい階層的BEV知覚パラダイムを提案する。
我々は,大規模公開データセットと合理化開発プロセスを効果的に活用するために,Pretrain-Finetune戦略を実行している。
また、マルチモジュールラーニング(MML)アプローチを提案し、複数のモデルの相乗的かつ反復的な訓練により性能を向上させる。
論文 参考訳(メタデータ) (2024-07-17T11:17:20Z) - Mutual Information Analysis in Multimodal Learning Systems [3.3748750222488657]
有名な例としては、自動運転車、オーディオ視覚生成システム、視覚言語システムなどがある。
このようなシステムは、テキスト、音声、画像、ビデオ、LiDARなどの複数の信号モダリティを統合し、様々なタスクを実行する。
このようなシステムを理解する上で重要な問題は、様々なモダリティとそれがタスクパフォーマンスに与える影響の関係である。
我々は、この問題に対する洞察を得るために、相互情報(MI)の概念を用いる。
論文 参考訳(メタデータ) (2024-05-21T02:16:16Z) - Drive Anywhere: Generalizable End-to-end Autonomous Driving with
Multi-modal Foundation Models [114.69732301904419]
本稿では、画像とテキストで検索可能な表現から、運転決定を提供することができる、エンドツーエンドのオープンセット(環境/シーン)自律運転を適用するアプローチを提案する。
当社のアプローチでは, 多様なテストにおいて非並列的な結果を示すと同時に, アウト・オブ・ディストリビューションの状況において, はるかに高いロバスト性を実現している。
論文 参考訳(メタデータ) (2023-10-26T17:56:35Z) - Spatio-Temporal Domain Awareness for Multi-Agent Collaborative
Perception [18.358998861454477]
車両間通信の潜在的な応用としてのマルチエージェント協調認識は、単一エージェント認識よりも自律走行車の性能知覚を著しく向上させる可能性がある。
本稿では,エージェント間の認識特性をエンドツーエンドに集約する新しい協調認識フレームワークSCOPEを提案する。
論文 参考訳(メタデータ) (2023-07-26T03:00:31Z) - Learning Unseen Modality Interaction [54.23533023883659]
マルチモーダル学習は、すべてのモダリティの組み合わせが訓練中に利用でき、クロスモーダル対応を学ぶことを前提としている。
我々は、目に見えないモダリティ相互作用の問題を提起し、第1の解を導入する。
異なるモジュラリティの多次元的特徴を、豊富な情報を保存した共通空間に投影するモジュールを利用する。
論文 参考訳(メタデータ) (2023-06-22T10:53:10Z) - Multi-View Class Incremental Learning [57.14644913531313]
マルチビュー学習(MVL)は、下流タスクのパフォーマンスを改善するためにデータセットの複数の視点から情報を統合することで大きな成功を収めている。
本稿では,複数視点クラスインクリメンタルラーニング(MVCIL)と呼ばれる新しいパラダイムについて考察する。
論文 参考訳(メタデータ) (2023-06-16T08:13:41Z) - CustOmics: A versatile deep-learning based strategy for multi-omics
integration [0.0]
本稿では,高次元マルチソース統合の場合のデータセットに適応する,カスタマイズ可能なオートエンコーダモデルを構築するための新しい戦略を提案する。
我々は,統合戦略が潜在表現に与える影響を評価し,新しい手法であるCustOmicsを提案する最善の戦略を組み合わせる。
論文 参考訳(メタデータ) (2022-09-12T14:20:29Z) - Pushing the Limits of Learning-based Traversability Analysis for
Autonomous Driving on CPU [1.841057463340778]
本稿では,リアルタイム機械学習に基づくトラバーサビリティ分析手法の提案と評価を行う。
新しい幾何学的特徴と視覚的特徴を統合し、重要な実装の詳細に焦点を当てることで、パフォーマンスと信頼性が著しく向上することを示します。
提案手法は、屋外運転シナリオのパブリックデータセットに関する最先端のDeep Learningアプローチと比較されている。
論文 参考訳(メタデータ) (2022-06-07T07:57:34Z) - End-to-End Constrained Optimization Learning: A Survey [69.22203885491534]
機械学習アーキテクチャとソルバと最適化手法を統合する作業の調査に焦点を当てている。
これらのアプローチは、問題に対する迅速、近似、構造的、解決策を予測し、論理的推論を可能にする新しいハイブリッド機械学習と最適化手法を開発することを約束します。
論文 参考訳(メタデータ) (2021-03-30T14:19:30Z) - Centralized Information Interaction for Salient Object Detection [68.8587064889475]
U字型構造は、多スケールの機能を効率的に組み合わせるサリエント物体検出に長けている。
本稿では,これらの接続を集中化することにより,相互に相互に情報交換を行うことができることを示す。
本手法は, ボトムアップ経路とトップダウン経路の接続を置換することにより, 既存のU字型サルエント物体検出手法と協調することができる。
論文 参考訳(メタデータ) (2020-12-21T12:42:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。