論文の概要: CERBERUS: Simple and Effective All-In-One Automotive Perception Model
with Multi Task Learning
- arxiv url: http://arxiv.org/abs/2210.00756v1
- Date: Mon, 3 Oct 2022 08:17:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-04 15:41:55.157129
- Title: CERBERUS: Simple and Effective All-In-One Automotive Perception Model
with Multi Task Learning
- Title(参考訳): CERBERUS:マルチタスク学習によるシンプルで効果的なオールインワン自動車知覚モデル
- Authors: Carmelo Scribano, Giorgia Franchini, Ignacio Sa\~nudo Olmedo, Marko
Bertogna
- Abstract要約: 車両内組み込みコンピューティングプラットフォームは、個々のタスクに対して重いモデルを実行するのに必要な計算労力に対処できない。
CERBERUSは、マルチタスク学習アプローチを利用して、単一推論のコストで複数の知覚タスクの実行を可能にする軽量モデルである。
- 参考スコア(独自算出の注目度): 4.622165486890318
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Perceiving the surrounding environment is essential for enabling autonomous
or assisted driving functionalities. Common tasks in this domain include
detecting road users, as well as determining lane boundaries and classifying
driving conditions. Over the last few years, a large variety of powerful Deep
Learning models have been proposed to address individual tasks of camera-based
automotive perception with astonishing performances. However, the limited
capabilities of in-vehicle embedded computing platforms cannot cope with the
computational effort required to run a heavy model for each individual task. In
this work, we present CERBERUS (CEnteR Based End-to-end peRception Using a
Single model), a lightweight model that leverages a multitask-learning approach
to enable the execution of multiple perception tasks at the cost of a single
inference. The code will be made publicly available at
https://github.com/cscribano/CERBERUS
- Abstract(参考訳): 周囲環境を知覚することは、自律的または補助的な運転機能を実現するのに不可欠である。
このドメインの一般的なタスクは、道路利用者の検出、車線境界の決定、運転条件の分類である。
ここ数年、カメラベースの自動車認識の個々のタスクに対処するために、さまざまな強力なディープラーニングモデルが提案されている。
しかし、車載組み込みコンピューティングプラットフォームの限られた能力は、個々のタスクごとに重いモデルを実行するのに必要な計算量に対応できない。
本研究では,CERBERUS (CEnteR based end-to-end peRception Using a Single model) を,マルチタスク学習アプローチを利用して,単一推論のコストで複数の知覚タスクの実行を可能にする軽量モデルとして提示する。
コードはhttps://github.com/cscribano/CERBERUSで公開される。
関連論文リスト
- CarDreamer: Open-Source Learning Platform for World Model based Autonomous Driving [25.49856190295859]
世界モデルに基づく強化学習(RL)は,様々な環境の複雑な力学を学習し,予測することで,有望なアプローチとして現れてきた。
高度な運転環境において、そのようなアルゴリズムを訓練し、テストするためのアクセス可能なプラットフォームは存在しない。
私たちは、WMベースの自動運転アルゴリズムの開発に特化して設計された、オープンソースの学習プラットフォームであるCarDreamerを紹介します。
論文 参考訳(メタデータ) (2024-05-15T05:57:20Z) - Looking for a better fit? An Incremental Learning Multimodal Object
Referencing Framework adapting to Individual Drivers [0.0]
自動車産業の急速な進歩により、タッチベースや音声コマンドシステムといった従来の車両のインタラクション方法は、車両外の物体を参照するなど、幅広い非運転関連のタスクには不十分である。
textitIcRegressは、オブジェクトの駆動と参照という2つのタスクに携わるドライバーの振る舞いや特徴に適応する、新しい回帰に基づく漸進的学習手法である。
論文 参考訳(メタデータ) (2024-01-29T12:48:56Z) - Drive Anywhere: Generalizable End-to-end Autonomous Driving with
Multi-modal Foundation Models [114.69732301904419]
本稿では、画像とテキストで検索可能な表現から、運転決定を提供することができる、エンドツーエンドのオープンセット(環境/シーン)自律運転を適用するアプローチを提案する。
当社のアプローチでは, 多様なテストにおいて非並列的な結果を示すと同時に, アウト・オブ・ディストリビューションの状況において, はるかに高いロバスト性を実現している。
論文 参考訳(メタデータ) (2023-10-26T17:56:35Z) - eP-ALM: Efficient Perceptual Augmentation of Language Models [70.47962271121389]
本稿では,既存モデルの適応性を向上するための直接的な取り組みを提案し,認識を伴う言語モデルの拡張を提案する。
視覚言語タスクに事前訓練されたモデルを適用するための既存のアプローチは、その効率を妨げているいくつかの重要なコンポーネントに依存している。
総パラメータの99%以上を凍結し,1つの直線射影層のみをトレーニングし,1つのトレーニング可能なトークンのみを予測することにより,我々のアプローチ(eP-ALM)は,VQAとCaptioningの他のベースラインよりも有意に優れていることを示す。
論文 参考訳(メタデータ) (2023-03-20T19:20:34Z) - Visual Exemplar Driven Task-Prompting for Unified Perception in
Autonomous Driving [100.3848723827869]
本稿では,タスク固有のプロンプトを通じて視覚的見本を提示する,効果的なマルチタスクフレームワークVE-Promptを提案する。
具体的には、境界ボックスと色に基づくマーカーに基づいて視覚的な例を生成し、ターゲットカテゴリの正確な視覚的外観を提供する。
我々は変圧器をベースとしたエンコーダと畳み込み層を橋渡しし、自律運転における効率的かつ正確な統合認識を実現する。
論文 参考訳(メタデータ) (2023-03-03T08:54:06Z) - Planning-oriented Autonomous Driving [60.93767791255728]
我々は、最終目標、すなわち自動運転車の計画を追求するために、好ましいフレームワークを考案し、最適化すべきであると主張している。
フルスタック運転タスクをひとつのネットワークに組み込んだ総合的なフレームワークであるUnified Autonomous Driving (UniAD)を紹介した。
論文 参考訳(メタデータ) (2022-12-20T10:47:53Z) - OFASys: A Multi-Modal Multi-Task Learning System for Building Generalist
Models [72.8156832931841]
ジェネリストモデルは、単一のモデル内でタスクに依存しない方法で多様なマルチモーダルタスクを実行することができる。
マルチモーダル命令と呼ばれる宣言型タスクインタフェース上に構築された汎用モデル学習システムOFASysをリリースする。
論文 参考訳(メタデータ) (2022-12-08T17:07:09Z) - Model-Based Visual Planning with Self-Supervised Functional Distances [104.83979811803466]
モデルに基づく視覚的目標達成のための自己監視手法を提案する。
私たちのアプローチは、オフラインでラベルなしのデータを使って完全に学習します。
このアプローチは,モデルフリーとモデルベース先行手法の両方で大幅に性能が向上することがわかった。
論文 参考訳(メタデータ) (2020-12-30T23:59:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。