論文の概要: COLA: COarse-LAbel multi-source LiDAR semantic segmentation for autonomous driving
- arxiv url: http://arxiv.org/abs/2311.03017v2
- Date: Sun, 26 Jan 2025 21:18:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-28 13:51:04.687710
- Title: COLA: COarse-LAbel multi-source LiDAR semantic segmentation for autonomous driving
- Title(参考訳): COLA:Coarse-LabelマルチソースLiDARセマンティックセマンティックセグメンテーションによる自動運転
- Authors: Jules Sanchez, Jean-Emmanuel Deschaud, François Goulette,
- Abstract要約: LIDARセマンティックセグメンテーショントレーニングと推論の異なる方法は、いくつかのサブフィールドに分けられる。
本研究では,これらすべてのサブフィールドにおいて,マルチソース・トレーニングの新たなアプローチにより結果を改善することを目的としている。
マルチソーストレーニングにおける共通の障害を克服するため、粗いラベルを導入し、新たに作成されたマルチソースデータセットCOLAを呼び出します。
- 参考スコア(独自算出の注目度): 7.35996217853436
- License:
- Abstract: LiDAR semantic segmentation for autonomous driving has been a growing field of interest in recent years. Datasets and methods have appeared and expanded very quickly, but methods have not been updated to exploit this new data availability and rely on the same classical datasets. Different ways of performing LIDAR semantic segmentation training and inference can be divided into several subfields, which include the following: domain generalization, source-to-source segmentation, and pre-training. In this work, we aim to improve results in all of these subfields with the novel approach of multi-source training. Multi-source training relies on the availability of various datasets at training time. To overcome the common obstacles in multi-source training, we introduce the coarse labels and call the newly created multi-source dataset COLA. We propose three applications of this new dataset that display systematic improvement over single-source strategies: COLA-DG for domain generalization (+10%), COLA-S2S for source-to-source segmentation (+5.3%), and COLA-PT for pre-training (+12%). We demonstrate that multi-source approaches bring systematic improvement over single-source approaches.
- Abstract(参考訳): 近年,自動運転のためのLiDARセマンティックセマンティックセマンティックセマンティクスが注目されている。
データセットとメソッドは非常に急速に拡張されているが、この新しいデータ可用性を活用するためのメソッドは更新されておらず、同じ古典的なデータセットに依存している。
LIDARセマンティックセグメンテーショントレーニングと推論の実行方法は、ドメインの一般化、ソースからソースへのセグメンテーション、事前トレーニングなど、いくつかのサブフィールドに分けられる。
本研究では,これらすべてのサブフィールドにおいて,マルチソース・トレーニングの新たなアプローチにより結果を改善することを目的としている。
マルチソーストレーニングは、トレーニング時にさまざまなデータセットの可用性に依存する。
マルチソーストレーニングにおける共通の障害を克服するため、粗いラベルを導入し、新たに作成されたマルチソースデータセットCOLAを呼び出します。
ドメイン一般化のためのCOLA-DG(+10%)、ソース・ソース・セグメンテーションのためのCOLA-S2S(+5.3%)、事前学習のためのCOLA-PT(+12%)の3つの手法を提案する。
マルチソースアプローチが単一ソースアプローチよりも体系的な改善をもたらすことを実証する。
関連論文リスト
- All in One and One for All: A Simple yet Effective Method towards Cross-domain Graph Pretraining [18.955565096212183]
大規模言語モデル (LLM) はコンピュータビジョン (CV) と自然言語処理 (NLP) の分野に革命をもたらした。
LLMの最も注目すべき進歩の1つは、単一のモデルが複数のドメインにまたがる広範囲で多様なデータセットでトレーニングされていることである。
論文 参考訳(メタデータ) (2024-02-15T09:55:39Z) - Multi-source domain adaptation for regression [2.8648412780872845]
マルチソースドメイン適応(DA)は、複数のソースドメインからの情報を活用して、ターゲットドメインで予測することを目的としている。
我々は、結果の粗大化による分類のための柔軟な単一ソースDAアルゴリズムを拡張し、回帰問題への適用を可能にする。
次に、アンサンブル学習による回帰のための単一ソースDAアルゴリズムを拡張し、マルチソースDAを実現する。
論文 参考訳(メタデータ) (2023-12-09T04:09:37Z) - Reinforcement Learning Based Multi-modal Feature Fusion Network for
Novel Class Discovery [47.28191501836041]
本稿では,人間の認知過程をシミュレートするために強化学習フレームワークを用いる。
また,マルチモーダル情報から特徴を抽出・融合するマルチエージェントフレームワークをデプロイした。
我々は、OS-MN40、OS-MN40-Miss、Cifar10データセットを用いて、3Dドメインと2Dドメインの両方でのアプローチの性能を示す。
論文 参考訳(メタデータ) (2023-08-26T07:55:32Z) - Towards Realistic Low-resource Relation Extraction: A Benchmark with
Empirical Baseline Study [51.33182775762785]
本稿では,低リソース環境下での関係抽出システムを構築するための実証的研究について述べる。
低リソース環境での性能を評価するための3つのスキームについて検討する。 (i) ラベル付きラベル付きデータを用いた異なるタイプのプロンプトベース手法、 (ii) 長期分布問題に対処する多様なバランシング手法、 (iii) ラベル付きインドメインデータを生成するためのデータ拡張技術と自己学習。
論文 参考訳(メタデータ) (2022-10-19T15:46:37Z) - Latent-Variable Advantage-Weighted Policy Optimization for Offline RL [70.01851346635637]
オフラインの強化学習メソッドは、新しいトランジションを環境に問い合わせる必要なしに、事前にコンパイルされたデータセットから学習ポリシーを保証します。
実際には、オフラインデータセットは、しばしば異種、すなわち様々なシナリオで収集される。
より広範な政策分布を表現できる潜在変数ポリシーを活用することを提案する。
提案手法は,次回のオフライン強化学習法の性能を,異種データセット上で49%向上させる。
論文 参考訳(メタデータ) (2022-03-16T21:17:03Z) - Consistency and Diversity induced Human Motion Segmentation [231.36289425663702]
本稿では,CDMS(Consistency and Diversity induced Human Motion)アルゴリズムを提案する。
我々のモデルは、ソースとターゲットデータを異なる多層特徴空間に分解する。
ソースとターゲットデータ間の領域ギャップを低減するために、マルチミューチュアル学習戦略を実行する。
論文 参考訳(メタデータ) (2022-02-10T06:23:56Z) - Deep Transfer Learning for Multi-source Entity Linkage via Domain
Adaptation [63.24594955429465]
マルチソースエンティティリンクは、データのクリーニングやユーザ縫合といった、高インパクトなアプリケーションにおいて重要である。
AdaMELは、多ソースエンティティリンクを実行するための一般的なハイレベルな知識を学ぶディープトランスファー学習フレームワークである。
本フレームワークは,教師付き学習に基づく平均的手法よりも8.21%向上した最先端の学習結果を実現する。
論文 参考訳(メタデータ) (2021-10-27T15:20:41Z) - Multi-Source domain adaptation via supervised contrastive learning and
confident consistency regularization [0.0]
Multi-Source Unsupervised Domain Adaptation (multi-source UDA)は、複数のラベル付きソースドメインからモデルを学習することを目的としている。
本稿では,この制限に対処するマルチソースUDAに対して,コントラスト型マルチソースドメイン適応(CMSDA)を提案する。
論文 参考訳(メタデータ) (2021-06-30T14:39:15Z) - Multi-modal AsynDGAN: Learn From Distributed Medical Image Data without
Sharing Private Information [55.866673486753115]
プライバシーとセキュリティを守るために拡張可能で弾力性のある学習フレームワークを提案します。
提案するフレームワークは分散Asynchronized Discriminator Generative Adrial Networks (AsynDGAN) である。
論文 参考訳(メタデータ) (2020-12-15T20:41:24Z) - Multi-source Domain Adaptation in the Deep Learning Era: A Systematic
Survey [53.656086832255944]
マルチソースドメイン適応(MDA)は、ラベル付きデータを複数のソースから収集できる強力な拡張である。
MDAは学術と産業の両方で注目を集めている。
論文 参考訳(メタデータ) (2020-02-26T08:07:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。