論文の概要: 360$^\circ$ from a Single Camera: A Few-Shot Approach for LiDAR
Segmentation
- arxiv url: http://arxiv.org/abs/2309.06197v1
- Date: Tue, 12 Sep 2023 13:04:41 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-13 13:01:47.264971
- Title: 360$^\circ$ from a Single Camera: A Few-Shot Approach for LiDAR
Segmentation
- Title(参考訳): 1台のカメラから360$^\circ$:lidarセグメンテーションのための数発のアプローチ
- Authors: Laurenz Reichardt, Nikolas Ebert, Oliver Wasenm\"uller
- Abstract要約: LiDARデータのディープラーニングアプリケーションは、異なるセンサーやタスクに適用する場合、強いドメインギャップに悩まされる。
実用的なアプリケーションでは、ラベル付きデータはコストがかかり、取得に時間がかかる。
我々は、ラベル効率のよいLiDARセグメンテーションに対する効果的で合理化された数ショットアプローチであるImageTo360を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep learning applications on LiDAR data suffer from a strong domain gap when
applied to different sensors or tasks. In order for these methods to obtain
similar accuracy on different data in comparison to values reported on public
benchmarks, a large scale annotated dataset is necessary. However, in practical
applications labeled data is costly and time consuming to obtain. Such factors
have triggered various research in label-efficient methods, but a large gap
remains to their fully-supervised counterparts. Thus, we propose ImageTo360, an
effective and streamlined few-shot approach to label-efficient LiDAR
segmentation. Our method utilizes an image teacher network to generate semantic
predictions for LiDAR data within a single camera view. The teacher is used to
pretrain the LiDAR segmentation student network, prior to optional fine-tuning
on 360$^\circ$ data. Our method is implemented in a modular manner on the point
level and as such is generalizable to different architectures. We improve over
the current state-of-the-art results for label-efficient methods and even
surpass some traditional fully-supervised segmentation networks.
- Abstract(参考訳): LiDARデータのディープラーニングアプリケーションは、異なるセンサーやタスクに適用する場合、強いドメインギャップに悩まされる。
これらの手法が公開ベンチマークで報告された値と比較して異なるデータで同様の精度を得るためには、大規模な注釈付きデータセットが必要である。
しかし、実用的なアプリケーションでは、ラベル付きデータはコストがかかり、取得に時間がかかる。
このような要因はラベル効率の手法に関する様々な研究を引き起こしているが、完全に監督された手法には大きなギャップが残っている。
そこで我々は,ラベル効率のよいLiDARセグメンテーションに対して,効果的かつ合理化された数ショットアプローチであるImageTo360を提案する。
本手法は,画像教師ネットワークを用いて,単一カメラビュー内におけるLiDARデータのセマンティック予測を生成する。
教師は、360$^\circ$データでオプションで微調整する前に、LiDARセグメンテーション学生ネットワークを事前訓練するために使用される。
本手法は点レベルでモジュール方式で実装されており,異なるアーキテクチャに対して一般化可能である。
ラベル効率のよい手法で現在の最先端の結果を改良し、従来の完全教師付きセグメンテーションネットワークを上回ることさえある。
関連論文リスト
- Finetuning Pre-trained Model with Limited Data for LiDAR-based 3D Object Detection by Bridging Domain Gaps [8.897884780881535]
LiDARベースの3Dオブジェクト検出器は、センサーの設定が異なるターゲットドメインにうまく適応できないことが多い。
近年の研究では、トレーニング済みのバックボーンは大規模でラベルのないLiDARフレームで自己管理的に学習できることが示唆されている。
本研究では,対象データに制限のある事前学習モデルを適用するために,DADT(Domain Adaptive Distill-Tuning)と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2024-10-02T08:22:42Z) - Weakly Contrastive Learning via Batch Instance Discrimination and Feature Clustering for Small Sample SAR ATR [7.2932563202952725]
BIDFC(Batch Instance Discrimination and Feature Clustering)と呼ばれる新しいフレームワークを提案する。
本枠組みでは,SAR画像中の試料間の類似度が高いため,試料間の埋め込み距離は適度である。
移動・静止目標獲得・認識(MSTAR)データベースの実験結果から,3.13%のトレーニングデータに基づいて,本手法の91.25%の分類精度が得られた。
論文 参考訳(メタデータ) (2024-08-07T08:39:33Z) - Shelf-Supervised Cross-Modal Pre-Training for 3D Object Detection [52.66283064389691]
最先端の3Dオブジェクト検出器は、しばしば大量のラベル付きデータセットで訓練される。
近年の研究では、ラベル付きデータによる自己教師付き事前学習が、ラベル付きラベルによる検出精度を向上させることが示されている。
組合わせRGBとLiDARデータからゼロショット3Dバウンディングボックスを生成するためのシェルフ制御手法を提案する。
論文 参考訳(メタデータ) (2024-06-14T15:21:57Z) - Terrain-Informed Self-Supervised Learning: Enhancing Building Footprint Extraction from LiDAR Data with Limited Annotations [1.3243401820948064]
フットプリントマップの構築は、広範な後処理なしで正確なフットプリント抽出を約束する。
ディープラーニング手法は、一般化とラベルの効率の面で課題に直面している。
リモートセンシングに適した地形認識型自己教師型学習を提案する。
論文 参考訳(メタデータ) (2023-11-02T12:34:23Z) - Discwise Active Learning for LiDAR Semantic Segmentation [92.92714645987083]
アクティブラーニング(AL)は、データセットを反復的かつインテリジェントにラベル付けできるソリューションを提供する。
我々は,各イテレーションにおいて,グローバル座標上の1フレームの領域を問合せし,全フレームを同時にラベル付けするディスクワイズアプローチ(DiAL)を提案する。
論文 参考訳(メタデータ) (2023-09-23T06:08:22Z) - Hierarchical Supervision and Shuffle Data Augmentation for 3D
Semi-Supervised Object Detection [90.32180043449263]
最先端の3Dオブジェクト検出器は通常、高品質な3Dアノテーションを備えた大規模データセットで訓練される。
自然な治療法は、限られた量のラベル付きサンプルと豊富なラベル付きサンプルを活用することで、半教師付き学習(SSL)を採用することである。
本稿では,HSSDA(Hierarchical Supervision and Shuffle Data Augmentation)の新たなアプローチを提案する。
論文 参考訳(メタデータ) (2023-04-04T02:09:32Z) - Adaptive Self-Training for Object Detection [13.07105239116411]
オブジェクト検出のための自己評価手法(ASTOD)を提案する。
ASTODはスコアヒストグラムの基底値に基づいて閾値を決定する。
擬似ラベル付けの段階では, ラベル付き画像の異なるビューを用いて, 誤り予測の回数を減らす。
論文 参考訳(メタデータ) (2022-12-07T15:10:40Z) - LESS: Label-Efficient Semantic Segmentation for LiDAR Point Clouds [62.49198183539889]
我々は,LiDAR点雲を用いた屋外シーンのためのラベル効率のよいセマンティックセマンティックセマンティクスパイプラインを提案する。
本手法は,半弱教師付き学習を用いて,効率的なラベリング手法を設計する。
提案手法は,100%ラベル付き完全教師付き手法と比較して,さらに競争力が高い。
論文 参考訳(メタデータ) (2022-10-14T19:13:36Z) - How to distribute data across tasks for meta-learning? [59.608652082495624]
タスクごとのデータポイントの最適な数は予算に依存しますが、それは大きな予算のためのユニークな一定の値に収束します。
この結果から,データ収集の簡便かつ効率的な手順が示唆された。
論文 参考訳(メタデータ) (2021-03-15T15:38:47Z) - Omni-supervised Facial Expression Recognition via Distilled Data [120.11782405714234]
ネットワークトレーニングにおいて,信頼度の高いサンプルを多量のラベルのないデータで活用するためのオムニ教師付き学習を提案する。
我々は,新しいデータセットが学習したFERモデルの能力を大幅に向上させることができることを実験的に検証した。
そこで本研究では,生成したデータセットを複数のクラスワイド画像に圧縮するために,データセット蒸留戦略を適用することを提案する。
論文 参考訳(メタデータ) (2020-05-18T09:36:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。