論文の概要: Curricular Object Manipulation in LiDAR-based Object Detection
- arxiv url: http://arxiv.org/abs/2304.04248v1
- Date: Sun, 9 Apr 2023 14:49:02 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-11 16:40:54.805727
- Title: Curricular Object Manipulation in LiDAR-based Object Detection
- Title(参考訳): LiDARによる物体検出における曲面物体操作
- Authors: Ziyue Zhu, Qiang Meng, Xiao Wang, Ke Wang, Liujiang Yan, Jian Yang
- Abstract要約: 本稿では,LiDARを用いた3次元物体検出におけるカリキュラム学習の可能性について検討する。
このフレームワークは、損失設計と拡張プロセスの両方に、カリキュラムのトレーニング戦略を組み込む。
損失設計のために,オブジェクトレベルの難易度を動的に予測するCOMLossを提案する。
- 参考スコア(独自算出の注目度): 23.63083795458355
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper explores the potential of curriculum learning in LiDAR-based 3D
object detection by proposing a curricular object manipulation (COM) framework.
The framework embeds the curricular training strategy into both the loss design
and the augmentation process. For the loss design, we propose the COMLoss to
dynamically predict object-level difficulties and emphasize objects of
different difficulties based on training stages. On top of the widely-used
augmentation technique called GT-Aug in LiDAR detection tasks, we propose a
novel COMAug strategy which first clusters objects in ground-truth database
based on well-designed heuristics. Group-level difficulties rather than
individual ones are then predicted and updated during training for stable
results. Model performance and generalization capabilities can be improved by
sampling and augmenting progressively more difficult objects into the training
samples. Extensive experiments and ablation studies reveal the superior and
generality of the proposed framework. The code is available at
https://github.com/ZZY816/COM.
- Abstract(参考訳): 本稿では,LiDARを用いた3次元物体検出におけるカリキュラム学習の可能性について検討する。
このフレームワークは、損失設計と拡張プロセスの両方に、カリキュラムのトレーニング戦略を組み込む。
損失設計のために,オブジェクトレベルの難易度を動的に予測し,訓練段階に基づいて異なる難易度を持つ対象を強調するcomlossを提案する。
本稿では,LiDAR検出タスクにおけるGT-Augと呼ばれる拡張手法に加えて,よく設計されたヒューリスティックに基づいて,まず地中データベースにオブジェクトをクラスタ化する新しいCOMAug戦略を提案する。
個々のグループよりもグループレベルの困難を予測し、安定した結果を得るためにトレーニング中に更新する。
モデルの性能と一般化能力は、トレーニングサンプルに徐々に難しいオブジェクトをサンプリングし、拡張することで改善することができる。
大規模な実験とアブレーション研究により、提案フレームワークの優位性と汎用性が明らかとなった。
コードはhttps://github.com/ZZY816/COMで公開されている。
関連論文リスト
- Semi-Supervised Object Detection: A Survey on Progress from CNN to Transformer [12.042768320132694]
本稿では,物体検出のための半教師付き学習における27の最先端開発について概説する。
データ拡張テクニック、擬似ラベル戦略、一貫性の正則化、敵の訓練方法などをカバーする。
我々は,既存の課題を克服し,物体検出のための半教師あり学習における新たな方向性を探るため,さらなる研究の関心を喚起することを目的としている。
論文 参考訳(メタデータ) (2024-07-11T12:58:13Z) - Contextual Interaction via Primitive-based Adversarial Training For Compositional Zero-shot Learning [23.757252768668497]
合成ゼロショット学習(CZSL)は、既知の属性オブジェクト対を通じて新規な合成を識別することを目的としている。
CZSLタスクの最大の課題は、属性とオブジェクトの視覚的プリミティブの間の複雑な相互作用によって導入された大きな相違にある。
本稿では,モデルに依存しない原始的適応学習(PBadv)手法を提案する。
論文 参考訳(メタデータ) (2024-06-21T08:18:30Z) - TaskCLIP: Extend Large Vision-Language Model for Task Oriented Object Detection [23.73648235283315]
タスク指向オブジェクト検出は、特定のタスクを達成するのに適したオブジェクトを見つけることを目的としている。
最近のソリューションは主にオールインワンモデルです。
汎用オブジェクト検出とタスク誘導オブジェクト選択からなるより自然な2段階設計であるTaskCLIPを提案する。
論文 参考訳(メタデータ) (2024-03-12T22:33:02Z) - Improved Region Proposal Network for Enhanced Few-Shot Object Detection [23.871860648919593]
Few-shot Object Detection (FSOD) メソッドは、古典的なオブジェクト検出手法の限界に対する解決策として登場した。
FSODトレーニング段階において,未ラベルの新規物体を正のサンプルとして検出し,利用するための半教師付きアルゴリズムを開発した。
地域提案ネットワーク(RPN)の階層的サンプリング戦略の改善により,大規模オブジェクトに対するオブジェクト検出モデルの認識が向上する。
論文 参考訳(メタデータ) (2023-08-15T02:35:59Z) - ALP: Action-Aware Embodied Learning for Perception [60.64801970249279]
認知のための行動認識型身体学習(ALP)について紹介する。
ALPは、強化学習ポリシーと逆ダイナミクス予測目標を最適化することにより、行動情報を表現学習に組み込む。
ALPは、複数の下流認識タスクにおいて、既存のベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-16T21:51:04Z) - Hierarchical Supervision and Shuffle Data Augmentation for 3D
Semi-Supervised Object Detection [90.32180043449263]
最先端の3Dオブジェクト検出器は通常、高品質な3Dアノテーションを備えた大規模データセットで訓練される。
自然な治療法は、限られた量のラベル付きサンプルと豊富なラベル付きサンプルを活用することで、半教師付き学習(SSL)を採用することである。
本稿では,HSSDA(Hierarchical Supervision and Shuffle Data Augmentation)の新たなアプローチを提案する。
論文 参考訳(メタデータ) (2023-04-04T02:09:32Z) - Towards Sequence-Level Training for Visual Tracking [60.95799261482857]
本研究は、強化学習に基づく視覚追跡のためのシーケンスレベルのトレーニング戦略を導入する。
4つの代表的な追跡モデル、SiamRPN++、SiamAttn、TransT、TrDiMPは、提案手法をトレーニングに取り入れることで一貫して改善されている。
論文 参考訳(メタデータ) (2022-08-11T13:15:36Z) - CoDo: Contrastive Learning with Downstream Background Invariance for
Detection [10.608660802917214]
下流背景不変性(CoDo)を用いたコントラスト学習という,オブジェクトレベルの自己教師型学習手法を提案する。
プリテキストタスクは、さまざまなバックグラウンド、特に下流データセットのインスタンス位置モデリングに集中するように変換される。
MSCOCOの実験では、共通のバックボーンを持つCoDoであるResNet50-FPNが、オブジェクト検出に強力な転送学習結果をもたらすことを示した。
論文 参考訳(メタデータ) (2022-05-10T01:26:15Z) - Aligning Pretraining for Detection via Object-Level Contrastive Learning [57.845286545603415]
画像レベルのコントラスト表現学習は、伝達学習の汎用モデルとして非常に有効であることが証明されている。
我々は、これは準最適である可能性があり、従って、自己教師付きプレテキストタスクと下流タスクのアライメントを促進する設計原則を提唱する。
Selective Object Contrastive Learning (SoCo) と呼ばれる本手法は,COCO検出における伝達性能の最先端化を実現する。
論文 参考訳(メタデータ) (2021-06-04T17:59:52Z) - Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文 参考訳(メタデータ) (2021-05-07T03:49:26Z) - CausalWorld: A Robotic Manipulation Benchmark for Causal Structure and
Transfer Learning [138.40338621974954]
CausalWorldは、ロボット操作環境における因果構造と伝達学習のベンチマークである。
タスクは、ブロックのセットから3D形状を構築することで構成される。
論文 参考訳(メタデータ) (2020-10-08T23:01:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。