論文の概要: Synthetic-to-Real Camouflaged Object Detection
- arxiv url: http://arxiv.org/abs/2507.18911v2
- Date: Mon, 28 Jul 2025 08:12:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-29 14:15:47.134692
- Title: Synthetic-to-Real Camouflaged Object Detection
- Title(参考訳): 合成からリアルタイムのカモフラージュ物体検出
- Authors: Zhihao Luo, Luojun Lin, Zheng Lin,
- Abstract要約: 我々はS2R-COD(Syn-to-Real Camouflaged Object Detection)という新しいタスクを提案する。
実世界のシナリオにおけるモデル性能を改善するためには,注釈付き合成カモフラージュ画像の集合と,注釈なしの実画像の限られた数を利用する必要がある。
- 参考スコア(独自算出の注目度): 10.09796058949937
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Due to the high cost of collection and labeling, there are relatively few datasets for camouflaged object detection (COD). In particular, for certain specialized categories, the available image dataset is insufficiently populated. Synthetic datasets can be utilized to alleviate the problem of limited data to some extent. However, directly training with synthetic datasets compared to real datasets can lead to a degradation in model performance. To tackle this problem, in this work, we investigate a new task, namely Syn-to-Real Camouflaged Object Detection (S2R-COD). In order to improve the model performance in real world scenarios, a set of annotated synthetic camouflaged images and a limited number of unannotated real images must be utilized. We propose the Cycling Syn-to-Real Domain Adaptation Framework (CSRDA), a method based on the student-teacher model. Specially, CSRDA propagates class information from the labeled source domain to the unlabeled target domain through pseudo labeling combined with consistency regularization. Considering that narrowing the intra-domain gap can improve the quality of pseudo labeling, CSRDA utilizes a recurrent learning framework to build an evolving real domain for bridging the source and target domain. Extensive experiments demonstrate the effectiveness of our framework, mitigating the problem of limited data and handcraft annotations in COD. Our code is publicly available at: https://github.com/Muscape/S2R-COD.
- Abstract(参考訳): コレクションとラベリングのコストが高いため、COD(camouflaged object detection)のためのデータセットは比較的少ない。
特に特定のカテゴリでは、利用可能な画像データセットが不十分である。
合成データセットは、限られたデータの問題をある程度緩和するために利用することができる。
しかし、実際のデータセットと比較して、合成データセットを直接トレーニングすることで、モデルの性能が低下する可能性がある。
そこで本研究では,Syn-to-Real Camouflaged Object Detection (S2R-COD) という新たな課題について検討する。
実世界のシナリオにおけるモデル性能を改善するためには,注釈付き合成カモフラージュ画像の集合と,注釈なしの実画像の限られた数を利用する必要がある。
学生-教師モデルに基づくCSRDA(Cycleing Syn-to-Real Domain Adaptation Framework)を提案する。
特に、CSRDAは、擬似ラベル付けと整合正則化を組み合わせることで、ラベル付きソースドメインからラベルなしターゲットドメインへのクラス情報を伝搬する。
ドメイン内ギャップを狭めることで、擬似ラベリングの品質が向上することを考えると、CSRDAは繰り返し学習フレームワークを使用して、ソースとターゲットドメインをブリッジするための進化中の実ドメインを構築する。
大規模な実験により,CODにおける限られたデータや手技アノテーションの問題を緩和し,我々のフレームワークの有効性を実証した。
私たちのコードは、https://github.com/Muscape/S2R-COD.comで公開されています。
関連論文リスト
- Topology-Aware Modeling for Unsupervised Simulation-to-Reality Point Cloud Recognition [63.55828203989405]
我々はオブジェクトポイントクラウド上でSim2Real UDAのための新しいTopology-Aware Modeling (TAM)フレームワークを紹介する。
提案手法は,低レベルの高周波3次元構造を特徴とするグローバル空間トポロジを利用して,領域間隙を緩和する。
本稿では,クロスドメイン・コントラスト学習と自己学習を組み合わせた高度な自己学習戦略を提案する。
論文 参考訳(メタデータ) (2025-06-26T11:53:59Z) - MORDA: A Synthetic Dataset to Facilitate Adaptation of Object Detectors to Unseen Real-target Domain While Preserving Performance on Real-source Domain [4.924414049280259]
我々は、新しい駆動データセットであるMORDA: Mixture of Real- Domain Characteristics for synthetic-data-assisted Domain Adaptationを構築できる合成融合ドメインを作成する。
実験の結果,MORDAはAI-Hubデータセットの平均精度(mAP)を大幅に向上する一方,nuScenesはわずかに向上することがわかった。
論文 参考訳(メタデータ) (2025-01-09T03:58:02Z) - UDA4Inst: Unsupervised Domain Adaptation for Instance Segmentation [5.982874955955054]
教師なしドメイン適応(Unsupervised Domain Adaptation, UDA)は、ラベル付き合成データからラベル付き実世界のデータに知識を伝達する。
UDAメソッドは、セマンティックセグメンテーションやオブジェクト検出といったタスクにおいて、実世界のドメイン(合成から実世界のドメイン)を抽出する。
UDA4Instは、インスタンスセグメンテーションにおいて、シンセグメンテーションからリアル UDA への強力なフレームワークである。
論文 参考訳(メタデータ) (2024-05-15T19:53:52Z) - Placing Objects in Context via Inpainting for Out-of-distribution Segmentation [59.00092709848619]
コンテキスト内のオブジェクトの配置(POC)は、イメージにオブジェクトを現実的に追加するためのパイプラインである。
POCは任意の数のオブジェクトで任意のデータセットを拡張するために使用することができる。
本稿では,POC 生成データに基づく様々な異常セグメンテーションデータセットを提示し,最近の最先端の異常チューニング手法の性能向上を実証する。
論文 参考訳(メタデータ) (2024-02-26T08:32:41Z) - CamDiff: Camouflage Image Augmentation via Diffusion Model [83.35960536063857]
CamDiffは、カモフラージュされたシーンで透明なオブジェクトを合成するための新しいアプローチだ。
我々は,潜伏拡散モデルを用いて,カモフラージュされたシーンで有能な物体を合成する。
当社のアプローチでは、フレキシブルな編集と大規模データセットの効率的な生成を低コストで実現している。
論文 参考訳(メタデータ) (2023-04-11T19:37:47Z) - Synthetic-to-Real Domain Adaptation for Action Recognition: A Dataset and Baseline Performances [76.34037366117234]
ロボット制御ジェスチャー(RoCoG-v2)と呼ばれる新しいデータセットを導入する。
データセットは7つのジェスチャークラスの実ビデオと合成ビデオの両方で構成されている。
我々は,最先端の行動認識とドメイン適応アルゴリズムを用いて結果を示す。
論文 参考訳(メタデータ) (2023-03-17T23:23:55Z) - Unsupervised Domain Adaptive Learning via Synthetic Data for Person
Re-identification [101.1886788396803]
人物再識別(re-ID)は、ビデオ監視に広く応用されているため、ますます注目を集めている。
残念なことに、主流のディープラーニング手法では、モデルをトレーニングするために大量のラベル付きデータが必要です。
本稿では,コンピュータゲーム内で合成されたre-IDサンプルを自動的に生成するデータコレクタを開発し,同時にアノテートするデータラベラを構築した。
論文 参考訳(メタデータ) (2021-09-12T15:51:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。