論文の概要: Placing Objects in Context via Inpainting for Out-of-distribution Segmentation
- arxiv url: http://arxiv.org/abs/2402.16392v2
- Date: Fri, 12 Jul 2024 18:19:19 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-17 01:45:18.244864
- Title: Placing Objects in Context via Inpainting for Out-of-distribution Segmentation
- Title(参考訳): アウト・オブ・ディストリビューション・セグメンテーションのためのインペインティングによるコンテキスト内オブジェクトの配置
- Authors: Pau de Jorge, Riccardo Volpi, Puneet K. Dokania, Philip H. S. Torr, Gregory Rogez,
- Abstract要約: コンテキスト内のオブジェクトの配置(POC)は、イメージにオブジェクトを現実的に追加するためのパイプラインである。
POCは任意の数のオブジェクトで任意のデータセットを拡張するために使用することができる。
本稿では,POC 生成データに基づく様々な異常セグメンテーションデータセットを提示し,最近の最先端の異常チューニング手法の性能向上を実証する。
- 参考スコア(独自算出の注目度): 59.00092709848619
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: When deploying a semantic segmentation model into the real world, it will inevitably encounter semantic classes that were not seen during training. To ensure a safe deployment of such systems, it is crucial to accurately evaluate and improve their anomaly segmentation capabilities. However, acquiring and labelling semantic segmentation data is expensive and unanticipated conditions are long-tail and potentially hazardous. Indeed, existing anomaly segmentation datasets capture a limited number of anomalies, lack realism or have strong domain shifts. In this paper, we propose the Placing Objects in Context (POC) pipeline to realistically add any object into any image via diffusion models. POC can be used to easily extend any dataset with an arbitrary number of objects. In our experiments, we present different anomaly segmentation datasets based on POC-generated data and show that POC can improve the performance of recent state-of-the-art anomaly fine-tuning methods across several standardized benchmarks. POC is also effective for learning new classes. For example, we utilize it to augment Cityscapes samples by incorporating a subset of Pascal classes and demonstrate that models trained on such data achieve comparable performance to the Pascal-trained baseline. This corroborates the low synth2real gap of models trained on POC-generated images. Code: https://github.com/naver/poc
- Abstract(参考訳): セマンティックセグメンテーションモデルを現実世界にデプロイする場合、トレーニング中に見られなかったセマンティッククラスに必然的に遭遇する。
このようなシステムの安全なデプロイを保証するためには,その異常セグメンテーション能力を正確に評価し,改善することが重要である。
しかし、セマンティックセグメンテーションデータの取得とラベル付けは高価であり、予測外の条件は長く、潜在的に危険である。
実際、既存の異常セグメンテーションデータセットは限られた数の異常をキャプチャし、リアリズムを欠いているか、強いドメインシフトを持っている。
本稿では,拡散モデルを用いて,任意のオブジェクトを任意の画像に現実的に付加する,コンテキストにおけるPlacing Objects in Context(POC)パイプラインを提案する。
POCは任意の数のオブジェクトで任意のデータセットを簡単に拡張するために使用することができる。
実験では,POC生成データに基づく様々な異常セグメンテーションデータセットを提示し,POCが最新の最先端の異常調整手法の性能を向上させることを示す。
POCは、新しいクラスを学ぶのにも有効である。
例えば、CityscapesのサンプルをPascalクラスのサブセットを組み込むことで強化し、そのようなデータに基づいてトレーニングされたモデルがPascalでトレーニングされたベースラインに匹敵するパフォーマンスを実現することを示す。
このことはPOC生成画像に基づいて訓練されたモデルの低シント2リアルギャップを裏付ける。
コード:https://github.com/naver/poc
関連論文リスト
- Physically Feasible Semantic Segmentation [58.17907376475596]
最先端セマンティックセグメンテーションモデルは通常、データ駆動方式で最適化される。
本手法は,空間的クラス関係を規定する明示的な物理的制約を抽出する。
PhyFeaは、使用する最先端ネットワーク毎にmIoUが大幅に向上する。
論文 参考訳(メタデータ) (2024-08-26T22:39:08Z) - Rethinking Few-shot 3D Point Cloud Semantic Segmentation [62.80639841429669]
本稿では,FS-PCSによる3Dポイント・クラウドセマンティックセマンティックセグメンテーションについて再検討する。
我々は、最先端の2つの重要な問題、前景の漏洩とスパースポイントの分布に焦点をあてる。
これらの問題に対処するために、新しいベンチマークを構築するための標準化されたFS-PCS設定を導入する。
論文 参考訳(メタデータ) (2024-03-01T15:14:47Z) - Learning from Temporal Spatial Cubism for Cross-Dataset Skeleton-based
Action Recognition [88.34182299496074]
アクションラベルはソースデータセットでのみ利用可能だが、トレーニング段階のターゲットデータセットでは利用できない。
我々は,2つの骨格に基づく行動データセット間の領域シフトを低減するために,自己スーパービジョン方式を利用する。
時間的セグメントや人体部分のセグメンテーションとパーフォーミングにより、我々は2つの自己教師あり学習分類タスクを設計する。
論文 参考訳(メタデータ) (2022-07-17T07:05:39Z) - Detecting Anomalies in Semantic Segmentation with Prototypes [23.999211737485812]
本稿では,プロトタイプ学習による異常セグメンテーションに対処することを提案する。
我々のアプローチは、過去の作品よりも大きな差で、新しい芸術の状態を達成している。
論文 参考訳(メタデータ) (2021-06-01T13:22:33Z) - Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文 参考訳(メタデータ) (2021-05-07T03:49:26Z) - Context-self contrastive pretraining for crop type semantic segmentation [39.81074867563505]
提案したContext-Self Contrastive Loss (CSCL)は、セマンティックバウンダリをポップアップさせる埋め込み空間を学習する。
衛星画像時系列(SITS)からの作物型セマンティックセマンティックセグメンテーションでは,サテライト境界における性能が重要なボトルネックとなる。
より粒度の高い作物のクラスを得るための超解像における意味的セグメンテーションのプロセスを提案する。
論文 参考訳(メタデータ) (2021-04-09T11:29:44Z) - Scaling Semantic Segmentation Beyond 1K Classes on a Single GPU [87.48110331544885]
既存のセマンティックセグメンテーションモデルのトレーニングとスケールアップのための新しいトレーニング手法を提案する。
我々は、LVISとCOCOアノテーションからブートストラップした1284クラスのデータセットに対するアプローチの明確な利点を示し、DeeplabV3+モデルの3倍のmIoUを実現した。
論文 参考訳(メタデータ) (2020-12-14T13:12:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。