Fugu-MT 論文翻訳(概要): Placing Objects in Context via Inpainting for Out-of-distribution Segmentation

論文の概要: Placing Objects in Context via Inpainting for Out-of-distribution Segmentation

arxiv url: http://arxiv.org/abs/2402.16392v2
Date: Fri, 12 Jul 2024 18:19:19 GMT
ステータス: 翻訳完了
システム内更新日: 2024-07-17 01:45:18.244864
Title: Placing Objects in Context via Inpainting for Out-of-distribution Segmentation
Title（参考訳）: アウト・オブ・ディストリビューション・セグメンテーションのためのインペインティングによるコンテキスト内オブジェクトの配置
Authors: Pau de Jorge, Riccardo Volpi, Puneet K. Dokania, Philip H. S. Torr, Gregory Rogez,
Abstract要約: コンテキスト内のオブジェクトの配置(POC)は、イメージにオブジェクトを現実的に追加するためのパイプラインである。 POCは任意の数のオブジェクトで任意のデータセットを拡張するために使用することができる。本稿では,POC 生成データに基づく様々な異常セグメンテーションデータセットを提示し,最近の最先端の異常チューニング手法の性能向上を実証する。
参考スコア（独自算出の注目度）: 59.00092709848619
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: When deploying a semantic segmentation model into the real world, it will inevitably encounter semantic classes that were not seen during training. To ensure a safe deployment of such systems, it is crucial to accurately evaluate and improve their anomaly segmentation capabilities. However, acquiring and labelling semantic segmentation data is expensive and unanticipated conditions are long-tail and potentially hazardous. Indeed, existing anomaly segmentation datasets capture a limited number of anomalies, lack realism or have strong domain shifts. In this paper, we propose the Placing Objects in Context (POC) pipeline to realistically add any object into any image via diffusion models. POC can be used to easily extend any dataset with an arbitrary number of objects. In our experiments, we present different anomaly segmentation datasets based on POC-generated data and show that POC can improve the performance of recent state-of-the-art anomaly fine-tuning methods across several standardized benchmarks. POC is also effective for learning new classes. For example, we utilize it to augment Cityscapes samples by incorporating a subset of Pascal classes and demonstrate that models trained on such data achieve comparable performance to the Pascal-trained baseline. This corroborates the low synth2real gap of models trained on POC-generated images. Code: https://github.com/naver/poc
Abstract（参考訳）: セマンティックセグメンテーションモデルを現実世界にデプロイする場合、トレーニング中に見られなかったセマンティッククラスに必然的に遭遇する。このようなシステムの安全なデプロイを保証するためには,その異常セグメンテーション能力を正確に評価し,改善することが重要である。しかし、セマンティックセグメンテーションデータの取得とラベル付けは高価であり、予測外の条件は長く、潜在的に危険である。実際、既存の異常セグメンテーションデータセットは限られた数の異常をキャプチャし、リアリズムを欠いているか、強いドメインシフトを持っている。本稿では,拡散モデルを用いて,任意のオブジェクトを任意の画像に現実的に付加する,コンテキストにおけるPlacing Objects in Context(POC)パイプラインを提案する。 POCは任意の数のオブジェクトで任意のデータセットを簡単に拡張するために使用することができる。実験では,POC生成データに基づく様々な異常セグメンテーションデータセットを提示し,POCが最新の最先端の異常調整手法の性能を向上させることを示す。 POCは、新しいクラスを学ぶのにも有効である。例えば、CityscapesのサンプルをPascalクラスのサブセットを組み込むことで強化し、そのようなデータに基づいてトレーニングされたモデルがPascalでトレーニングされたベースラインに匹敵するパフォーマンスを実現することを示す。このことはPOC生成画像に基づいて訓練されたモデルの低シント2リアルギャップを裏付ける。コード:https://github.com/naver/poc

関連論文リスト

ScenarioCLIP: Pretrained Transferable Visual Language Models and Action-Genome Dataset for Natural Scene Analysis [4.611741386167832]
PyramidCLIPは、グローバルな視覚的特徴と局所的な視覚的特徴の整合を目標としているが、オブジェクト間の関係の明示的なモデリングはいまだに欠けている。我々は、既存の屋内および屋外の多様なシナリオデータセットから画像とテキストのペアを拡張することで、新しいデータセットを生成する。いくつかのシナリオベースのタスクの総合的なベンチマークを確立し、それを多くのベースライン手法と比較した。
論文参考訳（メタデータ） (2025-11-25T12:59:31Z)
SAMPO: Visual Preference Optimization for Intent-Aware Segmentation with Vision Foundation Models [5.3279948735247284]
SAMPOは、視覚的基礎モデルに、疎視的相互作用から高レベルのカテゴリー的意図を推論する新しいフレームワークである。我々の研究は、視覚基盤モデルにおける意図認識のアライメントのための新しいパラダイムを確立し、補助的なプロンプトジェネレータや言語モデル支援の嗜好学習への依存を取り除く。
論文参考訳（メタデータ） (2025-08-04T14:31:11Z)
NOCTIS: Novel Object Cyclic Threshold based Instance Segmentation [42.84923737757637]
新規オブジェクトサイクル閾値ベースインスタンス(NOCTIS)と呼ばれる新しいトレーニングフリーフレームワークを提案する。 NOCTISは2つの事前訓練されたモデルを統合する: Grounded-SAM 2 for object proposals with exact bounding box and corresponding segmentation masks; DINOv2 for robust class and patch embeddeds。実験により,NOCTISはトレーニングや微調整を伴わずに,平均APスコアに関する最先端の結果が得られることが示された。
論文参考訳（メタデータ） (2025-07-02T08:23:14Z)
Training-Free Dataset Pruning for Instance Segmentation [35.124251909622025]
インスタンスセグメンテーションには,ピクセルレベルのアノテーション,インスタンス領域のバリエーション,クラス不均衡という,3つの重要な課題がある。本稿では,サンプルセグメンテーションのための新しいトレーニングフリーデータセット・プルーニング(TFDP)手法を提案する。 VOC 2012、Cityscapes、COCOデータセットで最先端の結果が得られ、CNNやTransformerアーキテクチャでうまく一般化されています。
論文参考訳（メタデータ） (2025-03-02T10:05:59Z)
Unsupervised Class Generation to Expand Semantic Segmentation Datasets [9.144948836224078]
基礎となるアルゴリズムを変更することなく、トレーニングデータに新しいサンプルを導入する。モデルが新しいクラスをセグメンテーションする方法を効果的に学べるだけでなく、平均性能は51% IoUであり、既存のクラスに対するエラーを減らすことができることを示す。
論文参考訳（メタデータ） (2025-01-04T11:53:13Z)
Physically Feasible Semantic Segmentation [58.17907376475596]
最先端セマンティックセグメンテーションモデルは通常、データ駆動方式で最適化される。本手法は,空間的クラス関係を規定する明示的な物理的制約を抽出する。 PhyFeaは、使用する最先端ネットワーク毎にmIoUが大幅に向上する。
論文参考訳（メタデータ） (2024-08-26T22:39:08Z)
Rethinking Few-shot 3D Point Cloud Semantic Segmentation [62.80639841429669]
本稿では,FS-PCSによる3Dポイント・クラウドセマンティックセマンティックセグメンテーションについて再検討する。我々は、最先端の2つの重要な問題、前景の漏洩とスパースポイントの分布に焦点をあてる。これらの問題に対処するために、新しいベンチマークを構築するための標準化されたFS-PCS設定を導入する。
論文参考訳（メタデータ） (2024-03-01T15:14:47Z)
Learning from Temporal Spatial Cubism for Cross-Dataset Skeleton-based Action Recognition [88.34182299496074]
アクションラベルはソースデータセットでのみ利用可能だが、トレーニング段階のターゲットデータセットでは利用できない。我々は,2つの骨格に基づく行動データセット間の領域シフトを低減するために,自己スーパービジョン方式を利用する。時間的セグメントや人体部分のセグメンテーションとパーフォーミングにより、我々は2つの自己教師あり学習分類タスクを設計する。
論文参考訳（メタデータ） (2022-07-17T07:05:39Z)
Detecting Anomalies in Semantic Segmentation with Prototypes [23.999211737485812]
本稿では,プロトタイプ学習による異常セグメンテーションに対処することを提案する。我々のアプローチは、過去の作品よりも大きな差で、新しい芸術の状態を達成している。
論文参考訳（メタデータ） (2021-06-01T13:22:33Z)
Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文参考訳（メタデータ） (2021-05-07T03:49:26Z)
Context-self contrastive pretraining for crop type semantic segmentation [39.81074867563505]
提案したContext-Self Contrastive Loss (CSCL)は、セマンティックバウンダリをポップアップさせる埋め込み空間を学習する。衛星画像時系列(SITS)からの作物型セマンティックセマンティックセグメンテーションでは,サテライト境界における性能が重要なボトルネックとなる。より粒度の高い作物のクラスを得るための超解像における意味的セグメンテーションのプロセスを提案する。
論文参考訳（メタデータ） (2021-04-09T11:29:44Z)
Scaling Semantic Segmentation Beyond 1K Classes on a Single GPU [87.48110331544885]
既存のセマンティックセグメンテーションモデルのトレーニングとスケールアップのための新しいトレーニング手法を提案する。我々は、LVISとCOCOアノテーションからブートストラップした1284クラスのデータセットに対するアプローチの明確な利点を示し、DeeplabV3+モデルの3倍のmIoUを実現した。
論文参考訳（メタデータ） (2020-12-14T13:12:38Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。