論文の概要: S3OD: Towards Generalizable Salient Object Detection with Synthetic Data
- arxiv url: http://arxiv.org/abs/2510.21605v1
- Date: Fri, 24 Oct 2025 16:10:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 09:00:15.538927
- Title: S3OD: Towards Generalizable Salient Object Detection with Synthetic Data
- Title(参考訳): S3OD: 合成データによる一般化可能な有能物体検出を目指して
- Authors: Orest Kupyn, Hirokatsu Kataoka, Christian Rupprecht,
- Abstract要約: S3ODは、マルチモーダル拡散パイプラインを通して生成された139,000以上の高解像度画像のデータセットである。
本稿では,有能な物体検出における固有曖昧さを自然に扱えるマルチマスクデコーダを提案する。
- 参考スコア(独自算出の注目度): 38.10559747985342
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Salient object detection exemplifies data-bounded tasks where expensive pixel-precise annotations force separate model training for related subtasks like DIS and HR-SOD. We present a method that dramatically improves generalization through large-scale synthetic data generation and ambiguity-aware architecture. We introduce S3OD, a dataset of over 139,000 high-resolution images created through our multi-modal diffusion pipeline that extracts labels from diffusion and DINO-v3 features. The iterative generation framework prioritizes challenging categories based on model performance. We propose a streamlined multi-mask decoder that naturally handles the inherent ambiguity in salient object detection by predicting multiple valid interpretations. Models trained solely on synthetic data achieve 20-50% error reduction in cross-dataset generalization, while fine-tuned versions reach state-of-the-art performance across DIS and HR-SOD benchmarks.
- Abstract(参考訳): Salient Object Detectionは、高価なピクセル精度アノテーションがDisdisやHR-SODのような関連するサブタスクに対して別々のモデルトレーニングを強制するデータバウンドタスクを例示する。
本稿では,大規模合成データ生成とあいまいさを意識したアーキテクチャによる一般化を劇的に改善する手法を提案する。
S3ODは、拡散とDINO-v3特徴からラベルを抽出するマルチモーダル拡散パイプラインを通じて作成される139,000以上の高解像度画像のデータセットである。
反復生成フレームワークは、モデルパフォーマンスに基づいた挑戦的なカテゴリを優先する。
本稿では,複数の有効な解釈を予測して,有能な物体検出における固有曖昧さを自然に処理するマルチマスクデコーダを提案する。
合成データのみに訓練されたモデルは、クロスデータセットの一般化において、20-50%のエラー削減を達成する一方、微調整されたバージョンは、disとHR-SODベンチマークで最先端のパフォーマンスに達する。
関連論文リスト
- HierOctFusion: Multi-scale Octree-based 3D Shape Generation via Part-Whole-Hierarchy Message Passing [9.953394373473621]
3Dコンテンツ生成は、3Dデータの本質的な構造的複雑さのため、基本的な課題でありながら難しい課題である。
細粒度および疎粒度オブジェクト構造を生成するための階層的特徴相互作用を強化する部分認識型マルチスケールオクツリー拡散モデルであるHierOctFusionを提案する。
実験により,HierOctFusionは従来の方法よりも優れた形状品質と効率が得られることが示された。
論文 参考訳(メタデータ) (2025-08-14T23:12:18Z) - Spatial-Temporal-Spectral Unified Modeling for Remote Sensing Dense Prediction [20.1863553357121]
リモートセンシングのための現在のディープラーニングアーキテクチャは、基本的に堅固である。
本稿では,統合モデリングのための空間時間スペクトル統一ネットワーク(STSUN)について紹介する。
STSUNは任意の空間サイズ、時間長、スペクトル帯域で入力および出力データに適応することができる。
様々な密集した予測タスクと多様な意味クラス予測を統一する。
論文 参考訳(メタデータ) (2025-05-18T07:39:17Z) - SpecDM: Hyperspectral Dataset Synthesis with Pixel-level Semantic Annotations [27.391859339238906]
本稿では,画素レベルのアノテーションを用いたハイパースペクトル画像の合成における生成拡散モデルの可能性について検討する。
私たちの知る限りでは、アノテーションで高次元のHSIを生成するのはこれが初めてです。
我々は、セマンティックセグメンテーションと変化検出の2つの最も広く使われている密集予測タスクを選択し、これらのタスクに適したデータセットを生成する。
論文 参考訳(メタデータ) (2025-02-24T11:13:37Z) - DiHuR: Diffusion-Guided Generalizable Human Reconstruction [51.31232435994026]
一般化可能なヒト3次元再構成のための拡散誘導モデルであるDiHuRを導入し,スパース・ミニマル・オーバーラップ画像からのビュー合成について述べる。
提案手法は, 一般化可能なフィードフォワードモデルと2次元拡散モデルとの2つのキー前処理をコヒーレントな方法で統合する。
論文 参考訳(メタデータ) (2024-11-16T03:52:23Z) - Enhancing Generalizability of Representation Learning for Data-Efficient 3D Scene Understanding [50.448520056844885]
本研究では,実世界のパターンを持つ多様な合成シーンを生成可能なベイズネットワークを提案する。
一連の実験は、既存の最先端の事前学習手法に比べて、我々の手法が一貫した優位性を示す。
論文 参考訳(メタデータ) (2024-06-17T07:43:53Z) - Distribution-Aware Data Expansion with Diffusion Models [55.979857976023695]
本研究では,分散型拡散モデルに基づくトレーニングフリーなデータ拡張フレームワークであるDistDiffを提案する。
DistDiffは、オリジナルデータのみにトレーニングされたモデルと比較して、さまざまなデータセットの精度を一貫して向上させる。
論文 参考訳(メタデータ) (2024-03-11T14:07:53Z) - Boosting Human-Object Interaction Detection with Text-to-Image Diffusion
Model [22.31860516617302]
本稿では,事前学習したテキスト画像拡散モデルに基づく新しいHOI検出方式であるDiffHOIを紹介する。
HOIデータセットのギャップを埋めるために、クラスバランス、大規模、高多様性の合成データセットであるSynHOIを提案する。
実験により、DiffHOIは通常の検出(41.50 mAP)とゼロショット検出において、最先端の技術を著しく上回っていることが示された。
論文 参考訳(メタデータ) (2023-05-20T17:59:23Z) - Synthetic Data and Hierarchical Object Detection in Overhead Imagery [0.0]
衛星画像における低・ゼロサンプル学習を向上させるための新しい合成データ生成および拡張技術を開発した。
合成画像の有効性を検証するために,検出モデルと2段階モデルの訓練を行い,実際の衛星画像上で得られたモデルを評価する。
論文 参考訳(メタデータ) (2021-01-29T22:52:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。