論文の概要: Modeling Saliency Dataset Bias
- arxiv url: http://arxiv.org/abs/2505.10169v1
- Date: Thu, 15 May 2025 10:55:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-16 22:29:06.289853
- Title: Modeling Saliency Dataset Bias
- Title(参考訳): 可用性データセットバイアスのモデリング
- Authors: Matthias Kümmerer, Harneet Khanuja, Matthias Bethge,
- Abstract要約: 画像ベースサリエンシ予測の最近の進歩は、既存のベンチマーク上でのゴールド標準性能レベルに近づいている。
データセットバイアスのため、複数の正当性データセットにまたがる修正予測が依然として困難であることを示す。
本稿では,データセットに依存しないエンコーダ・デコーダ構造を20未満のパラメータで拡張する新しいアーキテクチャを提案する。
- 参考スコア(独自算出の注目度): 10.364146597632365
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in image-based saliency prediction are approaching gold standard performance levels on existing benchmarks. Despite this success, we show that predicting fixations across multiple saliency datasets remains challenging due to dataset bias. We find a significant performance drop (around 40%) when models trained on one dataset are applied to another. Surprisingly, increasing dataset diversity does not resolve this inter-dataset gap, with close to 60% attributed to dataset-specific biases. To address this remaining generalization gap, we propose a novel architecture extending a mostly dataset-agnostic encoder-decoder structure with fewer than 20 dataset-specific parameters that govern interpretable mechanisms such as multi-scale structure, center bias, and fixation spread. Adapting only these parameters to new data accounts for more than 75% of the generalization gap, with a large fraction of the improvement achieved with as few as 50 samples. Our model sets a new state-of-the-art on all three datasets of the MIT/Tuebingen Saliency Benchmark (MIT300, CAT2000, and COCO-Freeview), even when purely generalizing from unrelated datasets, but with a substantial boost when adapting to the respective training datasets. The model also provides valuable insights into spatial saliency properties, revealing complex multi-scale effects that combine both absolute and relative sizes.
- Abstract(参考訳): 画像ベースサリエンシ予測の最近の進歩は、既存のベンチマーク上でのゴールド標準性能レベルに近づいている。
この成功にもかかわらず、データセットバイアスのため、複数の正当性データセットにまたがる修正の予測が依然として困難であることを示す。
1つのデータセットでトレーニングされたモデルが別のデータセットに適用された場合、パフォーマンスが大幅に低下する(約40%)。
驚くべきことに、データセットの多様性の増加はデータセット間のギャップを解決しない。
この余分な一般化ギャップに対処するために,マルチスケール構造や中心バイアス,固定化拡散といった解釈可能な機構を規定する20未満のデータセット固有のパラメータを持つ,ほとんどデータセットに依存しないエンコーダ・デコーダ構造を拡張した新しいアーキテクチャを提案する。
これらのパラメータのみを新しいデータに適応させることは、一般化ギャップの75%以上を占め、改善のかなりの部分は50個のサンプルで達成された。
我々のモデルは、無関係なデータセットから純粋に一般化した場合でも、MIT/Tuebingen Saliency Benchmark(MIT300、CAT2000、COCO-Freeview)の3つのデータセットすべてに新しい最先端のモデルを設定します。
このモデルはまた、空間的塩分濃度特性に関する貴重な洞察を与え、絶対値と相対値の両方を組み合わせた複雑なマルチスケール効果を明らかにする。
関連論文リスト
- Towards Data-Efficient Pretraining for Atomic Property Prediction [51.660835328611626]
タスク関連データセットでの事前トレーニングは、大規模な事前トレーニングと一致するか、あるいは超える可能性があることを示す。
本稿では,コンピュータビジョンのFr'echet Inception Distanceにインスパイアされた,化学類似度指数(CSI)を紹介する。
論文 参考訳(メタデータ) (2025-02-16T11:46:23Z) - A CLIP-Powered Framework for Robust and Generalizable Data Selection [51.46695086779598]
実世界のデータセットは、しばしば冗長でノイズの多いデータを含み、トレーニング効率とモデルパフォーマンスに悪影響を及ぼす。
データ選択は、データセット全体から最も代表的なサンプルを特定することを約束している。
より堅牢で一般化可能なサンプル選択にマルチモーダル情報を活用するCLIPを利用した新しいデータ選択フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-15T03:00:58Z) - Under the Hood of Tabular Data Generation Models: Benchmarks with Extensive Tuning [2.5168710814072894]
16個のデータセットに対する広範囲なベンチマークにより,データセット固有のチューニングが表型データ生成のための最新の5つのモデルファミリに与える影響について検討した。
我々のベンチマークは、ほとんどのモデルにおいて、大規模データセット固有のチューニングが元の構成よりも大幅に性能を向上することを示した。
論文 参考訳(メタデータ) (2024-06-18T07:27:38Z) - UniTraj: A Unified Framework for Scalable Vehicle Trajectory Prediction [93.77809355002591]
さまざまなデータセット、モデル、評価基準を統一する包括的なフレームワークであるUniTrajを紹介する。
我々は広範な実験を行い、他のデータセットに転送するとモデルの性能が大幅に低下することがわかった。
これらの知見を説明するために,データセットの特徴に関する洞察を提供する。
論文 参考訳(メタデータ) (2024-03-22T10:36:50Z) - A Case for Dataset Specific Profiling [0.9023847175654603]
データ駆動科学は、科学的な発見が、リッチで規律固有のデータセットに対する計算AIモデルの実行に依存する、新興パラダイムである。
現代的な機械学習フレームワークを使用することで、誰でも科学的応用を可能にするデータに隠された概念を明らかにする計算モデルを開発し、実行することができる。
重要で広く使われているデータセットでは、データセットに対して実行できるすべての計算モデルのパフォーマンスを計算することは、クラウドリソースの点でコストを禁ずる。
論文 参考訳(メタデータ) (2022-08-01T18:38:05Z) - THE Benchmark: Transferable Representation Learning for Monocular Height
Estimation [25.872962101146115]
クロスデータセット設定における高さ推定モデルの転送可能性を検討するための新しいベンチマークデータセットを提案する。
このベンチマークデータセットには、新しく提案された大規模合成データセット、新たに収集された実世界のデータセット、および異なる都市の既存の4つのデータセットが含まれている。
本論文では、高さ推定タスクにおけるスケール変量問題に対処するウィンドウベース変換器を強化するためのスケール変形可能な畳み込みモジュールを提案する。
論文 参考訳(メタデータ) (2021-12-30T09:40:26Z) - MSeg: A Composite Dataset for Multi-domain Semantic Segmentation [100.17755160696939]
セマンティックセグメンテーションデータセットを異なるドメインから統合する合成データセットであるMSegを提案する。
一般化と画素レベルのアノテーションのアライメントを調整し,2万枚以上のオブジェクトマスクを8万枚以上の画像で再現する。
MSegでトレーニングされたモデルは、WildDash-v1のリーダーボードで、トレーニング中にWildDashのデータに触れることなく、堅牢なセマンティックセグメンテーションのためにランク付けされている。
論文 参考訳(メタデータ) (2021-12-27T16:16:35Z) - Cross-Dataset Collaborative Learning for Semantic Segmentation [17.55660581677053]
我々は、Cross-Dataset Collaborative Learning (CDCL) と呼ばれる、単純で柔軟で汎用的なセマンティックセグメンテーション手法を提案する。
複数のラベル付きデータセットを付与することで、各データセット上の特徴表現の一般化と識別を改善することを目指しています。
単一データセットとクロスデータセットの設定で,Cityscapes,BDD100K,CamVid,COCO Stuffという4つの多様なデータセットに対して,広範な評価を行う。
論文 参考訳(メタデータ) (2021-03-21T09:59:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。