論文の概要: What Are We Really Measuring? Rethinking Dataset Bias in Web-Scale Natural Image Collections via Unsupervised Semantic Clustering
- arxiv url: http://arxiv.org/abs/2604.13610v1
- Date: Wed, 15 Apr 2026 08:23:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-16 20:38:32.450535
- Title: What Are We Really Measuring? Rethinking Dataset Bias in Web-Scale Natural Image Collections via Unsupervised Semantic Clustering
- Title(参考訳): 実際に何が測定されているのか? 教師なしセマンティッククラスタリングによるWebスケール自然画像収集におけるデータセットバイアスの再考
- Authors: Amir Hossein Saleknia, Mohammad Sabokrou,
- Abstract要約: コンピュータビジョンにおいて、データセットバイアスを定量化する一般的な方法は、データセットを区別するためにモデルをトレーニングすることである。
このアプローチは、標準的な画像拡張が低レベルの非意味的な手がかりをうまく抑制できると仮定する。
この基本的な仮定は、大規模な自然画像収集の領域に欠陥があることを実証する。
- 参考スコア(独自算出の注目度): 11.774459974874587
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In computer vision, a prevailing method for quantifying dataset bias is to train a model to distinguish between datasets. High classification accuracy is then interpreted as evidence of meaningful semantic differences. This approach assumes that standard image augmentations successfully suppress low-level, non-semantic cues, and that any remaining performance must therefore reflect true semantic divergence. We demonstrate that this fundamental assumption is flawed within the domain of large-scale natural image collections. High classification accuracy is often driven by resolution-based artifacts, which are structural fingerprints arising from native image resolution distributions and interpolation effects during resizing. These artifacts form robust, dataset-specific signatures that persist despite conventional image corruptions. Through controlled experiments, we show that models achieve strong dataset classification even on non-semantic, procedurally generated images, proving their reliance on superficial cues. To address this issue, we revisit this decades-old idea of dataset separability, but not with supervised classification. Instead, we introduce an unsupervised approach that measures true semantic separability. Our framework directly assesses semantic similarity by clustering semantically-rich features from foundational vision models, deliberately bypassing supervised classification on dataset labels. When applied to major web-scale datasets, the primary focus of this work, the high separability reported by supervised methods largely vanishes, with clustering accuracy dropping to near-chance levels. This reveals that conventional classification-based evaluation systematically overstates semantic bias by an overwhelming margin.
- Abstract(参考訳): コンピュータビジョンにおいて、データセットバイアスを定量化する一般的な方法は、データセットを区別するためにモデルをトレーニングすることである。
高い分類精度は意味的な意味の違いの証拠として解釈される。
このアプローチは、標準的な画像拡張が低レベルで非意味的なキューを効果的に抑制し、残りの性能は真の意味的分岐を反映しなければならないと仮定する。
この基本的な仮定は、大規模な自然画像収集の領域に欠陥があることを実証する。
高い分類精度は、しばしば解像度に基づくアーティファクトによって駆動される。
これらのアーティファクトは、従来の画像の破損にもかかわらず持続する、堅牢でデータセット固有のシグネチャを形成します。
制御実験により,非セマンティックで手続き的に生成された画像であっても,強力なデータセット分類が達成され,表面的手がかりへの依存が証明された。
この問題に対処するために、この数十年前のデータセット分離性の概念を再考するが、教師付き分類は行わない。
代わりに、真の意味分離性を測定する教師なしのアプローチを導入する。
本フレームワークは,データセットラベルの教師付き分類を意図的に回避し,基礎的視覚モデルから意味豊かな特徴をクラスタリングすることで,意味的類似性を直接評価する。
主要なWebスケールデータセットに適用した場合、この研究の主な焦点は、教師付き手法によって報告される高い分離性が、クラスタリングの精度をほぼチャンスレベルに低下させることで、ほとんど消滅することである。
このことは、従来の分類に基づく評価が、圧倒的なマージンによる意味バイアスを体系的に過大評価していることを示している。
関連論文リスト
- Advancing Image Classification with Discrete Diffusion Classification Modeling [25.92509040578864]
DiDiCMは拡散に基づく手法を利用して入力画像上に条件付きクラスラベルの後方分布をモデル化する新しいフレームワークである。
本稿では,ImageNetデータセットの分類精度がベースラインよりも高くなり,タスクの難易度が高まるにつれて精度が向上することを示す。
論文 参考訳(メタデータ) (2025-11-25T12:42:26Z) - Low-Biased General Annotated Dataset Generation [62.04202037186855]
低バイアスの一般アノテーション付きデータセット生成フレームワーク(lbGen)を提案する。
高価な手作業による収集ではなく,カテゴリアノテーションを用いた低バイアス画像を直接生成することを目的としている。
実験結果から,手動ラベル付きデータセットや他の合成データセットと比較して,生成した低バイアスデータセットの利用により,一般化能力の安定が図られた。
論文 参考訳(メタデータ) (2024-12-14T13:28:40Z) - Semi-supervised Semantic Segmentation Meets Masked Modeling:Fine-grained
Locality Learning Matters in Consistency Regularization [31.333862320143968]
半教師付きセマンティックセグメンテーションはラベル付き画像と豊富なラベル付き画像を利用してラベル効率の高い学習を実現することを目的としている。
我々は,より詳細な局所性学習により,より高密度なセグメンテーションを実現する,textttMaskMatchという新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-12-14T03:28:53Z) - Region-level Active Learning for Cluttered Scenes [60.93811392293329]
本稿では,従来の画像レベルのアプローチとオブジェクトレベルのアプローチを一般化した領域レベルのアプローチに仮定する新たな戦略を提案する。
その結果,本手法はラベル付けの労力を大幅に削減し,クラス不均衡や散らかったシーンを生かしたリアルなデータに対する希少なオブジェクト検索を改善することが示唆された。
論文 参考訳(メタデータ) (2021-08-20T14:02:38Z) - Instance Localization for Self-supervised Detection Pretraining [68.24102560821623]
インスタンスローカリゼーションと呼ばれる,新たな自己監視型プリテキストタスクを提案する。
境界ボックスを事前学習に組み込むことで、より優れたタスクアライメントとアーキテクチャアライメントが促進されることを示す。
実験結果から, オブジェクト検出のための最先端の転送学習結果が得られた。
論文 参考訳(メタデータ) (2021-02-16T17:58:57Z) - Scale Aware Adaptation for Land-Cover Classification in Remote Sensing
Imagery [4.793219747021116]
リモートセンシング画像を用いた土地被覆分類は重要な地球観測課題である。
リモートセンシングイメージでディープセグメンテーションモデルをトレーニングするためのベンチマークデータセットは小さい傾向がある。
クロスロケーションおよびクロススケールの土地被覆分類を行うためのスケール認識型対人学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-12-08T05:15:43Z) - Texture image classification based on a pseudo-parabolic diffusion model [0.0]
提案手法は、確立されたベンチマークテクスチャデータベースの分類と、植物種認識の実践的な課題について検証する。
画像の同種領域内では、擬似放物的演算子が、うる限りノイズの多い詳細を滑らかにすることができることで、優れた性能を大いに正当化することができる。
論文 参考訳(メタデータ) (2020-11-14T00:04:07Z) - Joint Visual and Temporal Consistency for Unsupervised Domain Adaptive
Person Re-Identification [64.37745443119942]
本稿では,局所的なワンホット分類とグローバルなマルチクラス分類を組み合わせることで,視覚的・時間的整合性を両立させる。
3つの大規模ReIDデータセットの実験結果は、教師なしと教師なしの両方のドメイン適応型ReIDタスクにおいて提案手法の優位性を示す。
論文 参考訳(メタデータ) (2020-07-21T14:31:27Z) - Unsupervised Image Classification for Deep Representation Learning [42.09716669386924]
埋め込みクラスタリングを使わずに、教師なしのイメージ分類フレームワークを提案する。
提案手法の有効性を証明するために,ImageNetデータセットの実験を行った。
論文 参考訳(メタデータ) (2020-06-20T02:57:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。