論文の概要: CDLT: A Dataset with Concept Drift and Long-Tailed Distribution for
Fine-Grained Visual Categorization
- arxiv url: http://arxiv.org/abs/2306.02346v1
- Date: Sun, 4 Jun 2023 12:42:45 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-06 18:28:07.533167
- Title: CDLT: A Dataset with Concept Drift and Long-Tailed Distribution for
Fine-Grained Visual Categorization
- Title(参考訳): CDLT:細粒度視覚分類のための概念ドリフトと長期分布を用いたデータセット
- Authors: Shuo Ye and Yufeng Shi and Ruxin Wang and Yu Wang and Jiamiao Xu and
Chuanwu Yang and Xinge You
- Abstract要約: コンセプトドリフトとロングプレート分布データセットは、47ヶ月連続して、異なる種で250のインスタンスの11195の画像を収集することによって収集される。
インスタンスの特徴は時間によって異なり、長い尾の分布を示す傾向がある。
- 参考スコア(独自算出の注目度): 16.970777213825556
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data is the foundation for the development of computer vision, and the
establishment of datasets plays an important role in advancing the techniques
of fine-grained visual categorization~(FGVC). In the existing FGVC datasets
used in computer vision, it is generally assumed that each collected instance
has fixed characteristics and the distribution of different categories is
relatively balanced. In contrast, the real world scenario reveals the fact that
the characteristics of instances tend to vary with time and exhibit a
long-tailed distribution. Hence, the collected datasets may mislead the
optimization of the fine-grained classifiers, resulting in unpleasant
performance in real applications. Starting from the real-world conditions and
to promote the practical progress of fine-grained visual categorization, we
present a Concept Drift and Long-Tailed Distribution dataset. Specifically, the
dataset is collected by gathering 11195 images of 250 instances in different
species for 47 consecutive months in their natural contexts. The collection
process involves dozens of crowd workers for photographing and domain experts
for labelling. Extensive baseline experiments using the state-of-the-art
fine-grained classification models demonstrate the issues of concept drift and
long-tailed distribution existed in the dataset, which require the attention of
future researches.
- Abstract(参考訳): データはコンピュータビジョンの発展の基盤であり、データセットの確立はきめ細かい視覚分類技術(FGVC)の進展に重要な役割を果たしている。
コンピュータビジョンで使用される既存のFGVCデータセットでは、各収集されたインスタンスは固定特性を持ち、異なるカテゴリの分布は比較的バランスが取れていると一般的に仮定される。
対照的に、実世界のシナリオでは、インスタンスの特性が時間とともに変化し、ロングテール分布を示す傾向があるという事実が明らかにされる。
したがって、収集されたデータセットは細粒度の分類器の最適化を誤解し、実際のアプリケーションでは不快なパフォーマンスをもたらす可能性がある。
実世界の状況から始まり,細粒度視覚分類の実際的な進展を促進するために,概念ドリフトとロングテール分布データセットを提案する。
具体的には、データセットは、異なる種で47ヶ月連続して、250のインスタンスの11195の画像を収集して収集される。
収集プロセスには、写真撮影のための数十人の群衆労働者とラベル付けのドメイン専門家が含まれる。
最先端のきめ細かい分類モデルを用いた大規模なベースライン実験は、データセットにコンセプトドリフトと長い尾の分布の問題を示し、将来の研究の注意を要する。
関連論文リスト
- Explaining Categorical Feature Interactions Using Graph Covariance and LLMs [18.44675735926458]
本稿では,Counter Trafficking Data Collaborativeからのグローバルな合成データセットに焦点を当てる。
2002年から2022年にかけて20,000件以上の匿名化された記録があり、それぞれのレコードに多くの分類学的特徴がある。
本稿では,重要な分類的特徴の相互作用を分析し,抽出するための高速でスケーラブルな手法を提案する。
論文 参考訳(メタデータ) (2025-01-24T21:41:26Z) - HiGDA: Hierarchical Graph of Nodes to Learn Local-to-Global Topology for Semi-Supervised Domain Adaptation [0.18749305679160366]
機能レベルとカテゴリレベルの両方で表現を同時に提示するように設計されたノードの階層グラフを導入します。
本研究では、画像内の最も関連性の高いパッチを識別するための局所グラフを導入し、定義された主オブジェクト表現への適応性を促進する。
カテゴリレベルでは、グローバルグラフを使用して、同じカテゴリ内のサンプルから特徴を集約し、全体的な表現を豊かにする。
論文 参考訳(メタデータ) (2024-12-16T14:35:52Z) - Visual Data Diagnosis and Debiasing with Concept Graphs [50.84781894621378]
視覚データセットにおける概念共起バイアスの診断と緩和のためのフレームワークであるConBiasを提案する。
このような不均衡を緩和し,下流タスクの性能向上につながることを示す。
論文 参考訳(メタデータ) (2024-09-26T16:59:01Z) - Auto Cherry-Picker: Learning from High-quality Generative Data Driven by Language [41.40908753726324]
拡散モデルは現実的で多様な画像を生成することができ、データ集約的な知覚タスクのためのデータ可用性を促進する可能性がある。
高品質なクロスモダリティトレーニングサンプルを生成する新しいフレームワークであるtextbfAuto textbfCherry-textbfPicker (ACP) を提案する。
論文 参考訳(メタデータ) (2024-06-28T17:53:18Z) - Deep Domain Adaptation: A Sim2Real Neural Approach for Improving Eye-Tracking Systems [80.62854148838359]
眼球画像のセグメンテーションは、最終視線推定に大きな影響を及ぼす眼球追跡の重要なステップである。
対象視線画像と合成訓練データとの重なり合いを測定するために,次元還元法を用いている。
提案手法は,シミュレーションと実世界のデータサンプルの相違に対処する際の頑健で,性能が向上する。
論文 参考訳(メタデータ) (2024-03-23T22:32:06Z) - Consistency Regularization for Generalizable Source-free Domain
Adaptation [62.654883736925456]
ソースフリードメイン適応(source-free domain adapt, SFDA)は、ソースデータセットにアクセスすることなく、十分にトレーニングされたソースモデルを未学習のターゲットドメインに適応することを目的としている。
既存のSFDAメソッドは、ターゲットのトレーニングセット上で適用されたモデルを評価し、目に見えないが同一の分散テストセットからデータを無視する。
より一般化可能なSFDA法を開発するための整合正則化フレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-03T07:45:53Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z) - Generalized Representations Learning for Time Series Classification [28.230863650758447]
時間的複雑性は時系列分類における未知の潜在分布に起因していると主張する。
本研究では,ジェスチャー認識,音声コマンド認識,ウェアラブルストレスと感情検出,センサによる人間の活動認識に関する実験を行う。
論文 参考訳(メタデータ) (2022-09-15T03:36:31Z) - Accuracy on the Line: On the Strong Correlation Between
Out-of-Distribution and In-Distribution Generalization [89.73665256847858]
分布外性能は,広範囲なモデルと分布シフトに対する分布内性能と強く相関していることを示す。
具体的には,CIFAR-10 と ImageNet の変種に対する分布内分布と分布外分布性能の強い相関関係を示す。
また,CIFAR-10-Cと組織分類データセットCamelyon17-WILDSの合成分布の変化など,相関が弱いケースについても検討した。
論文 参考訳(メタデータ) (2021-07-09T19:48:23Z) - Input-Output Balanced Framework for Long-tailed LiDAR Semantic
Segmentation [12.639524717464509]
本稿では,ロングテール分布の問題を扱うための入出力バランスフレームワークを提案する。
入力空間に対して、メッシュモデルからこれらのテールインスタンスを合成し、LiDARスキャンの位置と密度分布をうまくシミュレートする。
出力空間に対して, 形状と実例量に基づいて, 異なるカテゴリをグループ化するマルチヘッドブロックを提案する。
論文 参考訳(メタデータ) (2021-03-26T05:42:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。