Fugu-MT 論文翻訳(概要): CDLT: A Dataset with Concept Drift and Long-Tailed Distribution for Fine-Grained Visual Categorization

論文の概要: CDLT: A Dataset with Concept Drift and Long-Tailed Distribution for Fine-Grained Visual Categorization

arxiv url: http://arxiv.org/abs/2306.02346v1
Date: Sun, 4 Jun 2023 12:42:45 GMT
ステータス: 翻訳完了
システム内更新日: 2023-06-06 18:28:07.533167
Title: CDLT: A Dataset with Concept Drift and Long-Tailed Distribution for Fine-Grained Visual Categorization
Title（参考訳）: CDLT:細粒度視覚分類のための概念ドリフトと長期分布を用いたデータセット
Authors: Shuo Ye and Yufeng Shi and Ruxin Wang and Yu Wang and Jiamiao Xu and Chuanwu Yang and Xinge You
Abstract要約: コンセプトドリフトとロングプレート分布データセットは、47ヶ月連続して、異なる種で250のインスタンスの11195の画像を収集することによって収集される。インスタンスの特徴は時間によって異なり、長い尾の分布を示す傾向がある。
参考スコア（独自算出の注目度）: 16.970777213825556
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Data is the foundation for the development of computer vision, and the establishment of datasets plays an important role in advancing the techniques of fine-grained visual categorization~(FGVC). In the existing FGVC datasets used in computer vision, it is generally assumed that each collected instance has fixed characteristics and the distribution of different categories is relatively balanced. In contrast, the real world scenario reveals the fact that the characteristics of instances tend to vary with time and exhibit a long-tailed distribution. Hence, the collected datasets may mislead the optimization of the fine-grained classifiers, resulting in unpleasant performance in real applications. Starting from the real-world conditions and to promote the practical progress of fine-grained visual categorization, we present a Concept Drift and Long-Tailed Distribution dataset. Specifically, the dataset is collected by gathering 11195 images of 250 instances in different species for 47 consecutive months in their natural contexts. The collection process involves dozens of crowd workers for photographing and domain experts for labelling. Extensive baseline experiments using the state-of-the-art fine-grained classification models demonstrate the issues of concept drift and long-tailed distribution existed in the dataset, which require the attention of future researches.
Abstract（参考訳）: データはコンピュータビジョンの発展の基盤であり、データセットの確立はきめ細かい視覚分類技術(FGVC)の進展に重要な役割を果たしている。コンピュータビジョンで使用される既存のFGVCデータセットでは、各収集されたインスタンスは固定特性を持ち、異なるカテゴリの分布は比較的バランスが取れていると一般的に仮定される。対照的に、実世界のシナリオでは、インスタンスの特性が時間とともに変化し、ロングテール分布を示す傾向があるという事実が明らかにされる。したがって、収集されたデータセットは細粒度の分類器の最適化を誤解し、実際のアプリケーションでは不快なパフォーマンスをもたらす可能性がある。実世界の状況から始まり,細粒度視覚分類の実際的な進展を促進するために,概念ドリフトとロングテール分布データセットを提案する。具体的には、データセットは、異なる種で47ヶ月連続して、250のインスタンスの11195の画像を収集して収集される。収集プロセスには、写真撮影のための数十人の群衆労働者とラベル付けのドメイン専門家が含まれる。最先端のきめ細かい分類モデルを用いた大規模なベースライン実験は、データセットにコンセプトドリフトと長い尾の分布の問題を示し、将来の研究の注意を要する。

関連論文リスト

OpenDataArena: A Fair and Open Arena for Benchmarking Post-Training Dataset Value [74.80873109856563]
OpenDataArena(ODA)は、トレーニング後のデータの本質的な価値をベンチマークするために設計された、総合的でオープンなプラットフォームである。 ODAは4つの主要な柱からなる包括的なエコシステムを確立している。 (i) 多様なモデル間で公平でオープンな比較を保証する統一的なトレーニング評価パイプライン、 (ii) 異なる軸数に沿ってデータ品質をプロファイリングする多次元スコアリングフレームワーク、 (iii) データセットの系図を視覚化してコンポーネントソースを識別するインタラクティブなデータ系統探索である。
論文参考訳（メタデータ） (2025-12-16T03:33:24Z)
Transfer Learning and Mixup for Fine-Grained Few-Shot Fungi Classification [0.0]
本稿では,FungiCLEF 2025コンペティションの取り組みについて述べる。 FungiTastic Few-Shotデータセットを使用した、数ショットのきめ細かい視覚分類に焦点を当てている。
論文参考訳（メタデータ） (2025-07-11T01:21:21Z)
Generalized Category Discovery under the Long-Tailed Distribution [19.597592179538257]
本稿では,長期分布下での一般カテゴリー発見(GCD)の問題に対処する。これらの課題に対処するために,自信あるサンプル選択と密度に基づくクラスタリングに基づくフレームワークを提案する。本手法の有効性を実証するために, 長い尾を持つGCDデータセットと従来のGCDデータセットの比較実験を行った。
論文参考訳（メタデータ） (2025-06-14T14:06:40Z)
Deep Incomplete Multi-view Clustering with Distribution Dual-Consistency Recovery Guidance [69.58609684008964]
本稿では,distriBution dUal-Consistency Recovery Guidanceを用いた不完全なマルチビュークラスタリング手法であるBURGを提案する。我々は,各サンプルを別カテゴリとして扱い,欠落したビューの分布空間を予測するために,クロスビュー配信を行う。信頼性の高いカテゴリ情報の欠如を補うために,隣り合った整合性によって案内されるビュー内アライメントと,プロトタイプ的な整合性によって案内されるクロスビューアライメントを含む二重整合性ガイド付きリカバリ戦略を設計する。
論文参考訳（メタデータ） (2025-03-14T02:27:45Z)
Incomplete Multi-view Clustering via Diffusion Contrastive Generation [10.303281347345955]
拡散コントラスト生成 (Diffusion Contrastive Generation, DCG) と呼ばれる新しいIMVC法を提案する。 DCGは分布特性を学習し、フォワード拡散および逆復調処理をビュー内データに適用することによりクラスタリングを強化する。インスタンスレベルとカテゴリレベルの対話型学習を統合し、マルチビューデータで利用可能な一貫性のある補完的な情報を活用する。
論文参考訳（メタデータ） (2025-03-12T09:27:25Z)
Explaining Categorical Feature Interactions Using Graph Covariance and LLMs [18.44675735926458]
本稿では,Counter Trafficking Data Collaborativeからのグローバルな合成データセットに焦点を当てる。 2002年から2022年にかけて20,000件以上の匿名化された記録があり、それぞれのレコードに多くの分類学的特徴がある。本稿では,重要な分類的特徴の相互作用を分析し,抽出するための高速でスケーラブルな手法を提案する。
論文参考訳（メタデータ） (2025-01-24T21:41:26Z)
HiGDA: Hierarchical Graph of Nodes to Learn Local-to-Global Topology for Semi-Supervised Domain Adaptation [0.18749305679160366]
機能レベルとカテゴリレベルの両方で表現を同時に提示するように設計されたノードの階層グラフを導入します。本研究では、画像内の最も関連性の高いパッチを識別するための局所グラフを導入し、定義された主オブジェクト表現への適応性を促進する。カテゴリレベルでは、グローバルグラフを使用して、同じカテゴリ内のサンプルから特徴を集約し、全体的な表現を豊かにする。
論文参考訳（メタデータ） (2024-12-16T14:35:52Z)
Dataset Awareness is not Enough: Implementing Sample-level Tail Encouragement in Long-tailed Self-supervised Learning [16.110763554788445]
擬似ラベル情報を利用して動的温度と再重み付け戦略を推進し、自己教師付き長期学習に擬似ラベルを導入する。我々は,温度パラメータにおける量認識の欠如を分析し,この不足を補うために再重み付けを用いて,サンプルレベルで最適なトレーニングパターンを実現する。
論文参考訳（メタデータ） (2024-10-30T10:25:22Z)
Semi-Supervised Fine-Tuning of Vision Foundation Models with Content-Style Decomposition [4.192370959537781]
本稿では,ラベル付きデータに制限のある下流タスクにおいて,事前学習した基礎モデルの性能向上を目的とした半教師付き微調整手法を提案する。我々は、MNIST、その拡張されたバリエーション、CIFAR-10、SVHN、GalaxyMNISTを含む複数のデータセットに対するアプローチを評価した。
論文参考訳（メタデータ） (2024-10-02T22:36:12Z)
Visual Data Diagnosis and Debiasing with Concept Graphs [50.84781894621378]
視覚データセットにおける概念共起バイアスの診断と緩和のためのフレームワークであるConBiasを提案する。このような不均衡を緩和し,下流タスクの性能向上につながることを示す。
論文参考訳（メタデータ） (2024-09-26T16:59:01Z)
Auto Cherry-Picker: Learning from High-quality Generative Data Driven by Language [41.40908753726324]
拡散モデルは現実的で多様な画像を生成することができ、データ集約的な知覚タスクのためのデータ可用性を促進する可能性がある。 textbfAuto textbfCherry-textbfPicker (ACP)を提案する。
論文参考訳（メタデータ） (2024-06-28T17:53:18Z)
Deep Domain Adaptation: A Sim2Real Neural Approach for Improving Eye-Tracking Systems [80.62854148838359]
眼球画像のセグメンテーションは、最終視線推定に大きな影響を及ぼす眼球追跡の重要なステップである。対象視線画像と合成訓練データとの重なり合いを測定するために,次元還元法を用いている。提案手法は,シミュレーションと実世界のデータサンプルの相違に対処する際の頑健で,性能が向上する。
論文参考訳（メタデータ） (2024-03-23T22:32:06Z)
Consistency Regularization for Generalizable Source-free Domain Adaptation [62.654883736925456]
ソースフリードメイン適応(source-free domain adapt, SFDA)は、ソースデータセットにアクセスすることなく、十分にトレーニングされたソースモデルを未学習のターゲットドメインに適応することを目的としている。既存のSFDAメソッドは、ターゲットのトレーニングセット上で適用されたモデルを評価し、目に見えないが同一の分散テストセットからデータを無視する。より一般化可能なSFDA法を開発するための整合正則化フレームワークを提案する。
論文参考訳（メタデータ） (2023-08-03T07:45:53Z)
Cluster-level pseudo-labelling for source-free cross-domain facial expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文参考訳（メタデータ） (2022-10-11T08:24:50Z)
Generalized Representations Learning for Time Series Classification [28.230863650758447]
時間的複雑性は時系列分類における未知の潜在分布に起因していると主張する。本研究では,ジェスチャー認識,音声コマンド認識,ウェアラブルストレスと感情検出,センサによる人間の活動認識に関する実験を行う。
論文参考訳（メタデータ） (2022-09-15T03:36:31Z)
Accuracy on the Line: On the Strong Correlation Between Out-of-Distribution and In-Distribution Generalization [89.73665256847858]
分布外性能は,広範囲なモデルと分布シフトに対する分布内性能と強く相関していることを示す。具体的には,CIFAR-10 と ImageNet の変種に対する分布内分布と分布外分布性能の強い相関関係を示す。また,CIFAR-10-Cと組織分類データセットCamelyon17-WILDSの合成分布の変化など,相関が弱いケースについても検討した。
論文参考訳（メタデータ） (2021-07-09T19:48:23Z)
Input-Output Balanced Framework for Long-tailed LiDAR Semantic Segmentation [12.639524717464509]
本稿では,ロングテール分布の問題を扱うための入出力バランスフレームワークを提案する。入力空間に対して、メッシュモデルからこれらのテールインスタンスを合成し、LiDARスキャンの位置と密度分布をうまくシミュレートする。出力空間に対して, 形状と実例量に基づいて, 異なるカテゴリをグループ化するマルチヘッドブロックを提案する。
論文参考訳（メタデータ） (2021-03-26T05:42:11Z)
Domain Adaptive Transfer Learning on Visual Attention Aware Data Augmentation for Fine-grained Visual Categorization [3.5788754401889014]
ベースネットワークモデルに基づく微調整によるドメイン適応型知識伝達を行う。我々は、注意認識データ拡張技術を用いて、アキュラシーの競争力の向上を示す。提案手法は,複数の細粒度分類データセットにおける最先端結果を実現する。
論文参考訳（メタデータ） (2020-10-06T22:47:57Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。