論文の概要: Balanced Audiovisual Dataset for Imbalance Analysis
- arxiv url: http://arxiv.org/abs/2302.10912v1
- Date: Tue, 14 Feb 2023 15:35:17 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-26 13:31:23.227229
- Title: Balanced Audiovisual Dataset for Imbalance Analysis
- Title(参考訳): 不均衡解析のためのバランス付き視聴覚データセット
- Authors: Wenke Xia, Xu Zhao, Xincheng Pang, Changqing Zhang, Di Hu
- Abstract要約: 不均衡問題は機械学習の分野で広く知られており、マルチモーダル学習領域にも存在している。
最近の研究はアルゴリズムの観点からモダリティの不均衡問題を解こうとしているが、データセットにおけるモダリティバイアスの影響を完全には分析していない。
- 参考スコア(独自算出の注目度): 31.510912639133014
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The imbalance problem is widespread in the field of machine learning, which
also exists in multimodal learning areas caused by the intrinsic discrepancy
between modalities of samples. Recent works have attempted to solve the
modality imbalance problem from algorithm perspective, however, they do not
fully analyze the influence of modality bias in datasets. Concretely, existing
multimodal datasets are usually collected under specific tasks, where one
modality tends to perform better than other ones in most conditions. In this
work, to comprehensively explore the influence of modality bias, we first split
existing datasets into different subsets by estimating sample-wise modality
discrepancy. We surprisingly find that: the multimodal models with existing
imbalance algorithms consistently perform worse than the unimodal one on
specific subsets, in accordance with the modality bias. To further explore the
influence of modality bias and analyze the effectiveness of existing imbalance
algorithms, we build a balanced audiovisual dataset, with uniformly distributed
modality discrepancy over the whole dataset. We then conduct extensive
experiments to re-evaluate existing imbalance algorithms and draw some
interesting findings: existing algorithms only provide a compromise between
modalities and suffer from the large modality discrepancy of samples. We hope
that these findings could facilitate future research on the modality imbalance
problem.
- Abstract(参考訳): 不均衡問題は機械学習の分野でも広く発生しており、サンプルのモダリティ間の内在的不一致に起因するマルチモーダル学習領域にも存在している。
近年,アルゴリズムの観点からのモダリティ不均衡問題を解こうとしているが,データセットにおけるモダリティバイアスの影響を完全には解析していない。
具体的には、既存のマルチモーダルデータセットは通常、特定のタスクの下で収集される。
本研究は,モーダリティバイアスの影響を包括的に調査するため,サンプルワイド・モーダリティの差を推定することにより,既存のデータセットを異なるサブセットに分割する。
既存の不均衡アルゴリズムを持つマルチモーダルモデルは、モダリティバイアスに従って、特定の部分集合上のユニモーダルモデルよりも一貫して性能が劣る。
モダリティバイアスの影響をさらに探究し、既存の不均衡アルゴリズムの有効性を分析するために、データセット全体にわたって均一に分散されたモダリティ不一致を持つ、バランスのとれた視聴覚データセットを構築する。
既存のアルゴリズムは、モダリティ間の妥協を提供し、サンプルの大きなモダリティの相違に苦しむのみである。
これらの発見が、モダリティの不均衡問題の将来の研究を促進することを願っている。
関連論文リスト
- Enhancing multimodal cooperation via sample-level modality valuation [10.677997431505815]
そこで本研究では,各サンプルに対するモダリティの寄与を評価するために,サンプルレベルのモダリティ評価指標を提案する。
モダリティ評価によって、モダリティの相違は、データセットレベルでのグローバルな貢献相違を超えて、実際にサンプルレベルで異なる可能性があることが分かる。
本手法は, 微細なユニモーダル・コントリビューションを合理的に観察し, 大幅な改善を実現している。
論文 参考訳(メタデータ) (2023-09-12T14:16:34Z) - Tackling Diverse Minorities in Imbalanced Classification [80.78227787608714]
不均衡データセットは、様々な現実世界のアプリケーションで一般的に見られ、分類器の訓練において重要な課題が提示されている。
マイノリティクラスとマイノリティクラスの両方のデータサンプルを混合することにより、反復的に合成サンプルを生成することを提案する。
提案するフレームワークの有効性を,7つの公開ベンチマークデータセットを用いて広範な実験により実証する。
論文 参考訳(メタデータ) (2023-08-28T18:48:34Z) - Simplicity Bias Leads to Amplified Performance Disparities [8.60453031364566]
SGDで訓練されたモデルは、単純さに偏りがあることを示し、多数派の学習を優先させる。
モデルは、単純なデータセットのクラスやグループを優先順位付けし、複雑なものを見つけることを犠牲にすることができる。
論文 参考訳(メタデータ) (2022-12-13T15:24:41Z) - Equivariance Allows Handling Multiple Nuisance Variables When Analyzing
Pooled Neuroimaging Datasets [53.34152466646884]
本稿では,構造空間上でインスタンス化された同変表現学習における最近の結果と,因果推論における古典的結果の簡易な利用が,いかに効果的に実現されたかを示す。
いくつかの仮定の下で、我々のモデルが複数のニュアンス変数を扱えることを実証し、そうでなければサンプルの大部分を取り除く必要のあるシナリオにおいて、プールされた科学データセットの分析を可能にする。
論文 参考訳(メタデータ) (2022-03-29T04:54:06Z) - On Modality Bias Recognition and Reduction [70.69194431713825]
マルチモーダル分類の文脈におけるモダリティバイアス問題について検討する。
本稿では,各ラベルの特徴空間を適応的に学習するプラグアンドプレイ損失関数法を提案する。
本手法は, ベースラインに比べ, 顕著な性能向上を実現している。
論文 参考訳(メタデータ) (2022-02-25T13:47:09Z) - Handling Imbalanced Data: A Case Study for Binary Class Problems [0.0]
分類問題の解決における主要な問題は、不均衡データの問題である。
本稿では,合成オーバーサンプリング技術と手動で合成データポイントを計算することで,アルゴリズムの理解を深める。
我々は,これらの合成オーバーサンプリング手法を,不均衡比とサンプルサイズが異なる二項分類問題に適用する。
論文 参考訳(メタデータ) (2020-10-09T02:04:14Z) - Accounting for Unobserved Confounding in Domain Generalization [107.0464488046289]
本稿では,データセットの組み合わせから頑健で一般化可能な予測モデルを学習する際の問題点について検討する。
堅牢なモデルを学ぶことの課題の一部は、保存されていない共同設立者の影響にある。
異なるモダリティの医療データに対するアプローチの実証的性能を実証する。
論文 参考訳(メタデータ) (2020-07-21T08:18:06Z) - Heteroskedastic and Imbalanced Deep Learning with Adaptive
Regularization [55.278153228758434]
実世界のデータセットはヘテロスケダティックで不均衡である。
ヘテロスケダスティック性と不均衡を同時に扱うことは、未発見である。
本稿ではヘテロスケダスティックデータセットに対するデータ依存正規化手法を提案する。
論文 参考訳(メタデータ) (2020-06-29T01:09:50Z) - Long-Tailed Recognition Using Class-Balanced Experts [128.73438243408393]
本稿では,多様な分類器の強度を組み合わせたクラスバランスの専門家のアンサンブルを提案する。
私たちのクラスバランスの専門家のアンサンブルは、最先端に近い結果に到達し、長い尾の認識のための2つのベンチマークで新たな最先端のアンサンブルを確立します。
論文 参考訳(メタデータ) (2020-04-07T20:57:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。