論文の概要: Concept Matching for Low-Resource Classification
- arxiv url: http://arxiv.org/abs/2006.00937v1
- Date: Mon, 1 Jun 2020 13:34:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-26 06:40:59.185916
- Title: Concept Matching for Low-Resource Classification
- Title(参考訳): 低リソース分類のための概念マッチング
- Authors: Federico Errica, Ludovic Denoyer, Bora Edizel, Fabio Petroni, Vassilis
Plachouras, Fabrizio Silvestri, Sebastian Riedel
- Abstract要約: 非常に少ないトレーニングデータが存在する場合の分類課題に取り組むためのモデルを提案する。
入力空間におけるマッチングの確率を計算する理論的に健全なメカニズムと正確なマッチングの概念を近似する。
- 参考スコア(独自算出の注目度): 36.871182660669746
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We propose a model to tackle classification tasks in the presence of very
little training data. To this aim, we approximate the notion of exact match
with a theoretically sound mechanism that computes a probability of matching in
the input space. Importantly, the model learns to focus on elements of the
input that are relevant for the task at hand; by leveraging highlighted
portions of the training data, an error boosting technique guides the learning
process. In practice, it increases the error associated with relevant parts of
the input by a given factor. Remarkable results on text classification tasks
confirm the benefits of the proposed approach in both balanced and unbalanced
cases, thus being of practical use when labeling new examples is expensive. In
addition, by inspecting its weights, it is often possible to gather insights on
what the model has learned.
- Abstract(参考訳): 非常に少ないトレーニングデータが存在する場合の分類課題に取り組むためのモデルを提案する。
この目的のために、入力空間におけるマッチングの確率を計算する理論的に健全なメカニズムと正確なマッチングの概念を近似する。
重要なのは、モデルが手元のタスクに関連する入力要素にフォーカスすることを学ぶことだ。トレーニングデータの強調された部分を活用することで、エラーブースティング技術が学習プロセスを導く。
実際には、入力の関連部分に関連するエラーを所定の因子によって増大させる。
テキスト分類タスクにおける顕著な結果は、バランスの取れたケースとアンバランスなケースの両方において提案手法の利点を裏付けるものである。
さらに、重みを検査することで、モデルが何を学んだかについての洞察を集めることが可能である。
関連論文リスト
- Rethinking Classifier Re-Training in Long-Tailed Recognition: A Simple
Logits Retargeting Approach [102.0769560460338]
我々は,クラスごとのサンプル数に関する事前知識を必要とせず,シンプルなロジットアプローチ(LORT)を開発した。
提案手法は,CIFAR100-LT, ImageNet-LT, iNaturalist 2018など,様々な不均衡データセットの最先端性能を実現する。
論文 参考訳(メタデータ) (2024-03-01T03:27:08Z) - Noisy Correspondence Learning with Self-Reinforcing Errors Mitigation [63.180725016463974]
クロスモーダル検索は、実際は精力的な、十分に整合した大規模データセットに依存している。
我々は、新しい雑音対応学習フレームワーク、textbfSelf-textbfReinforcing textbfErrors textbfMitigation(SREM)を導入する。
論文 参考訳(メタデータ) (2023-12-27T09:03:43Z) - Surprisal Driven $k$-NN for Robust and Interpretable Nonparametric
Learning [1.4293924404819704]
我々は情報理論の観点から、隣り合う従来のアルゴリズムに新たな光を当てた。
単一モデルを用いた分類,回帰,密度推定,異常検出などのタスクに対する頑健で解釈可能なフレームワークを提案する。
我々の研究は、分類と異常検出における最先端の成果を達成することによって、アーキテクチャの汎用性を示す。
論文 参考訳(メタデータ) (2023-11-17T00:35:38Z) - Training Ensembles with Inliers and Outliers for Semi-supervised Active
Learning [16.204251285425478]
本研究では,3つの高相乗的成分を利用する手法を提案する。
インレーヤとアウトレーヤとのジョイントトレーニング、擬似ラベルによる半教師付き学習、モデルアンサンブルが使用される。
注目すべきは、その単純さにもかかわらず、提案手法はパフォーマンスという点で他の方法よりも優れています。
論文 参考訳(メタデータ) (2023-07-07T17:50:07Z) - Generalization Properties of Retrieval-based Models [50.35325326050263]
検索ベースの機械学習手法は、幅広い問題で成功をおさめた。
これらのモデルの約束を示す文献が増えているにもかかわらず、そのようなモデルの理論的基盤はいまだに解明されていない。
本稿では,その一般化能力を特徴付けるために,検索ベースモデルの形式的処理を行う。
論文 参考訳(メタデータ) (2022-10-06T00:33:01Z) - CMW-Net: Learning a Class-Aware Sample Weighting Mapping for Robust Deep
Learning [55.733193075728096]
現代のディープニューラルネットワークは、破損したラベルやクラス不均衡を含むバイアス付きトレーニングデータに容易に適合する。
サンプル再重み付け手法は、このデータバイアス問題を緩和するために一般的に使用されている。
本稿では,データから直接明示的な重み付け方式を適応的に学習できるメタモデルを提案する。
論文 参考訳(メタデータ) (2022-02-11T13:49:51Z) - You Only Need End-to-End Training for Long-Tailed Recognition [8.789819609485225]
クロスエントロピー損失は、不均衡なデータに非常に相関した特徴をもたらす傾向にある。
ブロックベース相対平衡バッチサンプリング(B3RS)とバッチ埋め込みトレーニング(BET)の2つの新しいモジュールを提案する。
CIFAR-LT と ImageNet-LT の長期分類ベンチマークによる実験結果から,本手法の有効性が示された。
論文 参考訳(メタデータ) (2021-12-11T11:44:09Z) - Contrastive Learning for Fair Representations [50.95604482330149]
訓練された分類モデルは、意図せずバイアスのある表現や予測につながる可能性がある。
対戦訓練のような既存の分類モデルのデバイアス化手法は、訓練に高価であり、最適化が困難であることが多い。
比較学習を取り入れたバイアス軽減手法を提案し、同じクラスラベルを共有するインスタンスに類似した表現を推奨する。
論文 参考訳(メタデータ) (2021-09-22T10:47:51Z) - Combining Feature and Instance Attribution to Detect Artifacts [62.63504976810927]
トレーニングデータアーティファクトの識別を容易にする手法を提案する。
提案手法は,トレーニングデータのアーティファクトの発見に有効であることを示す。
我々は,これらの手法が実際にNLP研究者にとって有用かどうかを評価するために,小規模なユーザスタディを実施している。
論文 参考訳(メタデータ) (2021-07-01T09:26:13Z) - Adaptive Prototypical Networks with Label Words and Joint Representation
Learning for Few-Shot Relation Classification [17.237331828747006]
本研究は,少ショット関係分類(FSRC)に焦点を当てる。
クラスプロトタイプの表現にラベル単語を追加するための適応的混合機構を提案する。
FewRelでは、異なる数ショット(FS)設定で実験が行われた。
論文 参考訳(メタデータ) (2021-01-10T11:25:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。