論文の概要: Investigating Reasons for Disagreement in Natural Language Inference
- arxiv url: http://arxiv.org/abs/2209.03392v1
- Date: Wed, 7 Sep 2022 18:01:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-09 12:55:28.571720
- Title: Investigating Reasons for Disagreement in Natural Language Inference
- Title(参考訳): 自然言語推論における不一致の理由の検討
- Authors: Nan-Jiang Jiang and Marie-Catherine de Marneffe
- Abstract要約: 3つのハイレベルクラスにまたがる相違点の分類法を開発した。
いくつかの相違は文の意味の不確実性によるものであり、アノテータバイアスやタスクアーティファクトによるものである。
潜在的な不一致のある項目を検出するための2つのモデリング手法について検討する。
- 参考スコア(独自算出の注目度): 9.002603216969154
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We investigate how disagreement in natural language inference (NLI)
annotation arises. We developed a taxonomy of disagreement sources with 10
categories spanning 3 high-level classes. We found that some disagreements are
due to uncertainty in the sentence meaning, others to annotator biases and task
artifacts, leading to different interpretations of the label distribution. We
explore two modeling approaches for detecting items with potential
disagreement: a 4-way classification with a "Complicated" label in addition to
the three standard NLI labels, and a multilabel classification approach. We
found that the multilabel classification is more expressive and gives better
recall of the possible interpretations in the data.
- Abstract(参考訳): 自然言語推論(NLI)アノテーションの相違について検討する。
3つのハイレベルクラスにまたがる10のカテゴリからなる不一致源の分類法を開発した。
その結果,文の意味の不確実性が不一致であることや,記号のバイアスやタスクのアーティファクトが不一致であることから,ラベル分布の解釈が異なることが明らかとなった。
我々は,3つの標準NLIラベルに加えて,「複雑な」ラベルを持つ4方向分類法と,複数ラベル分類法という,潜在的な相違のある項目を検出するための2つのモデリング手法について検討する。
その結果,マルチラベル分類はより表現力が高く,データの解釈をよりよく再現できることがわかった。
関連論文リスト
- Online Multi-Label Classification under Noisy and Changing Label Distribution [9.17381554071824]
本稿では,Nuisy and Changing Label Distribution (NCLD) に基づくオンラインマルチラベル分類アルゴリズムを提案する。
NCLDへの頑健さは3つの新作の恩恵を受けるため,ラベルスコアとラベルランキングを高い精度で同時にモデル化することを目的としている。
論文 参考訳(メタデータ) (2024-10-03T11:16:43Z) - Leveraging Annotator Disagreement for Text Classification [3.6625157427847963]
テキスト分類では、データセットが複数のアノテータによってアノテートされた場合でも、モデルトレーニングに1つのマジョリティラベルのみを使用するのが一般的である。
本稿では,アノテータの不一致を利用してテキスト分類を行う3つの手法を提案する。
論文 参考訳(メタデータ) (2024-09-26T06:46:53Z) - RankCSE: Unsupervised Sentence Representations Learning via Learning to
Rank [54.854714257687334]
本稿では,教師なし文表現学習のための新しい手法であるRangCSEを提案する。
コントラスト学習を伴うランキング一貫性とランキング蒸留を統一された枠組みに組み込む。
セマンティックテキスト類似性(STS)と転送タスク(TR)の両方について、広範な実験が実施されている。
論文 参考訳(メタデータ) (2023-05-26T08:27:07Z) - Towards Unsupervised Recognition of Token-level Semantic Differences in
Related Documents [61.63208012250885]
意味的差異をトークンレベルの回帰タスクとして認識する。
マスク付き言語モデルに依存する3つの教師なしアプローチについて検討する。
その結果,単語アライメントと文レベルのコントラスト学習に基づくアプローチは,ゴールドラベルと強い相関関係があることが示唆された。
論文 参考訳(メタデータ) (2023-05-22T17:58:04Z) - Bridging the Gap between Model Explanations in Partially Annotated
Multi-label Classification [85.76130799062379]
偽陰性ラベルがモデルの説明にどのように影響するかを考察する。
本稿では,部分ラベルで学習したモデルの属性スコアを向上し,その説明をフルラベルで学習したモデルと類似させる。
論文 参考訳(メタデータ) (2023-04-04T14:00:59Z) - Label-enhanced Prototypical Network with Contrastive Learning for
Multi-label Few-shot Aspect Category Detection [17.228616743739412]
マルチラベルアスペクトカテゴリ検出は、与えられたレビュー文に複数のアスペクトカテゴリを含むことを可能にする。
複数ラベルの複数ショットのアスペクトカテゴリー検出のための新しいラベル強化ネットワーク(LPN)を提案する。
論文 参考訳(メタデータ) (2022-06-14T02:37:44Z) - Resolving label uncertainty with implicit posterior models [71.62113762278963]
本稿では,データサンプルのコレクション間でラベルを共同で推論する手法を提案する。
異なる予測子を後部とする生成モデルの存在を暗黙的に仮定することにより、弱い信念の下での学習を可能にする訓練目標を導出する。
論文 参考訳(メタデータ) (2022-02-28T18:09:44Z) - Exemplar Guided Active Learning [13.084183663366824]
我々は、限られた予算を用いて、大規模な未ラベルデータセットの小さなサブセットをラベル付けする問題を賢明に検討する。
いずれにせよ、知識ベースから候補ラベルのセットがあるが、ラベルセットは必ずしもデータに何が起こるかを表すものではない。
本稿では,現代言語モデルが提供する文脈埋め込み空間を活用することで,希少なクラスを明示的に検索する能動的学習手法について述べる。
論文 参考訳(メタデータ) (2020-11-02T20:01:39Z) - Exploiting Context for Robustness to Label Noise in Active Learning [47.341705184013804]
本稿では,どのラベルが間違っているのかをシステムがどのように識別するか,ラベルノイズの負の影響を最小限に抑えるために,マルチクラスアクティブラーニングシステムをどのように適用できるか,といった課題に対処する。
我々は、これらの関係を符号化し、ノイズラベルが利用できる場合にグラフ上の新しい信念を得るために、ラベルなしデータのグラフィカルな表現を構築した。
これはシーン分類、アクティビティ分類、文書分類の3つの異なる応用で実証されている。
論文 参考訳(メタデータ) (2020-10-18T18:59:44Z) - Dynamic Semantic Matching and Aggregation Network for Few-shot Intent
Detection [69.2370349274216]
利用可能な注釈付き発話が不足しているため、インテント検出は困難である。
セマンティック成分はマルチヘッド自己認識によって発話から蒸留される。
本手法はラベル付きインスタンスとラベルなしインスタンスの両方の表現を強化するための総合的なマッチング手段を提供する。
論文 参考訳(メタデータ) (2020-10-06T05:16:38Z) - Interaction Matching for Long-Tail Multi-Label Classification [57.262792333593644]
既存のマルチラベル分類モデルにおいて,制約に対処するためのエレガントで効果的なアプローチを提案する。
ソフトなn-gram相互作用マッチングを実行することで、ラベルと自然言語記述をマッチングする。
論文 参考訳(メタデータ) (2020-05-18T15:27:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。