論文の概要: Active Learning and Multi-label Classification for Ellipsis and
Coreference Detection in Conversational Question-Answering
- arxiv url: http://arxiv.org/abs/2207.03145v1
- Date: Thu, 7 Jul 2022 08:14:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-08 13:27:39.205294
- Title: Active Learning and Multi-label Classification for Ellipsis and
Coreference Detection in Conversational Question-Answering
- Title(参考訳): 対話型質問応答における楕円・座標検出のためのアクティブラーニングと多ラベル分類
- Authors: Quentin Brabant, Lina Maria Rojas-Barahona and Claire Gardent
- Abstract要約: エリプシスとコアは、一般的に発生する言語現象である。
DistilBERTに基づくマルチラベル分類器を提案する。
これらの手法は,手動ラベル付きデータセット上で,これらの現象を検出するための分類器の性能を大幅に向上させることを示す。
- 参考スコア(独自算出の注目度): 5.984693203400407
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In human conversations, ellipsis and coreference are commonly occurring
linguistic phenomena. Although these phenomena are a mean of making
human-machine conversations more fluent and natural, only few dialogue corpora
contain explicit indications on which turns contain ellipses and/or
coreferences. In this paper we address the task of automatically detecting
ellipsis and coreferences in conversational question answering. We propose to
use a multi-label classifier based on DistilBERT. Multi-label classification
and active learning are employed to compensate the limited amount of labeled
data. We show that these methods greatly enhance the performance of the
classifier for detecting these phenomena on a manually labeled dataset.
- Abstract(参考訳): 人間の会話では、エリプシスとコリファレンスは一般的に言語現象である。
これらの現象は、人間と機械の会話をより流動的で自然なものにする手段であるが、楕円や中核を含む明示的な表現を含む対話コーパスはごくわずかである。
本稿では,対話型質問応答におけるエリプシスとコア参照を自動的に検出するタスクに対処する。
ディチルバートに基づくマルチラベル分類器の使用を提案する。
ラベルデータの制限量を補償するために、マルチラベル分類とアクティブラーニングが用いられる。
これらの手法は,手動ラベル付きデータセット上でこれらの現象を検出するための分類器の性能を大幅に向上させる。
関連論文リスト
- From Open-Vocabulary to Vocabulary-Free Semantic Segmentation [78.62232202171919]
オープン語彙セマンティックセグメンテーションにより、モデルはトレーニングデータ以外の新しいオブジェクトカテゴリを識別できる。
現在のアプローチは依然として入力として手動で指定されたクラス名に依存しており、現実世界のアプリケーションに固有のボトルネックを生み出している。
この研究は、定義済みのクラス語彙を必要としない、語彙自由セマンティックパイプラインを提案する。
論文 参考訳(メタデータ) (2025-02-17T15:17:08Z) - Description-Enhanced Label Embedding Contrastive Learning for Text
Classification [65.01077813330559]
モデル学習プロセスにおける自己監督型学習(SSL)と新しい自己監督型関係関係(R2)分類タスクの設計
テキスト分類とR2分類を最適化対象として扱うテキスト分類のための関係学習ネットワーク(R2-Net)の関係について検討する。
ラベルセマンティックラーニングのためのマルチアスペクト記述を得るためのWordNetからの外部知識。
論文 参考訳(メタデータ) (2023-06-15T02:19:34Z) - Extending an Event-type Ontology: Adding Verbs and Classes Using
Fine-tuned LLMs Suggestions [0.0]
語彙拡張タスクに先進的な機械学習手法を用いて事前アノテートしたデータについて検討した。
自動スコアと人間のアノテーションの相関について検討した。
相関性は強いが, アノテーションの固有性に対する影響は, ほぼ線形性から緩やかである。
論文 参考訳(メタデータ) (2023-06-03T14:57:47Z) - ActiveLab: Active Learning with Re-Labeling by Multiple Annotators [19.84626033109009]
ActiveLabは、バッチアクティブラーニングで次にラベルを付ける方法である。
完全に新しいものをラベル付けするよりも、サンプルを再ラベルする方が有益かどうかを自動的に見積もる。
さまざまなアクティブな学習方法よりもはるかに少ないアノテーションで、より正確な分類器を確実に訓練する。
論文 参考訳(メタデータ) (2023-01-27T17:00:11Z) - IDEA: Interactive DoublE Attentions from Label Embedding for Text
Classification [4.342189319523322]
そこで,本研究では,シム BERT による新しいモデル構造と IDEA という対話型ダブルアテンションを提案し,テキストとラベル名の情報交換を行う。
提案手法は, ラベルテキストを用いた最先端の手法よりも, より安定した結果が得られている。
論文 参考訳(メタデータ) (2022-09-23T04:50:47Z) - Speaker Embedding-aware Neural Diarization for Flexible Number of
Speakers with Textual Information [55.75018546938499]
本稿では,話者埋め込み認識型ニューラルダイアリゼーション(SEND)手法を提案する。
本手法は,ターゲット話者の音声活動検出よりも低いダイアリゼーション誤差率を実現する。
論文 参考訳(メタデータ) (2021-11-28T12:51:04Z) - R$^2$-Net: Relation of Relation Learning Network for Sentence Semantic
Matching [58.72111690643359]
文意味マッチングのための関係学習ネットワーク(R2-Net)を提案する。
最初にBERTを使用して、グローバルな視点から入力文をエンコードします。
次に、cnnベースのエンコーダは、ローカルな視点からキーワードやフレーズ情報をキャプチャするように設計されている。
関係情報抽出にラベルを十分に活用するために,関係分類タスクの自己教師付き関係性を導入する。
論文 参考訳(メタデータ) (2020-12-16T13:11:30Z) - Automatically Identifying Words That Can Serve as Labels for Few-Shot
Text Classification [12.418532541734193]
最近のテキスト分類のアプローチでは、テキスト入力をある種のタスク記述を含むクローズ質問に変換し、事前訓練された言語モデルで処理し、予測された単語をラベルにマッピングする。
この問題を軽減するために、少量のトレーニングデータからそのようなマッピングを自動的に見つけるアプローチを考案する。
多くのタスクにおいて、我々の手法で発見されたマッピングは、手作りのラベルと単語のマッピングとほぼ同等に機能する。
論文 参考訳(メタデータ) (2020-10-26T14:56:22Z) - Dynamic Semantic Matching and Aggregation Network for Few-shot Intent
Detection [69.2370349274216]
利用可能な注釈付き発話が不足しているため、インテント検出は困難である。
セマンティック成分はマルチヘッド自己認識によって発話から蒸留される。
本手法はラベル付きインスタンスとラベルなしインスタンスの両方の表現を強化するための総合的なマッチング手段を提供する。
論文 参考訳(メタデータ) (2020-10-06T05:16:38Z) - Interaction Matching for Long-Tail Multi-Label Classification [57.262792333593644]
既存のマルチラベル分類モデルにおいて,制約に対処するためのエレガントで効果的なアプローチを提案する。
ソフトなn-gram相互作用マッチングを実行することで、ラベルと自然言語記述をマッチングする。
論文 参考訳(メタデータ) (2020-05-18T15:27:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。