論文の概要: Topic-Guided Sampling For Data-Efficient Multi-Domain Stance Detection
- arxiv url: http://arxiv.org/abs/2306.00765v1
- Date: Thu, 1 Jun 2023 15:00:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-02 15:27:17.533021
- Title: Topic-Guided Sampling For Data-Efficient Multi-Domain Stance Detection
- Title(参考訳): データ効率の良いマルチドメインスタンス検出のためのトピックガイドサンプリング
- Authors: Erik Arakelyan, Arnav Arora, Isabelle Augenstein
- Abstract要約: スタンス検出は、著者が関心の対象に対して表現する姿勢を特定することに関わる。
このタスクは、ソーシャルメディアの意見の特定から法的主張の立場の検出まで、さまざまな領域にまたがる。
本稿では、トピック誘導型多様性サンプリング手法と、スタンスを微調整するために使用される対照的な目的について述べる。
- 参考スコア(独自算出の注目度): 44.06173809190896
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Stance Detection is concerned with identifying the attitudes expressed by an
author towards a target of interest. This task spans a variety of domains
ranging from social media opinion identification to detecting the stance for a
legal claim. However, the framing of the task varies within these domains, in
terms of the data collection protocol, the label dictionary and the number of
available annotations. Furthermore, these stance annotations are significantly
imbalanced on a per-topic and inter-topic basis. These make multi-domain stance
detection a challenging task, requiring standardization and domain adaptation.
To overcome this challenge, we propose $\textbf{T}$opic $\textbf{E}$fficient
$\textbf{St}$anc$\textbf{E}$ $\textbf{D}$etection (TESTED), consisting of a
topic-guided diversity sampling technique and a contrastive objective that is
used for fine-tuning a stance classifier. We evaluate the method on an existing
benchmark of $16$ datasets with in-domain, i.e. all topics seen and
out-of-domain, i.e. unseen topics, experiments. The results show that our
method outperforms the state-of-the-art with an average of $3.5$ F1 points
increase in-domain, and is more generalizable with an averaged increase of
$10.2$ F1 on out-of-domain evaluation while using $\leq10\%$ of the training
data. We show that our sampling technique mitigates both inter- and per-topic
class imbalances. Finally, our analysis demonstrates that the contrastive
learning objective allows the model a more pronounced segmentation of samples
with varying labels.
- Abstract(参考訳): スタンス検出は、著者が関心の対象に対して表現する姿勢を特定することに関わる。
このタスクは、ソーシャルメディアの意見の特定から、法的クレームに対するスタンスの検出まで、さまざまなドメインにまたがる。
しかし、タスクのフレーミングは、データ収集プロトコル、ラベル辞書、利用可能なアノテーションの数という観点で、これらのドメイン内で異なる。
さらに、これらのスタンスアノテーションは、トピック毎およびトピック間ベースで著しく不均衡である。
これにより、標準化とドメイン適応を必要とするマルチドメインのスタンス検出が困難なタスクとなる。
この課題を克服するために、トピック誘導の多様性サンプリング技術と、スタンス分類器の微調整に使用される対照的な目的からなる、$\textbf{T}$opic $\textbf{E}$fficient $\textbf{St}$anc$\textbf{E}$$ $\textbf{D}$etection (TESTED)を提案する。
既存のベンチマークである16ドルのデータセットをドメイン内,すなわちドメイン外およびドメイン外にあるすべてのトピック,すなわち見当たらないトピック,実験を用いて評価する。
その結果,本手法は平均3.5ドルF1ポイントのドメイン増加と,トレーニングデータの$\leq10\%のトレーニングデータを用いて,ドメイン外評価における平均10.2ドルF1の増加により,より一般化可能であることがわかった。
本手法は,トピック間およびトピック毎のクラス不均衡を緩和することを示す。
最後に, 比較学習の目的が, ラベルの異なるサンプルのより顕著なセグメンテーションを可能にすることを示す。
関連論文リスト
- High-order Neighborhoods Know More: HyperGraph Learning Meets Source-free Unsupervised Domain Adaptation [34.08681468394247]
Source-free Unsupervised Domain Adaptationは、未学習のソースモデルと未学習のターゲットモデルにのみアクセスすることで、ターゲットサンプルを分類することを目的としている。
既存の手法は、通常、対象サンプル間のペアワイズ関係を利用して、これらのサンプルを意味的特徴に基づいてクラスタリングすることで、それらの相関関係を見つけようとする。
本研究では、高次近傍関係を利用して、ドメインシフト効果を明示的に考慮した新しいSFDA法を提案する。
論文 参考訳(メタデータ) (2024-05-11T05:07:43Z) - USB: A Unified Summarization Benchmark Across Tasks and Domains [68.82726887802856]
ウィキペディア由来のベンチマークを導入し、クラウドソースアノテーションの豊富なセットを補完し、8ドルの相互関連タスクをサポートする。
このベンチマークで様々な手法を比較し、複数のタスクにおいて、中程度の大きさの微調整されたモデルが、より大きな数発の言語モデルよりも一貫して優れていることを発見した。
論文 参考訳(メタデータ) (2023-05-23T17:39:54Z) - Cyclically Disentangled Feature Translation for Face Anti-spoofing [61.70377630461084]
循環不整合特徴変換ネットワーク(CDFTN)と呼ばれる新しい領域適応手法を提案する。
CDFTNは、(1)ソースドメイン不変の生長特徴と2)ドメイン固有のコンテンツ特徴とを持つ擬似ラベル付きサンプルを生成する。
ソースドメインラベルの監督の下で、合成擬似ラベル付き画像に基づいてロバスト分類器を訓練する。
論文 参考訳(メタデータ) (2022-12-07T14:12:34Z) - Low-confidence Samples Matter for Domain Adaptation [47.552605279925736]
ドメイン適応(DA)は、知識をラベルの豊富なソースドメインから関連するがラベルの少ないターゲットドメインに転送することを目的としている。
低信頼度サンプルの処理による新しいコントラスト学習法を提案する。
提案手法を教師なしと半教師付きの両方のDA設定で評価する。
論文 参考訳(メタデータ) (2022-02-06T15:45:45Z) - A Simple Information-Based Approach to Unsupervised Domain-Adaptive
Aspect-Based Sentiment Analysis [58.124424775536326]
本稿では,相互情報に基づくシンプルだが効果的な手法を提案し,それらの用語を抽出する。
実験の結果,提案手法はクロスドメインABSAの最先端手法よりも4.32%高い性能を示した。
論文 参考訳(メタデータ) (2022-01-29T10:18:07Z) - Frequency Spectrum Augmentation Consistency for Domain Adaptive Object
Detection [107.52026281057343]
周波数スペクトル拡張整合(FSAC)フレームワークを4種類の低周波フィルタで構成する。
最初の段階では、オリジナルおよび拡張されたソースデータを全て利用して、オブジェクト検出器を訓練する。
第2段階では、予測一貫性のための自己学習を行うために、擬似ラベル付き拡張現実とターゲットデータを採用する。
論文 参考訳(メタデータ) (2021-12-16T04:07:01Z) - AFAN: Augmented Feature Alignment Network for Cross-Domain Object
Detection [90.18752912204778]
オブジェクト検出のための教師なしドメイン適応は、多くの現実世界のアプリケーションにおいて難しい問題である。
本稿では、中間領域画像生成とドメイン・アドバイザリー・トレーニングを統合した新しい機能アライメント・ネットワーク(AFAN)を提案する。
提案手法は、類似および異種ドメイン適応の双方において、標準ベンチマークにおける最先端の手法よりも大幅に優れている。
論文 参考訳(メタデータ) (2021-06-10T05:01:20Z) - Cross-Domain Label-Adaptive Stance Detection [32.800766653254634]
距離検出は、ターゲットに対する作家の視点の分類に関するものである。
本稿では,16のスタンス検出データセットの詳細な分析を行う。
ユーザ定義ラベルの領域外予測のためのエンドツーエンドの非監視フレームワークを提案する。
論文 参考訳(メタデータ) (2021-04-15T14:04:29Z) - Inductive Unsupervised Domain Adaptation for Few-Shot Classification via
Clustering [16.39667909141402]
ショットの分類は、多様なドメインに適応する必要がある場合、苦労する傾向があります。
本稿では、ClusteringによるFew-shot分類のためのドメイン適応性能を改善するためのフレームワークDaFeCを紹介する。
提案手法は, 絶対利得(分類精度)が4.95%, 9.55%, 3.99%, 11.62%であった。
論文 参考訳(メタデータ) (2020-06-23T08:17:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。