論文の概要: A Benchmark for Cross-Domain Argumentative Stance Classification on Social Media
- arxiv url: http://arxiv.org/abs/2410.08900v1
- Date: Fri, 11 Oct 2024 15:20:11 GMT
- ステータス: 処理完了
- システム内更新日: 2024-10-30 21:16:19.408265
- Title: A Benchmark for Cross-Domain Argumentative Stance Classification on Social Media
- Title(参考訳): ソーシャルメディアにおけるクロスドメイン調停スタンス分類のベンチマーク
- Authors: Jiaqing Yuan, Ruijie Xi, Munindar P. Singh,
- Abstract要約: 論証的姿勢分類は、特定のトピックに対する著者の視点を特定する上で重要な役割を担っている。
既存のベンチマークは、単一のドメインからのものや、限られたトピックにフォーカスすることが多い。
我々は,人的アノテーションの必要性を回避するために,プラットフォームルール,手軽に利用可能な専門家によるコンテンツ,および大規模言語モデルを活用することを提案する。
- 参考スコア(独自算出の注目度): 12.479554210753664
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Argumentative stance classification plays a key role in identifying authors' viewpoints on specific topics. However, generating diverse pairs of argumentative sentences across various domains is challenging. Existing benchmarks often come from a single domain or focus on a limited set of topics. Additionally, manual annotation for accurate labeling is time-consuming and labor-intensive. To address these challenges, we propose leveraging platform rules, readily available expert-curated content, and large language models to bypass the need for human annotation. Our approach produces a multidomain benchmark comprising 4,498 topical claims and 30,961 arguments from three sources, spanning 21 domains. We benchmark the dataset in fully supervised, zero-shot, and few-shot settings, shedding light on the strengths and limitations of different methodologies. We release the dataset and code in this study at hidden for anonymity.
- Abstract(参考訳): 論証的姿勢分類は、特定のトピックに対する著者の視点を特定する上で重要な役割を担っている。
しかし、諸藩にまたがって多種多様な議論文を生成することは困難である。
既存のベンチマークは、単一のドメインからのものや、限られたトピックにフォーカスすることが多い。
さらに、正確なラベリングのための手動アノテーションは、時間と労力がかかる。
これらの課題に対処するため、我々は、人間のアノテーションの必要性を回避するために、プラットフォームルール、手軽に利用可能な専門家によるコンテンツ、および大きな言語モデルを活用することを提案する。
提案手法は,4,498件のトピック的クレームと3つのソースからの30,961件の引数からなるマルチドメインベンチマークを生成する。
完全な教師付き、ゼロショット、数ショットの設定でデータセットをベンチマークし、異なる方法論の長所と短所に光を当てます。
私たちは匿名のためにこの研究でデータセットとコードを公開しています。
関連論文リスト
- Can Humans Identify Domains? [17.579694463517363]
テキストドメインは、下流モデルのパフォーマンスに影響を及ぼすため、自然言語処理(NLP)コミュニティにおいて重要な特性である。
本研究は,本質的なテクスト特性の同定において,人間の習熟度によるドメインの中核的概念について考察する。
NLPにおけるドメインの多様さにもかかわらず、それらの定義方法に関する人間のコンセンサスはほとんどない。
論文 参考訳(メタデータ) (2024-04-02T09:49:07Z) - Structured Latent Embeddings for Recognizing Unseen Classes in Unseen
Domains [108.11746235308046]
本稿では,異なる領域からの画像を投影することで,ドメインに依存しない遅延埋め込みを学習する手法を提案する。
挑戦的なDomainNetとDomainNet-LSベンチマークの実験は、既存のメソッドよりもアプローチの方が優れていることを示している。
論文 参考訳(メタデータ) (2021-07-12T17:57:46Z) - Author Clustering and Topic Estimation for Short Texts [69.54017251622211]
同じ文書中の単語間の強い依存をモデル化することにより、遅延ディリクレ割当を拡張できる新しいモデルを提案する。
同時にユーザをクラスタ化し、ホック後のクラスタ推定の必要性を排除しています。
我々の手法は、短文で生じる問題に対する従来のアプローチよりも、-または----------- で機能する。
論文 参考訳(メタデータ) (2021-06-15T20:55:55Z) - Cross-Domain Label-Adaptive Stance Detection [32.800766653254634]
距離検出は、ターゲットに対する作家の視点の分類に関するものである。
本稿では,16のスタンス検出データセットの詳細な分析を行う。
ユーザ定義ラベルの領域外予測のためのエンドツーエンドの非監視フレームワークを提案する。
論文 参考訳(メタデータ) (2021-04-15T14:04:29Z) - Learning to Select Context in a Hierarchical and Global Perspective for
Open-domain Dialogue Generation [15.01710843286394]
階層的自己保持機構と遠隔監視を備えた新しいモデルを提案し、関連する単語と発話を短距離および長距離で検出する。
私たちのモデルは、流速、コヒーレンス、および情報性の観点から他のベースラインを大幅に上回ります。
論文 参考訳(メタデータ) (2021-02-18T11:56:42Z) - WikiAsp: A Dataset for Multi-domain Aspect-based Summarization [69.13865812754058]
マルチドメインアスペクトベースの要約のための大規模データセットであるWikiAspを提案する。
具体的には、アスペクトアノテーションのプロキシとして、各記事のセクションタイトルとバウンダリを使用して、20の異なるドメインからウィキペディア記事を使用してデータセットを構築します。
その結果,既存の要約モデルがこの設定で直面する重要な課題,例えば引用されたソースの適切な代名詞処理,時間に敏感なイベントの一貫した説明などが浮き彫りになった。
論文 参考訳(メタデータ) (2020-11-16T10:02:52Z) - A Review of Single-Source Deep Unsupervised Visual Domain Adaptation [81.07994783143533]
大規模ラベル付きトレーニングデータセットにより、ディープニューラルネットワークは、幅広いベンチマークビジョンタスクを拡張できるようになった。
多くのアプリケーションにおいて、大量のラベル付きデータを取得するのは非常に高価で時間を要する。
限られたラベル付きトレーニングデータに対処するため、大規模ラベル付きソースドメインでトレーニングされたモデルを、疎ラベルまたは未ラベルのターゲットドメインに直接適用しようと試みている人も多い。
論文 参考訳(メタデータ) (2020-09-01T00:06:50Z) - Text Recognition in Real Scenarios with a Few Labeled Samples [55.07859517380136]
Scene Text Recognition (STR) はコンピュータビジョン分野におけるホットな研究テーマである。
本稿では,数ショットの逆数列領域適応 (FASDA) を用いて構築シーケンスを適応する手法を提案する。
我々のアプローチは、ソースドメインとターゲットドメインの間の文字レベルの混乱を最大化することができる。
論文 参考訳(メタデータ) (2020-06-22T13:03:01Z) - Unsupervised Domain Clusters in Pretrained Language Models [61.832234606157286]
大規模事前学習型言語モデルでは,教師なしのドメインによってクラスタ化される文表現を暗黙的に学習する。
このようなモデルに基づくドメインデータ選択手法を提案する。
我々は5つの異なる領域にわたるニューラルネットワーク翻訳のためのデータ選択手法を評価する。
論文 参考訳(メタデータ) (2020-04-05T06:22:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。