論文の概要: The Touch\'e23-ValueEval Dataset for Identifying Human Values behind
Arguments
- arxiv url: http://arxiv.org/abs/2301.13771v1
- Date: Tue, 31 Jan 2023 17:15:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-01 15:44:01.025617
- Title: The Touch\'e23-ValueEval Dataset for Identifying Human Values behind
Arguments
- Title(参考訳): touch\'e23-valueevalデータセットによる引数の背後にある値の識別
- Authors: Nailia Mirzakhmedova, Johannes Kiesel, Milad Alshomary, Maximilian
Heinrich, Nicolas Handke, Xiaoni Cai, Barriere Valentin, Doratossadat
Dastgheib, Omid Ghahroodi, Mohammad Ali Sadraei, Ehsaneddin Asgari, Lea
Kawaletz, Henning Wachsmuth, Benno Stein
- Abstract要約: Touch'e23-ValueEvalデータセットは、Webis-ArgValues-22を拡張する。
我々は、宗教的なテキスト、政治的議論、自由文論、新聞社説、オンライン民主主義プラットフォームを網羅した6つの資料から9324の議論を収集した。
それぞれの議論は3人のクラウドワーカーによって54の値で注釈付けされた。
- 参考スコア(独自算出の注目度): 21.330255206521016
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present the Touch\'e23-ValueEval Dataset for Identifying Human Values
behind Arguments. To investigate approaches for the automated detection of
human values behind arguments, we collected 9324 arguments from 6 diverse
sources, covering religious texts, political discussions, free-text arguments,
newspaper editorials, and online democracy platforms. Each argument was
annotated by 3 crowdworkers for 54 values. The Touch\'e23-ValueEval dataset
extends the Webis-ArgValues-22. In comparison to the previous dataset, the
effectiveness of a 1-Baseline decreases, but that of an out-of-the-box BERT
model increases. Therefore, though the classification difficulty increased as
per the label distribution, the larger dataset allows for training better
models.
- Abstract(参考訳): 本稿では,Arguments の背後にある人的価値を識別するための Touch\'e23-ValueEval データセットを提案する。
議論の背後にある人的価値の自動検出手法を検討するため,宗教文献,政治議論,フリーテキスト議論,新聞編集,オンライン民主主義プラットフォームなど,6つの資料から9324の議論を収集した。
各引数は54の値で3人のクラウドワーカーによって注釈付けされた。
Touch\'e23-ValueEvalデータセットは、Webis-ArgValues-22を拡張する。
以前のデータセットと比較して、1-Baselineの有効性は低下するが、アウトオブボックスBERTモデルの有効性は増大する。
したがって、ラベル分布に従って分類が困難になるが、より大きなデータセットはより良いモデルのトレーニングを可能にする。
関連論文リスト
- Argue with Me Tersely: Towards Sentence-Level Counter-Argument
Generation [62.069374456021016]
本稿では,文レベル逆問題生成のためのArgTerselyベンチマークを提案する。
また,Arg-LlaMAによる高品質な逆問題生成手法を提案する。
論文 参考訳(メタデータ) (2023-12-21T06:51:34Z) - Learning From Free-Text Human Feedback -- Collect New Datasets Or Extend
Existing Ones? [57.16050211534735]
一般的な対話データセットにおける自由文フィードバックのタイプと頻度について検討する。
この結果から, エラータイプ, ユーザ応答タイプ, それらの関係性など, 調査したデータセットの構成に関する新たな知見が得られた。
論文 参考訳(メタデータ) (2023-10-24T12:01:11Z) - Improving Classifier Robustness through Active Generation of Pairwise
Counterfactuals [22.916599410472102]
本稿では,カウンターファクト・ジェネレーティブ・モデルを用いて多種多様なカウンターファクト・モデルを生成する新しいフレームワークを提案する。
少量の人間注釈付き対実データ(10%)で、学習ラベルを用いた対実データ拡張データセットを生成することができることを示す。
論文 参考訳(メタデータ) (2023-05-22T23:19:01Z) - Multitask Instruction-based Prompting for Fallacy Recognition [35.10919984256853]
ドメインやジャンルにまたがる28のユニークな誤認識をマルチタスクで認識する能力を示す。
また, モデルサイズと選択の促進効果について, クラスごとの結果(すなわち, 誤り型)を分析して検討した。
論文 参考訳(メタデータ) (2023-01-24T13:39:23Z) - Automatic Summarization of Russian Texts: Comparison of Extractive and
Abstractive Methods [0.0]
ロシア語の議論文生成の鍵となる問題は、注釈付き議論コーパスの欠如である。
本稿では,Argumentative Microtext, Persuasive Essays および UKP Sentential corpora の翻訳版を詳細な RuBERT モデルに適用する。
その結果,従来の ruGPT-3 モデルと比較して,引数生成の精度は 20 ポイント以上向上した。
論文 参考訳(メタデータ) (2022-06-18T17:28:04Z) - Diversity Over Size: On the Effect of Sample and Topic Sizes for Topic-Dependent Argument Mining Datasets [49.65208986436848]
本研究では,アーギュメント・マイニング・データセットの構成が,少数・ゼロショット設定における影響について検討する。
実験結果から, モデル性能の達成には微調整が必須であるが, 慎重に構成したトレーニングサンプルを用いることで, トレーニングサンプルサイズを最大90%まで下げることで, 最大性能の95%を達成できることがわかった。
論文 参考訳(メタデータ) (2022-05-23T17:14:32Z) - ValueNet: A New Dataset for Human Value Driven Dialogue System [103.2044265617704]
本稿では,21,374のテキストシナリオに対する人間の態度を含む,ValueNetという大規模人的価値データセットを提案する。
総合的な経験的結果は、学習された価値モデルが幅広い対話作業に有用であることを示している。
ValueNetは、人間の価値モデリングのための最初の大規模テキストデータセットである。
論文 参考訳(メタデータ) (2021-12-12T23:02:52Z) - Hidden Footprints: Learning Contextual Walkability from 3D Human Trails [70.01257397390361]
現在のデータセットは、人々がどこにいるか、どこにいるかを教えてくれません。
まず、画像間で人の観察を伝播させ、3D情報を利用して、私たちが「隠れ足跡」と呼ぶものを作成することで、有効なラベル付き歩行可能領域の集合を拡大する。
このようなスパースラベルのために設計されたトレーニング戦略を考案し、クラスバランスの分類損失と文脈逆転損失を組み合わせた。
論文 参考訳(メタデータ) (2020-08-19T23:19:08Z) - Aspect-Controlled Neural Argument Generation [65.91772010586605]
我々は、与えられたトピック、スタンス、アスペクトの文レベル引数を生成するために、きめ細かいレベルで制御できる引数生成のための言語モデルを訓練する。
評価の結果,我々の生成モデルは高品質なアスペクト特異的な議論を生成できることがわかった。
これらの議論は、データ拡張による姿勢検出モデルの性能向上と、逆問題の生成に使用できる。
論文 参考訳(メタデータ) (2020-04-30T20:17:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。