Fugu-MT 論文翻訳(概要): WIBA: What Is Being Argued? A Comprehensive Approach to Argument Mining

論文の概要: WIBA: What Is Being Argued? A Comprehensive Approach to Argument Mining

arxiv url: http://arxiv.org/abs/2405.00828v1
Date: Wed, 1 May 2024 19:31:13 GMT
ステータス: 翻訳完了
システム内更新日: 2024-05-03 20:32:52.678349
Title: WIBA: What Is Being Argued? A Comprehensive Approach to Argument Mining
Title（参考訳）: WIBA: 論じられているものは何か? 論証マイニングへの包括的アプローチ
Authors: Arman Irani, Ju Yeon Park, Kevin Esterling, Michalis Faloutsos,
Abstract要約: WIBAは、さまざまなコンテキストにまたがる大規模なコーパスにおいて、何が議論されているのかを包括的に理解することを可能にする。無料オープンアクセスプラットフォーム(wiba.dev)としてWIBAをリリースする。
参考スコア（独自算出の注目度）: 0.7349727826230863
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We propose WIBA, a novel framework and suite of methods that enable the comprehensive understanding of "What Is Being Argued" across contexts. Our approach develops a comprehensive framework that detects: (a) the existence, (b) the topic, and (c) the stance of an argument, correctly accounting for the logical dependence among the three tasks. Our algorithm leverages the fine-tuning and prompt-engineering of Large Language Models. We evaluate our approach and show that it performs well in all the three capabilities. First, we develop and release an Argument Detection model that can classify a piece of text as an argument with an F1 score between 79% and 86% on three different benchmark datasets. Second, we release a language model that can identify the topic being argued in a sentence, be it implicit or explicit, with an average similarity score of 71%, outperforming current naive methods by nearly 40%. Finally, we develop a method for Argument Stance Classification, and evaluate the capability of our approach, showing it achieves a classification F1 score between 71% and 78% across three diverse benchmark datasets. Our evaluation demonstrates that WIBA allows the comprehensive understanding of What Is Being Argued in large corpora across diverse contexts, which is of core interest to many applications in linguistics, communication, and social and computer science. To facilitate accessibility to the advancements outlined in this work, we release WIBA as a free open access platform (wiba.dev).
Abstract（参考訳）: WIBA(WIBA)は,コンテキスト間での“What Is Being Argued”の包括的理解を可能にする,新しいフレームワークとメソッドスイートである。私たちのアプローチでは,検出する包括的なフレームワークを開発しています。 a)存在, b)話題,及び (c) 3つの課題間の論理的依存を正しく考慮した議論の立場提案アルゴリズムは,大規模言語モデルの微調整とプロンプトエンジニアリングを利用する。当社のアプローチを評価し,これら3つの機能すべてで良好に機能していることを示します。まず、3つの異なるベンチマークデータセットにおいて、F1スコアが79%から86%の引数としてテキスト片を分類できるArgument Detectionモデルを開発し、リリースする。第二に、文の中で議論されているトピックを、暗黙的あるいは明示的に識別できる言語モデルをリリースし、平均的な類似度スコアは71%で、現在のナイーブな手法よりも40%近く優れています。最後に,Argument Stance Classification の手法を開発し,提案手法の有効性を評価し,F1 の分類スコアを3つの多様なベンチマークデータセットで 71% から 78% の精度で達成することを示す。我々の評価は、WIBAが、言語学、コミュニケーション、社会科学、コンピュータ科学における多くの応用において中心となる、様々な文脈における大規模なコーパスにおける「今あるもの」の包括的理解を可能にしていることを示す。本研究で概説された進歩へのアクセシビリティーを容易にするため、WIBAを無料オープンアクセスプラットフォーム(wiba.dev)としてリリースする。

関連論文リスト

AraReasoner: Evaluating Reasoning-Based LLMs for Arabic NLP [2.869780207429188]
大規模言語モデル(LLM)は推論能力の顕著な進歩を示している。しかし、アラビアデータにおける彼らのパフォーマンスは、豊富な形態学、多様な方言、複雑な文字によって特徴づけられ、未発見のままである。本稿では,複数の推論に焦点をあてたLLMの総合的なベンチマーク研究について述べる。
論文参考訳（メタデータ） (2025-06-10T13:10:31Z)
SANDWiCH: Semantical Analysis of Neighbours for Disambiguating Words in Context ad Hoc [1.0309408988485051]
我々は、多言語単語センス曖昧化(WSD)のための単純だが効率的なフレームワークを提案する。提案手法は,グループ代数を用いてBabelNetから洗練されたセマンティックネットワーク上でのクラスタ識別解析としてWSDタスクを再構成する。我々は複数のWSDベンチマークにまたがって方法論を検証し、言語やタスクの新たな状態を達成するとともに、音声による個々の評価を行う。
論文参考訳（メタデータ） (2025-03-07T21:52:32Z)
Thought-Path Contrastive Learning via Premise-Oriented Data Augmentation for Logical Reading Comprehension [9.67774998354062]
これまでの研究は主に、Chain-of-Thought(CoT)やデータ拡張による論理的推論能力の向上に重点を置いてきた。本稿では,CoTの論理式を生成するためのPODA(Premise-Oriented Data Augmentation)フレームワークを提案する。また,本論文では,原案と反実例の推論経路を比較検討する新たな思考経路コントラスト学習手法についても紹介する。
論文参考訳（メタデータ） (2024-09-22T15:44:43Z)
Investigating Persuasion Techniques in Arabic: An Empirical Study Leveraging Large Language Models [0.13980986259786224]
本稿では、アラビアのソーシャルメディアコンテンツにおける説得的手法の同定に焦点をあてた総合的な実証的研究について述べる。我々は、プレトレーニング言語モデル(PLM)を利用し、ArAlEvalデータセットを活用する。本研究では,PLMの力を活用した3つの学習手法について検討した。
論文参考訳（メタデータ） (2024-05-21T15:55:09Z)
LINC: A Neurosymbolic Approach for Logical Reasoning by Combining Language Models with First-Order Logic Provers [60.009969929857704]
論理的推論は、科学、数学、社会に潜在的影響を与える可能性のある人工知能にとって重要なタスクである。本研究では、LINCと呼ばれるモジュール型ニューロシンボリックプログラミングのようなタスクを再構成する。我々は,FOLIOとProofWriterのバランスの取れたサブセットに対して,ほぼすべての実験条件下で,3つの異なるモデルに対して顕著な性能向上を観察した。
論文参考訳（メタデータ） (2023-10-23T17:58:40Z)
Disco-Bench: A Discourse-Aware Evaluation Benchmark for Language Modelling [70.23876429382969]
本研究では,多種多様なNLPタスクに対して,文内談話特性を評価できるベンチマークを提案する。ディスコ・ベンチは文学領域における9つの文書レベルのテストセットから構成されており、豊富な談話現象を含んでいる。また,言語分析のために,対象モデルが談話知識を学習するかどうかを検証できる診断テストスイートを設計する。
論文参考訳（メタデータ） (2023-07-16T15:18:25Z)
Robust and Explainable Identification of Logical Fallacies in Natural Language Arguments [5.850977561881791]
論理的誤りに関する先行理論を総合的な3段階評価フレームワークに定式化する。我々は,プロトタイプ推論,インスタンスベースの推論,知識注入に基づく,堅牢で説明可能な3つの手法を取り入れている。我々はこれらの手法をデータセット上で広範囲に評価し、その堅牢性と説明可能性に焦点を当てた。
論文参考訳（メタデータ） (2022-12-12T20:27:17Z)
Lila: A Unified Benchmark for Mathematical Reasoning [59.97570380432861]
LILAは、23の多様なタスクと4次元からなる統一的な数学的推論ベンチマークである。我々は,Pythonプログラムの形式でタスク命令とソリューションを収集することにより,20のデータセットベンチマークを拡張してベンチマークを構築した。 LILAで訓練された汎用数学的推論モデルであるBHASKARAを紹介する。
論文参考訳（メタデータ） (2022-10-31T17:41:26Z)
ReAct: Synergizing Reasoning and Acting in Language Models [44.746116256516046]
大規模言語モデル (LLM) は, 推論トレースとタスク固有動作の両方を, インターリーブ方式で生成可能であることを示す。我々はReActという名前のアプローチを多種多様な言語と意思決定タスクに適用する。 ReActは、単純なウィキペディアAPIと対話することで、チェーン・オブ・ソート推論でよく見られる幻覚やエラーの伝播の問題を克服する。
論文参考訳（メタデータ） (2022-10-06T01:00:32Z)
RuArg-2022: Argument Mining Evaluation [69.87149207721035]
本稿は、ロシア語テキストを扱う議論分析システムの最初のコンペティションの主催者の報告である。新型コロナウイルスの感染拡大に伴う3つの話題について、9,550文(ソーシャルメディア投稿記事)のコーパスを用意した。両タスクで第一位を獲得したシステムは、BERTアーキテクチャのNLI(Natural Language Inference)変種を使用した。
論文参考訳（メタデータ） (2022-06-18T17:13:37Z)
Making Large Language Models Better Reasoners with Step-Aware Verifier [49.16750018427259]
DIVERSE(Diverse Verifier on Reasoning Step)は、言語モデルの推論能力をさらに強化する新しいアプローチである。最新の言語モデルであるcode-davinci 上で DIVERSE を評価し,8つの推論ベンチマークのうち6つで新たな最先端結果が得られることを示す。
論文参考訳（メタデータ） (2022-06-06T03:38:36Z)
Distant finetuning with discourse relations for stance classification [55.131676584455306]
そこで本研究では,定位分類のモデルとして,原文から銀ラベルでデータを抽出し,微調整する手法を提案する。また,様々な段階において微調整に用いるデータのノイズレベルが減少する3段階のトレーニングフレームワークを提案する。 NLPCC 2021共有タスクArgumentative Text Understanding for AI Debaterでは,26の競合チームの中で1位にランクインした。
論文参考訳（メタデータ） (2022-04-27T04:24:35Z)
CS-NLP team at SemEval-2020 Task 4: Evaluation of State-of-the-art NLP Deep Learning Architectures on Commonsense Reasoning Task [3.058685580689605]
本稿では,SemEval-2020 Task 4 competition: Commonsense Validation and Explanation (ComVE) Challengeについて述べる。本システムは、3つの異なる自然言語推論サブタスクに対して手動でキュレートされたラベル付きテキストデータセットを使用する。第2のサブタスクでは、声明が意味をなさない理由を選択するため、27人の参加者のうち、最初の6チーム(93.7%)で非常に競争力のある結果が得られます。
論文参考訳（メタデータ） (2020-05-17T13:20:10Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。