Fugu-MT 論文翻訳(概要): "Let's Argue Both Sides": Argument Generation Can Force Small Models to Utilize Previously Inaccessible Reasoning Capabilities

論文の概要: "Let's Argue Both Sides": Argument Generation Can Force Small Models to Utilize Previously Inaccessible Reasoning Capabilities

arxiv url: http://arxiv.org/abs/2410.12997v1
Date: Wed, 16 Oct 2024 19:49:30 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:36.611502
Title: "Let's Argue Both Sides": Argument Generation Can Force Small Models to Utilize Previously Inaccessible Reasoning Capabilities
Title（参考訳）: Let's Argue both Sides: Argument Generationは、小さなモデルに従来の到達不能推論機能を利用するよう強制する
Authors: Kaveh Eskandari Miandoab, Vasanth Sarathy,
Abstract要約: 本稿では,モデルに推論能力の活用を強制する手法として,Argument Generationを提案する。提案手法では,可能な各推論結果に対する引数の生成と,生成した引数のランク付けをエンドモデルに依頼する。
参考スコア（独自算出の注目度）: 0.8999666725996974
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Large Language Models (LLMs), despite achieving state-of-the-art results in a number of evaluation tasks, struggle to maintain their performance when logical reasoning is strictly required to correctly infer a prediction. In this work, we propose Argument Generation as a method of forcing models to utilize their reasoning capabilities when other approaches such as chain-of-thought reasoning prove insufficient. Our method involves the generation of arguments for each possible inference result, and asking the end model to rank the generated arguments. We show that Argument Generation can serve as an appropriate substitute for zero-shot prompting techniques without the requirement to add layers of complexity. Furthermore, we argue that knowledge-probing techniques such as chain-of-thought reasoning and Argument Generation are only useful when further reasoning is required to infer a prediction, making them auxiliary to more common zero-shot approaches. Finally, we demonstrate that our approach forces larger gains in smaller language models, showcasing a complex relationship between model size and prompting methods in foundation models.
Abstract（参考訳）: 大規模言語モデル(LLM)は、多くの評価タスクで最先端の結果を得るが、予測を正しく推測するために論理的推論が厳密に要求される場合、その性能を維持するのに苦労する。本研究では,モデルに推論能力の活用を強制する手法としてArgument Generationを提案する。提案手法では,可能な各推論結果に対する引数の生成と,生成した引数のランク付けをエンドモデルに依頼する。また,Argument Generationは,複雑なレイヤを追加する必要がなくなることなく,ゼロショットプロンプト手法の適切な代替手段として機能することを示す。さらに,チェーン・オブ・ソート推論やArgument Generationのような知識提供技術は,予測を推論するためにさらなる推論が必要な場合にのみ有用であり,より一般的なゼロショットアプローチに補助的であると論じる。最後に,本手法は,より小さな言語モデルにおいて,モデルサイズと基礎モデルにおける促進手法の複雑な関係を示すことによって,より大きなゲインを増大させることを実証する。

関連論文リスト

The CoT Encyclopedia: Analyzing, Predicting, and Controlling how a Reasoning Model will Think [81.38614558541772]
本稿では,モデル推論の分析とステアリングのためのフレームワークであるCoT Encyclopediaを紹介する。本手法はモデル生成CoTから多種多様な推論基準を自動的に抽出する。このフレームワークは既存の手法よりも解釈可能で包括的分析が可能であることを示す。
論文参考訳（メタデータ） (2025-05-15T11:31:02Z)
Parameterized Argumentation-based Reasoning Tasks for Benchmarking Generative Language Models [1.249418440326334]
法域におけるツールとしての生成可能な大規模言語モデルは、司法システムを改善する可能性がある。しかし、現在の生成モデルの推論行動は脆く理解が不十分であるため、法と証拠の領域に責任を負うことはできない。生成言語モデルの推論能力を評価するために,ベンチマークを作成するためのアプローチを導入する。
論文参考訳（メタデータ） (2025-05-02T19:04:34Z)
Causality can systematically address the monsters under the bench(marks) [64.36592889550431]
ベンチマークはさまざまなバイアス、アーティファクト、リークに悩まされている。モデルは、調査の不十分な障害モードのため、信頼できない振る舞いをする可能性がある。因果関係はこれらの課題を体系的に解決するための理想的な枠組みを提供します
論文参考訳（メタデータ） (2025-02-07T17:01:37Z)
Metastable Dynamics of Chain-of-Thought Reasoning: Provable Benefits of Search, RL and Distillation [40.861314212279474]
メタスタブルマルコフプロセスとしてチェーン・オブ・シント(CoT)生成による推論時間計算について検討する。スパースエッジに報酬を与える検索プロトコルの実装は、異なるクラスタに到達するための期待するステップ数を減らし、CoTを改善することを実証する。また,検索によって得られる情報を利用して,より優れた推論モデルが得られることを示す。
論文参考訳（メタデータ） (2025-02-02T18:19:14Z)
When factorization meets argumentation: towards argumentative explanations [0.0]
因数分解に基づく手法と議論フレームワーク(AF)を組み合わせた新しいモデルを提案する。我々のフレームワークは、ユーザコンテキストなどのサイド情報をシームレスに組み込んで、より正確な予測を可能にします。
論文参考訳（メタデータ） (2024-05-13T19:16:28Z)
Counterfactual and Semifactual Explanations in Abstract Argumentation: Formal Foundations, Complexity and Computation [19.799266797193344]
議論ベースのシステムは、意思決定プロセスをサポートしながら説明責任を欠くことが多い。対実的・半実的な説明は解釈可能性のテクニックである。本稿では,制約の弱いArgumentation Frameworkにおいて,逆ファクトおよび半ファクトのクエリを符号化可能であることを示す。
論文参考訳（メタデータ） (2024-05-07T07:27:27Z)
Conceptual and Unbiased Reasoning in Language Models [98.90677711523645]
本稿では,抽象的質問に対する概念的推論をモデルに強制する,新しい概念化フレームワークを提案する。既存の大規模言語モデルは概念的推論では不足しており、様々なベンチマークでは9%から28%に低下している。ハイレベルな抽象的推論が不偏で一般化可能な意思決定の鍵となるので、モデルがどのように改善できるかについて議論する。
論文参考訳（メタデータ） (2024-03-30T00:53:53Z)
Large Language Models as Analogical Reasoners [155.9617224350088]
CoT(Chain-of- Thought)は、言語モデルのプロンプトとして、推論タスク全体で素晴らしいパフォーマンスを示す。そこで本稿では,大規模言語モデルの推論プロセスを自動的にガイドする,新たなプロンプト手法であるアナログプロンプトを導入する。
論文参考訳（メタデータ） (2023-10-03T00:57:26Z)
Retrieval-Augmented Generative Question Answering for Event Argument Extraction [66.24622127143044]
イベント引数抽出のための検索拡張生成QAモデル(R-GQA)を提案する。最も類似したQAペアを検索し、現在の例のコンテキストへのプロンプトとして拡張し、引数を回答としてデコードする。提案手法は, 様々な設定において, かなり先行した手法より優れている。
論文参考訳（メタデータ） (2022-11-14T02:00:32Z)
Learning to Reason With Relational Abstractions [65.89553417442049]
関係抽象化の考え方を用いて,言語モデルにおいてより強力な推論能力を構築する方法について検討する。このようなシーケンスをプロンプトとして提供したモデルでは,タスクの精度が大幅に向上することがわかった。
論文参考訳（メタデータ） (2022-10-06T00:27:50Z)
Logical Satisfiability of Counterfactuals for Faithful Explanations in NLI [60.142926537264714]
本稿では, 忠実度スルー・カウンタファクトの方法論について紹介する。これは、説明に表される論理述語に基づいて、反実仮説を生成する。そして、そのモデルが表現された論理と反ファクトの予測が一致しているかどうかを評価する。
論文参考訳（メタデータ） (2022-05-25T03:40:59Z)
Aspect-Controlled Neural Argument Generation [65.91772010586605]
我々は、与えられたトピック、スタンス、アスペクトの文レベル引数を生成するために、きめ細かいレベルで制御できる引数生成のための言語モデルを訓練する。評価の結果,我々の生成モデルは高品質なアスペクト特異的な議論を生成できることがわかった。これらの議論は、データ拡張による姿勢検出モデルの性能向上と、逆問題の生成に使用できる。
論文参考訳（メタデータ） (2020-04-30T20:17:22Z)
AMPERSAND: Argument Mining for PERSuAsive oNline Discussions [41.06165177604387]
本稿では,オンライン議論フォーラムにおける議論マイニングのための計算モデルを提案する。我々のアプローチは、議論スレッド内の引数のコンポーネント間の関係を識別することに依存します。我々のモデルは最近の最先端のアプローチと比較して大幅に改善されている。
論文参考訳（メタデータ） (2020-04-30T10:33:40Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。