論文の概要: Reasoning Circuits: Few-shot Multihop Question Generation with
Structured Rationales
- arxiv url: http://arxiv.org/abs/2211.08466v1
- Date: Tue, 15 Nov 2022 19:36:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-17 14:54:33.920910
- Title: Reasoning Circuits: Few-shot Multihop Question Generation with
Structured Rationales
- Title(参考訳): 推論回路:構造的合理的なマルチホップ質問生成
- Authors: Saurabh Kulshreshtha and Anna Rumshisky
- Abstract要約: 連鎖論理生成は多段階推論タスクの性能を向上させることが示されている。
極めて低い監督体制下でのマルチホップ質問生成にチェーン・オブ・インスパイアされた構造的合理的生成を適用するための新しい枠組みを導入する。
- 参考スコア(独自算出の注目度): 11.068901022944015
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-hop Question Generation is the task of generating questions which
require the reader to reason over and combine information spread across
multiple passages using several reasoning steps. Chain-of-thought rationale
generation has been shown to improve performance on multi-step reasoning tasks
and make model predictions more interpretable. However, few-shot performance
gains from including rationales have been largely observed only in +100B
language models, and otherwise require large scale manual rationale annotation.
In this work, we introduce a new framework for applying chain-of-thought
inspired structured rationale generation to multi-hop question generation under
a very low supervision regime (8- to 128-shot). We propose to annotate a small
number of examples following our proposed multi-step rationale schema, treating
each reasoning step as a separate task to be performed by a generative language
model. We show that our framework leads to improved control over the difficulty
of the generated questions and better performance compared to baselines trained
without rationales, both on automatic evaluation metrics and in human
evaluation. Importantly, we show that this is achievable with a modest model
size.
- Abstract(参考訳): マルチホップ質問生成(Multi-hop Question Generation)は、読者が複数の経路にまたがる情報を複数の推論ステップで組み合わせることを要求する質問を生成するタスクである。
連鎖論理生成は、多段階推論タスクの性能を改善し、モデル予測をより解釈可能にすることが示されている。
しかし、合理性を含むわずかなショットのパフォーマンス向上は主に+100b言語モデルでのみ観察されており、それ以外は大規模な手動合理性アノテーションを必要とする。
本研究では、非常に低い監督体制(8~128ショット)の下で、チェーン・オブ・インスパイアされた構造的理性生成をマルチホップ質問生成に適用するための新しい枠組みを提案する。
提案する多段階合理化スキーマに従って,各推論ステップを生成言語モデルによって実行されるタスクとして扱い,少数の例を注釈化する。
自動評価と人的評価の両面において,本フレームワークは,有理性のないベースラインと比較して,生成した質問の難易度を制御し,性能を向上させることを実証した。
重要なのは、これは控えめなモデルサイズで実現可能であることを示しています。
関連論文リスト
- Soft-Prompting with Graph-of-Thought for Multi-modal Representation Learning [45.517215214938844]
チェーン・オブ・シークレット技術は、マルチモーダルタスクにおいてよく受け入れられている。
マルチモーダル表現学習におけるソフトプロンプトチューニングのためのAgoT(Aggregation-Graph-of-Thought)機構を提案する。
論文 参考訳(メタデータ) (2024-04-06T07:39:44Z) - PathFinder: Guided Search over Multi-Step Reasoning Paths [80.56102301441899]
木探索に基づく推論経路生成手法であるPathFinderを提案する。
動的デコードの統合により、多様な分岐とマルチホップ推論を強化する。
我々のモデルは、大きな分岐因子を持つビームサーチに類似した複雑さを反映して、よく、長く、目に見えない推論連鎖を一般化する。
論文 参考訳(メタデータ) (2023-12-08T17:05:47Z) - Boosting the Power of Small Multimodal Reasoning Models to Match Larger Models with Self-Consistency Training [49.3242278912771]
マルチモーダル推論(multimodal reasoning)は、複数のモーダルをまたいだモデルによる質問に答える難しいタスクである。
既存のアプローチでは、言語と視覚のモダリティを2段階の推論フレームワークに組み込むことで進歩している。
MC-CoTは,複数の合理性と回答を生成し,投票プロセスを通じて最も正確な選択を行う自己整合性学習戦略である。
論文 参考訳(メタデータ) (2023-11-23T17:09:48Z) - Large Language Models as Analogical Reasoners [155.9617224350088]
CoT(Chain-of- Thought)は、言語モデルのプロンプトとして、推論タスク全体で素晴らしいパフォーマンスを示す。
そこで本稿では,大規模言語モデルの推論プロセスを自動的にガイドする,新たなプロンプト手法であるアナログプロンプトを導入する。
論文 参考訳(メタデータ) (2023-10-03T00:57:26Z) - Teaching Smaller Language Models To Generalise To Unseen Compositional
Questions [6.9076450524134145]
多様な推論能力を具現化するために,最大93タスクのマルチタスク事前学習の組み合わせを提案する。
検索強化トレーニングデータセットを追加することにより,性能が大幅に向上することを示す。
論文 参考訳(メタデータ) (2023-08-02T05:00:12Z) - HOP, UNION, GENERATE: Explainable Multi-hop Reasoning without Rationale
Supervision [118.0818807474809]
本研究は、合理的な監督なしに説明可能なマルチホップQAシステムを訓練するための原則的確率論的アプローチを提案する。
提案手法は,集合としての有理を明示的にモデル化し,文書と文間の相互作用を文書内で捉えることによって,マルチホップ推論を行う。
論文 参考訳(メタデータ) (2023-05-23T16:53:49Z) - Chaining Simultaneous Thoughts for Numerical Reasoning [92.2007997126144]
テキストによる数値推論は、AIシステムにとって不可欠なスキルであるべきです。
これまでの研究は方程式の構造をモデル化することに集中し、様々な構造化デコーダを提案してきた。
我々は、有向非巡回グラフを用いてステップを推論する数値推論器CANTORを提案する。
論文 参考訳(メタデータ) (2022-11-29T18:52:06Z) - Interlock-Free Multi-Aspect Rationalization for Text Classification [33.33452117387646]
マルチアスペクト設定におけるインターロック問題に対処することを示す。
自己監督型コントラスト損失を付加した多段階学習手法を提案する。
ビールレビューデータセットにおける実験結果から,本手法は合理化性能を大幅に向上させることが示された。
論文 参考訳(メタデータ) (2022-05-13T16:38:38Z) - Graph-based Multi-hop Reasoning for Long Text Generation [66.64743847850666]
MRGはグラフベースのマルチホップ推論モジュールとパス認識文実現モジュールの2部で構成されている。
従来のブラックボックスモデルとは異なり、MRGはスケルトンパスを明示的に推論し、提案されたモデルがどのように機能するかを説明する説明的なビューを提供する。
論文 参考訳(メタデータ) (2020-09-28T12:47:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。