論文の概要: Text Modular Networks: Learning to Decompose Tasks in the Language of
Existing Models
- arxiv url: http://arxiv.org/abs/2009.00751v2
- Date: Mon, 12 Apr 2021 21:58:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-23 00:35:37.244887
- Title: Text Modular Networks: Learning to Decompose Tasks in the Language of
Existing Models
- Title(参考訳): text modular networks: 既存のモデルの言語でタスクを分解する学習
- Authors: Tushar Khot and Daniel Khashabi and Kyle Richardson and Peter Clark
and Ashish Sabharwal
- Abstract要約: 本稿では,既存のモデルで解けるより単純なモデルに分解することで,複雑なタスクを解くための解釈可能なシステムを構築するためのフレームワークを提案する。
我々はこのフレームワークを用いて、ニューラルネットワークのファクトイド単一スパンQAモデルとシンボリック電卓で答えられるサブクエストに分解することで、マルチホップ推論問題に答えられるシステムであるModularQAを構築する。
- 参考スコア(独自算出の注目度): 61.480085460269514
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a general framework called Text Modular Networks(TMNs) for
building interpretable systems that learn to solve complex tasks by decomposing
them into simpler ones solvable by existing models. To ensure solvability of
simpler tasks, TMNs learn the textual input-output behavior (i.e., language) of
existing models through their datasets. This differs from prior
decomposition-based approaches which, besides being designed specifically for
each complex task, produce decompositions independent of existing sub-models.
Specifically, we focus on Question Answering (QA) and show how to train a
next-question generator to sequentially produce sub-questions targeting
appropriate sub-models, without additional human annotation. These
sub-questions and answers provide a faithful natural language explanation of
the model's reasoning. We use this framework to build ModularQA, a system that
can answer multi-hop reasoning questions by decomposing them into sub-questions
answerable by a neural factoid single-span QA model and a symbolic calculator.
Our experiments show that ModularQA is more versatile than existing explainable
systems for DROP and HotpotQA datasets, is more robust than state-of-the-art
blackbox (uninterpretable) systems, and generates more understandable and
trustworthy explanations compared to prior work.
- Abstract(参考訳): 本稿では,テキスト・モジュール・ネットワーク(TMN)と呼ばれる,複雑なタスクを解くための解釈可能なシステムを構築するための汎用フレームワークを提案する。
単純なタスクの解決可能性を確保するため、TMNはデータセットを通じて既存のモデルのテキスト入力出力動作(すなわち言語)を学ぶ。
これは、各複雑なタスク用に特別に設計された前の分解ベースのアプローチと異なり、既存のサブモデルとは独立に分解を生成する。
具体的には,質問回答(QA)に注目し,人間のアノテーションを付加することなく,適切なサブモデルをターゲットにしたサブクエストを逐次生成するための次のクエストジェネレータの訓練方法を示す。
これらのサブ質問と回答は、モデルの推論の忠実な自然言語説明を提供する。
我々はこのフレームワークを用いて、ニューラルネットワークのファクトイド単一スパンQAモデルとシンボリック電卓で答えられるサブクエストに分解することで、マルチホップ推論問題に答えられるシステムであるModularQAを構築する。
実験の結果,ModularQAは既存のDROPやHotpotQAデータセットより汎用性が高く,最先端のブラックボックス(非解釈可能)システムよりも堅牢であり,従来よりも理解しやすく,信頼性の高い説明を生成することがわかった。
関連論文リスト
- A Model Is Not Built By A Single Prompt: LLM-Based Domain Modeling With Question Decomposition [4.123601037699469]
現実世界のドメインモデリングでは、エンジニアは通常複雑なタスクを簡単に解けるサブタスクに分解する。
本稿では,開発者のモデリングプロセスに類似した質問分解によるLLMに基づくドメインモデリング手法を提案する。
予備的な結果から,本手法は単発プロンプトによるプロンプトよりも優れていた。
論文 参考訳(メタデータ) (2024-10-13T14:28:04Z) - STOC-TOT: Stochastic Tree-of-Thought with Constrained Decoding for Complex Reasoning in Multi-Hop Question Answering [8.525847131940031]
マルチホップ質問応答(MHQA)は、複雑な質問に答えるために複数の通路から情報を検索し統合するモデルを必要とする。
近年のシステムでは、大規模言語モデルのパワーを活用し、証拠検索と推論のプロンプトを統合している。
MHQAの制約付き復号法であるSTOC-TOTを提案する。
論文 参考訳(メタデータ) (2024-07-04T07:17:53Z) - SEMQA: Semi-Extractive Multi-Source Question Answering [94.04430035121136]
本稿では,複数ソースを半抽出的に要約することで,複数の質問に答える新しいQAタスクを提案する。
この種の最初のデータセットであるQuoteSumを作成し、自然および生成された質問に対する人間による半抽出的な回答を提示する。
論文 参考訳(メタデータ) (2023-11-08T18:46:32Z) - Modular Deep Learning [120.36599591042908]
トランスファーラーニングは近年、機械学習の主要なパラダイムとなっている。
負の干渉を伴わずに複数のタスクを専門とするモデルを開発する方法はまだ不明である。
これらの課題に対する有望な解決策として、モジュール型ディープラーニングが登場した。
論文 参考訳(メタデータ) (2023-02-22T18:11:25Z) - Successive Prompting for Decomposing Complex Questions [50.00659445976735]
最近の研究は、大規模言語モデル(LM)の機能を活用して、数ショットで複雑な質問応答を行う。
そこでは、複雑なタスクを単純なタスクに繰り返し分解し、それを解決し、最終解を得るまでプロセスを繰り返します。
我々の最良のモデル(逐次プロンプト付き)は、DROPデータセットの数ショットバージョンにおいて、5%の絶対F1の改善を実現します。
論文 参考訳(メタデータ) (2022-12-08T06:03:38Z) - Hierarchical Conditional Relation Networks for Video Question Answering [62.1146543269993]
条件関係ネットワーク(CRN)と呼ばれる汎用再利用可能なニューラルネットワークユニットを導入する。
CRNは、ビデオ上での表現と推論のためのより洗練された構造を構築するためのビルディングブロックとして機能する。
その結果,ビデオQAのような複雑なドメインに対する汎用推論ユニットの構築の影響が示された。
論文 参考訳(メタデータ) (2020-02-25T07:00:48Z) - ManyModalQA: Modality Disambiguation and QA over Diverse Inputs [73.93607719921945]
本稿では, エージェントが3つの異なるモダリティを考慮し, 質問に答えなければならない, マルチモーダルな質問応答課題, ManyModalQAを提案する。
われわれはウィキペディアをスクラップしてデータを収集し、クラウドソーシングを利用して質問と回答のペアを収集する。
論文 参考訳(メタデータ) (2020-01-22T14:39:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。