Fugu-MT 論文翻訳(概要): Gradually Excavating External Knowledge for Implicit Complex Question Answering

論文の概要: Gradually Excavating External Knowledge for Implicit Complex Question Answering

arxiv url: http://arxiv.org/abs/2603.08148v1
Date: Mon, 09 Mar 2026 09:28:42 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-10 15:13:15.73465
Title: Gradually Excavating External Knowledge for Implicit Complex Question Answering
Title（参考訳）: 難解な質問応答のための外部知識の段階的探索
Authors: Chang Liu, Xiaoguang Li, Lifeng Shang, Xin Jiang, Qun Liu, Edmund Y. Lam, Ngai Wong,
Abstract要約: 本研究は,オープンドメイン複雑質問応答のための段階的知識発掘フレームワークを提案する。本手法は, 競合他社の6%未満のパラメータで78.17%の精度を達成している。
参考スコア（独自算出の注目度）: 65.55082746673797
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Recently, large language models (LLMs) have gained much attention for the emergence of human-comparable capabilities and huge potential. However, for open-domain implicit question-answering problems, LLMs may not be the ultimate solution due to the reasons of: 1) uncovered or out-of-date domain knowledge, 2) one-shot generation and hence restricted comprehensiveness. To this end, this work proposes a gradual knowledge excavation framework for open-domain complex question answering, where LLMs iteratively and actively acquire external information, and then reason based on acquired historical knowledge. Specifically, during each step of the solving process, the model selects an action to execute, such as querying external knowledge or performing a single logical reasoning step, to gradually progress toward a final answer. Our method can effectively leverage plug-and-play external knowledge and dynamically adjust the strategy for solving complex questions. Evaluated on the StrategyQA dataset, our method achieves 78.17% accuracy with less than 6% parameters of its competitors, setting new SOTA for ~10B-scale LLMs.
Abstract（参考訳）: 近年,大きな言語モデル (LLM) が注目されている。しかし、オープン・ドメインの暗黙的な問合せ問題に対して、LLMは次の理由により究極の解決にはならないかもしれない。 1) 未発見又は時代遅れのドメイン知識。 2) ワンショット生成により包括性が制限される。そこで本研究では,LLMが反復的に,かつ積極的に外部情報を取得し,得られた歴史的知識に基づいて推論を行う,オープンドメイン複雑質問応答のための段階的知識発掘フレームワークを提案する。具体的には、解法の各ステップにおいて、モデルが外部知識を問合せしたり、1つの論理的推論ステップを実行するような実行動作を選択し、最終解に向かって徐々に進行する。本手法は,外部知識を効果的に活用し,複雑な問題を解くための戦略を動的に調整することができる。提案手法は,StrategyQAデータセットに基づいて,競合相手の6%未満のパラメータで78.17%の精度を達成し,約10BスケールのLSMに対して新たなSOTAを設定する。

関連論文リスト

KnowTrace: Bootstrapping Iterative Retrieval-Augmented Generation with Structured Knowledge Tracing [64.38243807002878]
我々は、大規模言語モデルにおけるコンテキスト過負荷を軽減するためのエレガントなRAGフレームワークであるKnowTraceを紹介する。 KnowTraceは、必要な知識三つ子を自律的に追跡して、入力された質問に関連する特定の知識グラフを整理する。 3つのマルチホップ質問応答ベンチマークで、既存のメソッドを一貫して上回っている。
論文参考訳（メタデータ） (2025-05-26T17:22:20Z)
O$^2$-Searcher: A Searching-based Agent Model for Open-Domain Open-Ended Question Answering [31.38063794496179]
O$2$-Searcherは、強化学習を利用してオープンドメインのオープンエンドとクローズドエンドの両方の質問に対処する、新しい検索エージェントである。厳密に設計された報酬関数を備えた統一的なトレーニング機構を使用して、エージェントは問題タイプを特定し、異なる回答生成戦略を適用することができる。 O$2$-Searcherは3Bモデルのみを使用しており、O$2$-QA上でのLLMエージェントをはるかに上回っている。
論文参考訳（メタデータ） (2025-05-22T12:17:13Z)
R1-Searcher: Incentivizing the Search Capability in LLMs via Reinforcement Learning [87.30285670315334]
textbfR1-Searcherは、大規模言語モデルの検索能力を高めるために設計された、2段階の結果に基づく新しいRLアプローチである。本フレームワークは, コールドスタート時に, プロセス報酬や蒸留を必要とせず, RLのみに依存している。提案手法は, クローズドソースGPT-4o-miniと比較して, 従来の強力なRAG法よりも有意に優れていた。
論文参考訳（メタデータ） (2025-03-07T17:14:44Z)
Context Matters: Pushing the Boundaries of Open-Ended Answer Generation with Graph-Structured Knowledge Context [4.1229332722825]
本稿では,知識グラフに基づく拡張と合わせて,グラフ駆動型コンテキスト検索を組み合わせた新しいフレームワークを提案する。我々は,様々なパラメータサイズを持つ大規模言語モデル(LLM)の実験を行い,知識の基盤化能力を評価し,オープンな質問に対する回答の事実的正確性を決定する。われわれの方法であるGraphContextGenは、テキストベースの検索システムよりも一貫して優れており、その堅牢性と多くのユースケースへの適応性を実証している。
論文参考訳（メタデータ） (2024-01-23T11:25:34Z)
ReST meets ReAct: Self-Improvement for Multi-Step Reasoning LLM Agent [50.508669199496474]
外部知識に基づいて推論と行動を行うReAct-style LLMエージェントを開発した。エージェントをReSTライクな手法で改良し,従来の軌道上で反復的に訓練する。引き起こされた大きなモデルから始まり、アルゴリズムのたった2イテレーションの後に、微調整された小さなモデルを生成することができる。
論文参考訳（メタデータ） (2023-12-15T18:20:15Z)
DIVKNOWQA: Assessing the Reasoning Ability of LLMs via Open-Domain Question Answering over Knowledge Base and Text [73.68051228972024]
大きな言語モデル(LLM)は印象的な生成能力を示すが、内部知識に依存すると幻覚に悩まされる。検索拡張LDMは、外部知識においてLLMを基盤とする潜在的な解決策として出現している。
論文参考訳（メタデータ） (2023-10-31T04:37:57Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。