Fugu-MT 論文翻訳(概要): Controllable Evidence Selection in Retrieval-Augmented Question Answering via Deterministic Utility Gating

論文の概要: Controllable Evidence Selection in Retrieval-Augmented Question Answering via Deterministic Utility Gating

arxiv url: http://arxiv.org/abs/2603.18011v1
Date: Mon, 23 Feb 2026 18:20:15 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-23 08:17:42.384146
Title: Controllable Evidence Selection in Retrieval-Augmented Question Answering via Deterministic Utility Gating
Title（参考訳）: 検索型質問応答における決定論的ユーティリティゲーティングによる制御可能なエビデンス選択
Authors: Victor P. Unda,
Abstract要約: 本稿では,検索強化質問応答のための決定論的エビデンス選択フレームワークを提案する。このアプローチでは,意味-ユーティリティ推定(MUE)と多様性-ユーティリティ推定(DUE)を導入している。プロトタイプでは、タスクが必要とする事実、ルール、条件を明確に記述している場合にのみ、ユニットが受け入れられる。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Many modern AI question-answering systems convert text into vectors and retrieve the closest matches to a user question. While effective for topical similarity, similarity scores alone do not explain why some retrieved text can serve as evidence while other equally similar text cannot. When many candidates receive similar scores, systems may select sentences that are redundant, incomplete, or address different conditions than the question requires. This paper presents a deterministic evidence selection framework for retrieval-augmented question answering. The approach introduces Meaning-Utility Estimation (MUE) and Diversity-Utility Estimation (DUE), fixed scoring and redundancy-control procedures that determine evidence admissibility prior to answer generation. Each sentence or record is evaluated independently using explicit signals for semantic relatedness, term coverage, conceptual distinctiveness, and redundancy. No training or fine-tuning is required. In the prototype, a unit is accepted only if it explicitly states the fact, rule, or condition required by the task. Units are not merged or expanded. If no unit independently satisfies the requirement, the system returns no answer. This deterministic gating produces compact, auditable evidence sets and establishes a clear boundary between relevant text and usable evidence.
Abstract（参考訳）: 多くの現代のAI質問回答システムは、テキストをベクトルに変換し、最も近いマッチをユーザ質問に検索する。局所的類似性には有効であるが、類似性スコアだけでは、検索されたテキストが証拠として機能する理由を説明できない。多くの候補者が同様のスコアを受け取った場合、システムは冗長な文、不完全文、あるいは質問の要求とは異なる条件に対処する文を選択することができる。本稿では,検索強化質問応答のための決定論的エビデンス選択フレームワークを提案する。提案手法では, 解答生成に先立って, 有意性評価 (MUE) と多義性評価 (DUE) を導入する。各文や記録は、意味的関連性、用語のカバレッジ、概念的特異性、冗長性に関する明示的な信号を用いて独立に評価される。訓練や微調整は不要。プロトタイプでは、タスクが必要とする事実、ルール、条件を明確に記述している場合にのみ、ユニットが受け入れられる。ユニットは統合または拡張されない。ユニットが独立して要求を満たしていない場合、システムは応答を返さない。この決定論的ゲーティングはコンパクトで監査可能なエビデンスを生成し、関連するテキストと使用可能なエビデンスの間に明確な境界を確立する。

関連論文リスト

Testing for LLM response differences: the case of a composite null consisting of semantically irrelevant query perturbations [10.216191904121178]
入力クエリが2つある場合、応答分布が同じかどうかを問うのは自然である。従来の等式テストは、2つの意味論的等価なクエリが統計的に異なる応答分布を誘導することを示しているかもしれない。本稿では, セマンティックに類似したクエリの集合をテスト手順に組み込むことで, このミスアライメントに対処する。
論文参考訳（メタデータ） (2025-09-13T19:44:42Z)
Variability Need Not Imply Error: The Case of Adequate but Semantically Distinct Responses [7.581259361859477]
不確実性定量化ツールは、モデルが不確実である場合の応答を拒否するために使用できます。我々は、モデルがAdequate Responses (PROBAR)に割り当てる確率を推定する。 ProBARはアンビグニティ/オープンエンディエントネスの異なるプロンプトでセマンティックエントロピーを上回ります。
論文参考訳（メタデータ） (2024-12-20T09:02:26Z)
Evidence Contextualization and Counterfactual Attribution for Conversational QA over Heterogeneous Data with RAG Systems [4.143039012104666]
Retrieval Augmented Generation(RAG)は、会話質問回答(ConvQA)を介して企業のデータと対話するためのバックボーンとして機能する。本研究では,RAGONITE(RAGONITE,RAGONITE,RAGONITE,RAGONITE,RAAG,RAGONITE,RAGONITE,RAGONITE,RAGONITE,RAAG,RAGONITE ,RAGONITE,RAGONITE,RAGONITE,RAAG,RAGONITE,RAGONITE,RAGONITE,RAGONITE,RAGONITE,RAGONITE,RAGONITE,RAGO NITE)について述べる。
論文参考訳（メタデータ） (2024-12-13T21:28:17Z)
QUDSELECT: Selective Decoding for Questions Under Discussion Parsing [90.92351108691014]
Question Under Examination (QUD) は、暗黙の質問を用いて文間の会話関係を明らかにするための談話フレームワークである。本稿では,QUD基準を考慮したQUD依存構造を選択的に復号する共同学習フレームワークであるQUDSELECTを紹介する。提案手法は,人的評価において9%,自動評価において4%,最先端のベースラインモデルよりも優れていた。
論文参考訳（メタデータ） (2024-08-02T06:46:08Z)
Bisimulation Learning [55.859538562698496]
我々は、大きな、潜在的に無限の状態空間を持つ状態遷移系の有限バイシミュレートを計算する。提案手法は,実際に行われている他の最先端ツールよりも高速な検証結果が得られる。
論文参考訳（メタデータ） (2024-05-24T17:11:27Z)
MQAG: Multiple-choice Question Answering and Generation for Assessing Information Consistency in Summarization [55.60306377044225]
最先端の要約システムは高度に流動的な要約を生成することができる。しかし、これらの要約には、情報源に存在しない事実上の矛盾や情報が含まれている可能性がある。本稿では,ソース情報と要約情報を直接比較する,標準的な情報理論に基づく代替手法を提案する。
論文参考訳（メタデータ） (2023-01-28T23:08:25Z)
A Semantic-based Method for Unsupervised Commonsense Question Answering [40.18557352036813]
ラベル付きタスクデータに依存しないため、教師なしのコモンセンス質問応答は魅力的である。教師なしコモンセンス質問応答のためのSemantic-based Question Answering法(SEQA)を提案する。
論文参考訳（メタデータ） (2021-05-31T08:21:52Z)
Logically Consistent Loss for Visual Question Answering [66.83963844316561]
ニューラルネットワークに基づく視覚質問応答(VQA)の現在の進歩は、同じ分布(すなわち、d)の仮定による一貫性を保証することができない。マルチタスク学習フレームワークにおける論理的一貫した損失を定式化することにより,この問題に対処するための新しいモデルに依存しない論理制約を提案する。実験により、提案された損失公式とハイブリッドバッチの導入により、一貫性が向上し、性能が向上することを確認した。
論文参考訳（メタデータ） (2020-11-19T20:31:05Z)
A Wrong Answer or a Wrong Question? An Intricate Relationship between Question Reformulation and Answer Selection in Conversational Question Answering [15.355557454305776]
会話の文脈における質問書き直し(QR)は、この現象により多くの光を放つことができることを示す。 TREC CAsT と QuAC (CANARD) のデータセットを用いて解析を行った。
論文参考訳（メタデータ） (2020-10-13T06:29:51Z)
Evidence-Aware Inferential Text Generation with Vector Quantised Variational AutoEncoder [104.25716317141321]
本稿では,大規模なテキストコーパスからイベントの証拠を自動的に発見し,その証拠を利用して推論テキストの生成を導く手法を提案する。このアプローチは、Event2MindとATOMICの両方のデータセットで最先端のパフォーマンスを提供します。
論文参考訳（メタデータ） (2020-06-15T02:59:52Z)
Robust Question Answering Through Sub-part Alignment [53.94003466761305]
我々はアライメント問題として質問応答をモデル化する。私たちは、SQuAD v1.1でモデルをトレーニングし、いくつかの逆および外ドメインデータセットでそれをテストします。
論文参考訳（メタデータ） (2020-04-30T09:10:57Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。