Fugu-MT 論文翻訳(概要): Iterative Utility Judgment Framework via LLMs Inspired by Relevance in Philosophy

論文の概要: Iterative Utility Judgment Framework via LLMs Inspired by Relevance in Philosophy

arxiv url: http://arxiv.org/abs/2406.11290v2
Date: Tue, 19 Aug 2025 09:59:05 GMT
ステータス: 翻訳完了
システム内更新日: 2025-08-20 15:36:31.303031
Title: Iterative Utility Judgment Framework via LLMs Inspired by Relevance in Philosophy
Title（参考訳）: 哲学の関連性に触発されたLCMによる反復的実用性判断フレームワーク
Authors: Hengran Zhang, Keping Bi, Jiafeng Guo, Xueqi Cheng,
Abstract要約: ITEM(Iterative utiliTy judgm fraEntMework)を提案する。 RAGの3つの中核的構成要素は、検索モデル、ユーティリティ判断、回答生成から導かれる関連性ランキングであり、シューツの哲学的関連性体系と一致している。実効性判定, ランキング, 回答生成におけるITEMの顕著な改善が, 代表ベースラインに基づいて示された。
参考スコア（独自算出の注目度）: 66.95501113584541
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Relevance and utility are two frequently used measures to evaluate the effectiveness of an information retrieval (IR) system. Relevance emphasizes the aboutness of a result to a query, while utility refers to the result's usefulness or value to an information seeker. In Retrieval-Augmented Generation (RAG), high-utility results should be prioritized to feed to LLMs due to their limited input bandwidth. Re-examining RAG's three core components -- relevance ranking derived from retrieval models, utility judgments, and answer generation -- aligns with Schutz's philosophical system of relevances, which encompasses three types of relevance representing different levels of human cognition that enhance each other. These three RAG components also reflect three cognitive levels for LLMs in question-answering. Therefore, we propose an Iterative utiliTy judgmEnt fraMework (ITEM) to promote each step in RAG. We conducted extensive experiments on retrieval (TREC DL, WebAP), utility judgment task (GTI-NQ), and factoid question-answering (NQ) datasets. Experimental results demonstrate significant improvements of ITEM in utility judgments, ranking, and answer generation upon representative baselines.
Abstract（参考訳）: 関連性と実用性は、情報検索(IR)システムの有効性を評価するためによく使われる2つの尺度である。関連性はクエリに対する結果の意味を強調する一方で、ユーティリティは結果の有用性や価値を情報検索者に示す。 Retrieval-Augmented Generation (RAG)では、入力帯域幅が限られているため、LCMに供給するために高ユーティリティな結果が優先されるべきである。 RAGの3つのコアコンポーネント(検索モデル、ユーティリティ判断、回答生成から導かれる関連性ランキング)の再検討は、Schutzの哲学的関連性システムと一致している。これら3つのRAG成分は、質問応答におけるLLMの3つの認知レベルを反映している。そこで本研究では,RAGにおける各ステップを促進させるために,ITEM(Iterative utiliTy judgmEnt fraMework)を提案する。我々は、検索(TREC DL、WebAP)、ユーティリティ判断タスク(GTI-NQ)、ファクトイド質問応答(NQ)データセットについて広範な実験を行った。実効性判定, ランキング, 回答生成におけるITEMの顕著な改善が, 代表ベースラインに基づいて示された。

関連論文リスト

Character-R1: Enhancing Role-Aware Reasoning in Role-Playing Agents via RLVR [67.66592867046229]
character-R1は効果的な役割認識推論のための検証可能な報酬信号を提供するために設計されたフレームワークである。本フレームワークは,認知的フォーカス・リワード(Cognitive Focus Reward),参照ガイド・リワード(Reference-Guided Reward),文字指定リワード正規化( character-Conditioned Reward normalization)の3つのコア設計で構成されている。
論文参考訳（メタデータ） (2026-01-08T05:33:37Z)
Enhancing the Medical Context-Awareness Ability of LLMs via Multifaceted Self-Refinement Learning [49.559151128219725]
大規模言語モデル(LLM)は医療分野で大きな可能性を示しており、いくつかのベンチマークで高いパフォーマンスを実現している。しかし、実際の医療シナリオではパフォーマンスが低下し続けており、コンテキスト認識の強化が要求されることが多い。データ駆動型アプローチであるMultifaceted Self-Refinement (MuSeR)を提案する。
論文参考訳（メタデータ） (2025-11-13T08:13:23Z)
Knowledge-Graph Based RAG System Evaluation Framework [27.082302648704708]
大規模言語モデル(LLM)は重要な研究対象となっている。 Retrieval Augmented Generation (RAG)は、生成したコンテンツの信頼性と関連性を大幅に向上させる。 RAGシステムの評価は依然として難しい課題である。
論文参考訳（メタデータ） (2025-10-02T20:36:21Z)
TRUE: A Reproducible Framework for LLM-Driven Relevance Judgment in Information Retrieval [11.27206971411905]
関連判断生成のためのtextitTask-aware Evaluation (TRUE) を提案する。 TRUEはもともと,検索セッションにおける有用性評価のために開発された。 TRUEをTREC DL 2019, 2020, LLMJudgeデータセットで評価した。
論文参考訳（メタデータ） (2025-09-29T23:58:47Z)
Decomposed Reasoning with Reinforcement Learning for Relevance Assessment in UGC Platforms [30.51899823655511]
Retrieval-augmented Generation (RAG)は、ユーザ生成コンテンツプラットフォームにおいて重要な役割を果たす。 1)RAGシナリオにおけるユーザフィードバックの少なさによる曖昧なユーザ意図,2)非公式言語や非構造化言語によって導入された相当なノイズ。
論文参考訳（メタデータ） (2025-08-04T15:14:09Z)
Distilling a Small Utility-Based Passage Selector to Enhance Retrieval-Augmented Generation [77.07879255360342]
Retrieval-augmented Generation (RAG)は、取得した情報を組み込むことで、大規模言語モデル(LLM)を強化する。 RAGでは、重要度は実用性に移行し、正確な回答を生成するためのパスの有用性を考慮している。提案手法は、ランク付けよりもユーティリティベースの選択に重点を置いており、固定しきい値を必要とせずに、特定のクエリに合わせた動的通過選択を可能にする。本実験は, 実用性に基づく選択により, RAGの柔軟性とコスト効率が向上し, 計算コストが大幅に低減され, 応答品質が向上することを示した。
論文参考訳（メタデータ） (2025-07-25T09:32:29Z)
Towards Agentic RAG with Deep Reasoning: A Survey of RAG-Reasoning Systems in LLMs [69.10441885629787]
Retrieval-Augmented Generation (RAG) は、外部知識を注入することによって、Large Language Models (LLM) の事実性を高める。逆に、純粋に推論指向のアプローチは、しばしば幻覚的あるいは誤った事実を必要とする。この調査は両鎖を統一的推論-検索の観点から合成する。
論文参考訳（メタデータ） (2025-07-13T03:29:41Z)
Causal Retrieval with Semantic Consideration [6.967392207053045]
本稿では,2つの目的(意味と因果関係)で訓練された検索モデルであるCAWAIを提案する。実験の結果,CAWAIは多様な因果検索タスクにおいて,様々なモデルよりも優れていた。また,CAWAIは科学領域のQAタスクに対して強いゼロショットの一般化を示すことを示す。
論文参考訳（メタデータ） (2025-04-07T03:04:31Z)
Training a Utility-based Retriever Through Shared Context Attribution for Retrieval-Augmented Language Models [51.608246558235166]
SCARLetは、RALMsでユーティリティベースのレトリバーをトレーニングするためのフレームワークである。マルチタスクの一般化とパッセージ間相互作用という2つの重要な要素が組み込まれている。ドメイン内とドメイン外の両方で、さまざまなタスクにまたがる10のデータセットに対するアプローチを評価します。
論文参考訳（メタデータ） (2025-04-01T09:28:28Z)
SePer: Measure Retrieval Utility Through The Lens Of Semantic Perplexity Reduction [20.6787276745193]
本稿では、RAGフレームワーク内の情報ゲインのレンズを通して、検索品質を測定する自動評価手法を提案する。検索の利便性を,検索後の意味的難易度を低減する程度で定量化する。
論文参考訳（メタデータ） (2025-03-03T12:37:34Z)
Is Relevance Propagated from Retriever to Generator in RAG? [21.82171240511567]
RAGは外部知識を組み込むためのフレームワークであり、通常はコレクションから取得した文書の集合の形式である。我々は、トポロジに関連のある文書からなるRAGコンテキストが下流の性能向上につながるかどうかを実証的に検討する。
論文参考訳（メタデータ） (2025-02-20T20:21:46Z)
Long Context vs. RAG for LLMs: An Evaluation and Revisits [41.27137478456755]
本稿は、このトピックに関する最近の研究を再考し、その重要な洞察と相違点を明らかにする。 LCは、特にウィキペディアベースの質問に対して、質問応答ベンチマークにおいてRAGよりも優れていた。また,既存の研究における文脈関連性の重要性を概観する,詳細な議論もおこなう。
論文参考訳（メタデータ） (2024-12-27T14:34:37Z)
Toward Optimal Search and Retrieval for RAG [39.69494982983534]
Retrieval-augmented Generation (RAG)は、Large Language Models (LLM)に関連するメモリ関連の課題に対処するための有望な方法である。ここでは、質問回答(QA)などの共通タスクに対して、レトリバーをRAGパイプラインに最適化する方法を理解することを目的としている。
論文参考訳（メタデータ） (2024-11-11T22:06:51Z)
JudgeRank: Leveraging Large Language Models for Reasoning-Intensive Reranking [81.88787401178378]
本稿では,文書関連性を評価する際に,人間の認知過程をエミュレートする新しいエージェント・リランカであるJiceRankを紹介する。我々は,推論集約型BRIGHTベンチマークを用いて判定Rankを評価し,第1段階の検索手法よりも性能が大幅に向上したことを示す。さらに、JiceRankは、人気の高いBEIRベンチマークの細調整された最先端リランカと同等に動作し、ゼロショットの一般化能力を検証している。
論文参考訳（メタデータ） (2024-10-31T18:43:12Z)
CORAL: Benchmarking Multi-turn Conversational Retrieval-Augmentation Generation [68.81271028921647]
我々は,現実的なマルチターン対話環境におけるRAGシステム評価のためのベンチマークであるCORALを紹介する。コラルにはウィキペディアから自動的に派生した多様な情報検索会話が含まれている。対話型RAGの3つの中核的なタスク、すなわち、通過検索、応答生成、および引用ラベリングをサポートする。
論文参考訳（メタデータ） (2024-10-30T15:06:32Z)
Do RAG Systems Cover What Matters? Evaluating and Optimizing Responses with Sub-Question Coverage [74.70255719194819]
サブクエストカバレッジに基づく新しいフレームワークを導入し、RAGシステムが質問の異なる面にどのように対処するかを計測する。このフレームワークを使用して、You.com、Perplexity AI、Bing Chatの3つの商用生成応答エンジンを評価します。すべての回答エンジンは、バックグラウンドやフォローアップよりも、コアサブクエストを頻繁にカバーしていますが、コアサブクエストの約50%を見逃しています。
論文参考訳（メタデータ） (2024-10-20T22:59:34Z)
Unveiling and Consulting Core Experts in Retrieval-Augmented MoE-based LLMs [64.9693406713216]
RAGシステムの有効性に寄与する内部メカニズムは未解明のままである。実験の結果,複数のコアグループの専門家がRAG関連行動に主に関与していることが判明した。本稿では,専門家の活性化を通じてRAGの効率性と有効性を高めるためのいくつかの戦略を提案する。
論文参考訳（メタデータ） (2024-10-20T16:08:54Z)
A Thorough Performance Benchmarking on Lightweight Embedding-based Recommender Systems [67.52782366565658]
State-of-the-art recommender system (RS) は、埋め込みベクトルによって符号化される分類的特徴に依存し、結果として非常に大きな埋め込みテーブルとなる。軽量埋め込み型RSの繁栄にもかかわらず、評価プロトコルには幅広い多様性が見られる。本研究では, LERSの性能, 効率, クロスタスク転送性について, 徹底的なベンチマークによる検討を行った。
論文参考訳（メタデータ） (2024-06-25T07:45:00Z)
Identifying Key Terms in Prompts for Relevance Evaluation with GPT Models [1.1965844936801802]
本研究の目的は,大規模言語モデルを用いて,どの特定の用語が肯定的あるいは否定的に関連性評価に影響を及ぼすかを明らかにすることである。これらのプロンプトの性能を、少数ショットとゼロショットの両方の設定で比較することにより、プロンプトにおける特定の用語の影響を分析する。
論文参考訳（メタデータ） (2024-05-11T06:30:13Z)
Improving Retrieval in Theme-specific Applications using a Corpus Topical Taxonomy [52.426623750562335]
ToTER (Topical Taxonomy Enhanced Retrieval) フレームワークを紹介する。 ToTERは、クエリとドキュメントの中心的なトピックを分類学のガイダンスで識別し、そのトピックの関連性を利用して、欠落したコンテキストを補う。プラグイン・アンド・プレイのフレームワークとして、ToTERは様々なPLMベースのレトリバーを強化するために柔軟に使用できる。
論文参考訳（メタデータ） (2024-03-07T02:34:54Z)
Robust Saliency-Aware Distillation for Few-shot Fine-grained Visual Recognition [57.08108545219043]
サンプルが少ない新しいサブカテゴリを認識することは、コンピュータビジョンにおいて不可欠で挑戦的な研究課題である。既存の文献は、ローカルベースの表現アプローチを採用することでこの問題に対処している。本稿では,ロバスト・サリエンシ・アウェア蒸留法(RSaD)を提案する。
論文参考訳（メタデータ） (2023-05-12T00:13:17Z)
Joint Answering and Explanation for Visual Commonsense Reasoning [46.44588492897933]
Visual Commonsense Reasoningは、よりハイレベルな視覚的理解を追求する試みである。与えられた画像に対する質問応答と、回答説明のための合理的推論の2つの必須プロセスで構成されている。本稿では,質問応答と推論プロセスの合理化を両立させるための知識蒸留強化フレームワークを提案する。
論文参考訳（メタデータ） (2022-02-25T11:26:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。