論文の概要: Towards Faithful Industrial RAG: A Reinforced Co-adaptation Framework for Advertising QA
- arxiv url: http://arxiv.org/abs/2602.22584v1
- Date: Thu, 26 Feb 2026 03:35:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-27 18:41:22.512601
- Title: Towards Faithful Industrial RAG: A Reinforced Co-adaptation Framework for Advertising QA
- Title(参考訳): 忠実な産業RAGを目指して -QA広告のための強化された共適応フレームワーク-
- Authors: Wenwei Li, Ming Xu, Tianle Xia, Lingxiang Hu, Yiding Sun, Linfang Shang, Liqun Liu, Peng Shu, Huan Yu, Jie Jiang,
- Abstract要約: 産業広告質問応答(英: Industrial ads question answering, QA)は、幻覚コンテンツが金銭的損失、コンプライアンス違反、法的リスクに繋がる仕事である。
2つのコンポーネントによる検索と生成を協調的に最適化する強化された協調適応フレームワークを提案する。
内部広告QAデータセットの実験は、正確性、完全性、安全性など、専門家が判断した範囲で一貫した利得を示している。
2週間のオンラインA/Bテストでは、ライクレートが28.6%増加し、嫌悪率が46.2%減少し、URL幻覚が92.7%減少した。
- 参考スコア(独自算出の注目度): 11.136092421166097
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Industrial advertising question answering (QA) is a high-stakes task in which hallucinated content, particularly fabricated URLs, can lead to financial loss, compliance violations, and legal risk. Although Retrieval-Augmented Generation (RAG) is widely adopted, deploying it in production remains challenging because industrial knowledge is inherently relational, frequently updated, and insufficiently aligned with generation objectives. We propose a reinforced co-adaptation framework that jointly optimizes retrieval and generation through two components: (1) Graph-aware Retrieval (GraphRAG), which models entity-relation structure over a high-citation knowledge subgraph for multi-hop, domain-specific evidence selection; and (2) evidence-constrained reinforcement learning via Group Relative Policy Optimization (GRPO) with multi-dimensional rewards covering faithfulness, style compliance, safety, and URL validity. Experiments on an internal advertising QA dataset show consistent gains across expert-judged dimensions including accuracy, completeness, and safety, while reducing the hallucination rate by 72\%. A two-week online A/B test demonstrates a 28.6\% increase in like rate, a 46.2\% decrease in dislike rate, and a 92.7\% reduction in URL hallucination. The system has been running in production for over half a year and has served millions of QA interactions.
- Abstract(参考訳): 産業広告質問応答(英: Industrial ads question answering, QA)は、幻覚コンテンツ(特に偽造URL)が金銭的損失、コンプライアンス違反、法的なリスクを招きかねない作業である。
Retrieval-Augmented Generation (RAG) は広く採用されているが、産業知識は本質的にリレーショナルであり、頻繁に更新され、世代目標と不十分に一致しているため、本番環境への展開は困難である。
グラフ認識検索(GraphRAG)は,マルチホップ,ドメイン固有のエビデンス選択のための高引用知識サブグラフ上のエンティティ関係構造をモデル化し,グループ相対ポリシー最適化(GRPO)によるエビデンス制約付き強化学習と,忠実度,スタイルコンプライアンス,安全性,URL妥当性を多次元的に記述する。
内部広告QAデータセットの実験では、精度、完全性、安全性など、専門家が判断した範囲で一貫した利得を示し、幻覚率を72\%削減した。
2週間のオンラインA/Bテストでは、このようなレートが28.6\%増加し、嫌悪率が46.2\%減少し、URL幻覚が92.7\%減少している。
このシステムは50年以上稼働し、数百万のQAインタラクションを提供している。
関連論文リスト
- JARVIS: An Evidence-Grounded Retrieval System for Interpretable Deceptive Reviews Adjudication [4.797952842010917]
JARVIS は Augmented Retrieval と evidence graph Structures を通じて判断を提供するフレームワークである。
ハイブリッド密度スパースマルチモーダル検索により意味論的に類似したエビデンスを検索し、共有エンティティを通じてリレーショナル信号を拡張し、異種エビデンスグラフを構築する。
本フレームワークは,リコール量を27%増加させ,手動検査時間を75%短縮する。
論文 参考訳(メタデータ) (2026-02-13T13:57:45Z) - Search-R2: Enhancing Search-Integrated Reasoning via Actor-Refiner Collaboration [49.9937230730202]
本稿では,新たなアクター・リファイナ・コラボレーション・フレームワークであるSearch-R2を提案する。
提案手法は,生成過程をアクターに分解し,最初の推論軌道を生成する。
本稿では,検索-R2がモデルスケール全体にわたって強力なRAGとRLベースのベースラインを一貫して上回ることを示す。
論文 参考訳(メタデータ) (2026-02-03T15:32:09Z) - Generation-Augmented Generation: A Plug-and-Play Framework for Private Knowledge Injection in Large Language Models [48.65910216527897]
GAG(Generation-Augmented Generation)は、プライベートな専門知識を専門的なモダリティとして扱い、コンパクトな表現レベルインターフェースを通じてそれを注入する。
GAGは2つのベンチマークで強力なRAGベースラインよりも15.34%、14.86%の専門性能を向上した。
論文 参考訳(メタデータ) (2026-01-13T04:23:36Z) - EviNote-RAG: Enhancing RAG Models via Answer-Supportive Evidence Notes [39.61443457073034]
EviNote-RAGは検索ノート・アンサーのワークフローに従うフレームワークである。
生の外部情報を直接推論する代わりに、モデルが最初にサポート・エビデンス・ノートを生成する。
EviNote-RAGは最先端のパフォーマンスを実現し、回答の正確性、トレーニングの安定性、堅牢性、効率性を向上する。
論文 参考訳(メタデータ) (2025-08-31T14:44:45Z) - ComRAG: Retrieval-Augmented Generation with Dynamic Vector Stores for Real-time Community Question Answering in Industry [17.291995915394097]
ComRAGはリアルタイム産業用CQAのための検索拡張生成フレームワークである。
これは、検索、生成、効率的な記憶のために設計されたセントロイドベースのメモリ機構を介して、静的な知識と動的に歴史的なQAペアを統合する。
論文 参考訳(メタデータ) (2025-06-26T08:48:16Z) - Information Retrieval Induced Safety Degradation in AI Agents [52.15553901577888]
本研究では,検索アクセスの拡大がモデル信頼性,バイアス伝搬,有害コンテンツ生成に与える影響について検討した。
整列 LLM 上に構築された検索可能なエージェントは、検索なしでの無検閲モデルよりも安全でない振る舞いをすることが多い。
これらの発見は、検索可能でますます自律的なAIシステムの公正性と信頼性を確保するための堅牢な緩和戦略の必要性を浮き彫りにしている。
論文 参考訳(メタデータ) (2025-05-20T11:21:40Z) - DO-RAG: A Domain-Specific QA Framework Using Knowledge Graph-Enhanced Retrieval-Augmented Generation [4.113142669523488]
ドメイン固有のQAシステムは、生成頻度を必要とするが、構造化専門家の知識に基づく高い事実精度を必要とする。
本稿では,マルチレベル知識グラフ構築と意味ベクトル検索を統合した,スケーラブルでカスタマイズ可能なハイブリッドQAフレームワークであるDO-RAGを提案する。
論文 参考訳(メタデータ) (2025-05-17T06:40:17Z) - T2V-OptJail: Discrete Prompt Optimization for Text-to-Video Jailbreak Attacks [67.91652526657599]
我々は、T2Vジェイルブレイク攻撃を離散最適化問題として定式化し、T2V-OptJailと呼ばれる共同目的ベース最適化フレームワークを提案する。
いくつかのT2Vモデルに対して大規模な実験を行い、オープンソースモデルと実際の商用クローズドソースモデルの両方をカバーする。
提案手法は,攻撃成功率の観点から既存手法よりも11.4%,10.0%向上する。
論文 参考訳(メタデータ) (2025-05-10T16:04:52Z) - Retrieval is Not Enough: Enhancing RAG Reasoning through Test-Time Critique and Optimization [58.390885294401066]
Retrieval-augmented Generation (RAG) は知識基底型大規模言語モデル(LLM)を実現するためのパラダイムとして広く採用されている。
RAGパイプラインは、モデル推論が得られた証拠と整合性を維持するのに失敗することが多く、事実上の矛盾や否定的な結論につながる。
批判駆動アライメント(CDA)に基づく新しい反復的枠組みであるAlignRAGを提案する。
AlignRAG-autoは、動的に洗練を終了し、批判的な反復回数を事前に指定する必要がなくなる自律的な変種である。
論文 参考訳(メタデータ) (2025-04-21T04:56:47Z) - MES-RAG: Bringing Multi-modal, Entity-Storage, and Secure Enhancements to RAG [65.0423152595537]
本稿では,エンティティ固有のクエリ処理を強化し,正確でセキュアで一貫した応答を提供するMES-RAGを提案する。
MES-RAGは、データアクセスの前に保護を適用してシステムの整合性を確保するための積極的なセキュリティ対策を導入している。
実験の結果,MES-RAGは精度とリコールの両方を著しく改善し,質問応答の安全性と有用性を向上する効果が示された。
論文 参考訳(メタデータ) (2025-03-17T08:09:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。