論文の概要: RADIANT-LLM: an Agentic Retrieval Augmented Generation Framework for Reliable Decision Support in Safety-Critical Nuclear Engineering
- arxiv url: http://arxiv.org/abs/2604.22755v1
- Date: Wed, 04 Mar 2026 01:30:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 02:32:14.151599
- Title: RADIANT-LLM: an Agentic Retrieval Augmented Generation Framework for Reliable Decision Support in Safety-Critical Nuclear Engineering
- Title(参考訳): RADIANT-LLM:安全臨界核工学における信頼性決定支援のためのエージェント検索拡張生成フレームワーク
- Authors: Zavier Ndum Ndum, Jian Tao, John Ford, Mansung Yim, Yang Liu,
- Abstract要約: 本稿では,原子力安全,セキュリティ,安全のためのマルチモーダル検索拡張世代(RAG)フレームワークであるRADIANT-LLMを提案する。
このフレームワークは、マルチモーダル文書の取り込みパイプラインと構造化されたメタデータに富んだ知識ベースをペアにする、ローカルファーストのモデルに依存しないアーキテクチャを使用している。
エージェント層は、ドメイン固有のツールをコーディネートし、前立腺追跡による引用支援応答を強制し、幻覚リスクを低減するためにヒトのループ内バリデーションをサポートする。
- 参考スコア(独自算出の注目度): 6.6611314653117555
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Reliable decision support in nuclear engineering requires traceable, domain-grounded knowledge retrieval, yet safety and risk analysis workflows remain hampered by fragmented documentation and hallucination when use pre-trained large language model (LLM) in specialized nuclear domains. To address these challenges, this paper presents RADIANT-LLM (Retrival-Augumented, Domain-Intelligent Agent for Nuclear Technologies using LLM), a multi-modal retrieval-augmented generation (RAG) framework designed for nuclear safety, security, and safeguards applications. The framework uses a local-first, model-agnostic architecture that pairs a multi-modal document ingestion pipeline with a structured, metadata-rich knowledge base, supporting page- and figure-level retrieval from technical documents. An agentic layer coordinates domain-specific tools, enforces citation-backed responses with provenance tracking, and supports human-in-the-loop validation to reduce hallucination risks. To rigorously evaluate this framework, we develop and apply a suite of domain-aware metrics, including Context Precision (CoP), Hallucination Rate (HR), and Visual Recall (ViR), to expert-curated benchmarks derived from Used Nuclear Fuel Storage Facility design guidance. Across varying knowledge base sizes, CoP and ViR remain within an 85--98\% band, and hallucination rates are substantially lower than those observed in general-purpose deployments. When the same queries are posed to commercial LLM platforms without the RAG layer, hallucinations and citation errors increase markedly. These results indicate that a locally controlled, multi-modal RAG framework with domain-specific retrieval and provenance enforcement is necessary to achieve the factual accuracy, transparency, and auditability that nuclear engineering workflows demand.
- Abstract(参考訳): 原子力工学における信頼性の高い決定支援には、トレース可能なドメインベースの知識検索が必要であるが、特定の核ドメインで事前訓練された大規模言語モデル(LLM)を使用する場合、断片化されたドキュメントと幻覚によって、安全とリスク分析のワークフローが妨げられている。
これらの課題に対処するために, 原子力安全, 安全, 安全のために設計されたマルチモーダル検索強化世代(RAG) フレームワーク RADIANT-LLM (Retrival-Augumented, Domain-Intelligent Agent for Nuclear Technologies using LLM) を提案する。
このフレームワークは、マルチモーダル文書の取り込みパイプラインと構造化されたメタデータに富んだ知識ベースを組み合わせ、技術ドキュメントからのページレベルの検索と数値レベルの検索をサポートする、ローカルファーストのモデルに依存しないアーキテクチャを使用する。
エージェント層は、ドメイン固有のツールをコーディネートし、前立腺追跡による引用支援応答を強制し、幻覚リスクを低減するためにヒトのループ内バリデーションをサポートする。
このフレームワークを厳格に評価するために、使用済み核燃料貯蔵施設の設計指針から得られた専門家によるベンチマークに対して、コンテキスト精度(CoP)、幻覚率(HR)、視覚リコール(ViR)を含む一連のドメイン認識メトリクスを開発し、適用する。
様々な知識ベースサイズにおいて、CoPとViRは85~98%の範囲に留まり、幻覚率は汎用的な展開で見られるものよりもかなり低い。
同じクエリがRAG層を使わずに商用のLLMプラットフォームに提示されると、幻覚と引用エラーが顕著に増加する。
これらの結果は、核工学のワークフローが要求する事実的正確性、透明性、監査性を達成するためには、ドメイン固有検索および証明執行を伴う局所的に制御されたマルチモーダルRAGフレームワークが必要であることを示唆している。
関連論文リスト
- Benchmarking Knowledge-Extraction Attack and Defense on Retrieval-Augmented Generation [50.87199039334856]
Retrieval-Augmented Generation (RAG) は知識集約型アプリケーションの基礎となっている。
近年の研究では、悪意あるクエリによって知識抽出攻撃が機密知識ベースコンテンツを回復できることが示されている。
本稿では,RAGシステムに対する知識抽出攻撃のための最初の体系的ベンチマークを紹介する。
論文 参考訳(メタデータ) (2026-02-10T01:27:46Z) - AgentCPM-Report: Interleaving Drafting and Deepening for Open-Ended Deep Research [85.51475655916026]
AgentCPM-Reportは軽量だが高性能なローカルソリューションで、人間の記述プロセスを反映したフレームワークで構成されている。
我々のフレームワークは、モデルがアウトラインを動的に修正できるWARP(Writeing As Reasoning Policy)を使用している。
DeepResearch Bench、DeepConsult、DeepResearch Gymの実験は、AgentCPM-Reportが主要なクローズドソースシステムより優れていることを示した。
論文 参考訳(メタデータ) (2026-02-06T09:45:04Z) - MiRAGE: A Multiagent Framework for Generating Multimodal Multihop Question-Answer Dataset for RAG Evaluation [0.3499870393443268]
既存のデータセットは一般的なドメインコーパスや純粋にテキスト検索に依存していることが多い。
RAGシステム評価のためのMultiagentフレームワークであるMiRAGEを紹介する。
MiRAGEは、検証済み、ドメイン固有、マルチモーダル、マルチホップ質問応答データセットを生成するために、専門エージェントの群を編成する。
論文 参考訳(メタデータ) (2026-01-21T21:39:09Z) - Towards Verifiably Safe Tool Use for LLM Agents [53.55621104327779]
大規模言語モデル(LLM)ベースのAIエージェントは、データソース、API、検索エンジン、コードサンドボックス、さらにはその他のエージェントなどのツールへのアクセスを可能にすることで、機能を拡張する。
LLMは意図しないツールインタラクションを起動し、機密データを漏洩したり、クリティカルレコードを上書きしたりするリスクを発生させる。
モデルベースセーフガードのようなリスクを軽減するための現在のアプローチは、エージェントの信頼性を高めるが、システムの安全性を保証することはできない。
論文 参考訳(メタデータ) (2026-01-12T21:31:38Z) - RAGalyst: Automated Human-Aligned Agentic Evaluation for Domain-Specific RAG [0.0]
Retrieval-Augmented Generation (RAG) は、LLM(Large Language Models)を実際に証明するための重要な手法である。
既存の評価フレームワークは多くの場合、ドメイン固有のニュアンスをキャプチャできないメトリクスに依存します。
本稿では,RAGalystについて紹介する。RAGalystは,ドメイン固有のRAGシステムの厳密な評価を目的とした,人力による自動エージェントフレームワークである。
論文 参考訳(メタデータ) (2025-11-06T16:22:52Z) - Hallucination-Resistant, Domain-Specific Research Assistant with Self-Evaluation and Vector-Grounded Retrieval [0.0]
RA-FSMはGPTベースの研究アシスタントであり、有限状態制御ループで生成をラップする。
コントローラはスコープ外クエリをフィルタリングし、応答可能性を評価し、質問を分解し、必要なときにのみ検索をトリガーする。
本稿では,フォトニクスのためのシステムを実装し,解析的推論,数値解析,方法論的批判,比較合成,事実抽出,アプリケーション設計の6つのカテゴリで評価する。
論文 参考訳(メタデータ) (2025-09-25T21:35:46Z) - DeepSieve: Information Sieving via LLM-as-a-Knowledge-Router [57.28685457991806]
DeepSieveはエージェントRAGフレームワークで、LLM-as-a-knowledge-routerを介して情報を収集する。
我々の設計はモジュール性、透明性、適応性を重視しており、エージェントシステム設計の最近の進歩を活用している。
論文 参考訳(メタデータ) (2025-07-29T17:55:23Z) - InsightX Agent: An LMM-based Agentic Framework with Integrated Tools for Reliable X-ray NDT Analysis [16.686848727476644]
非破壊試験(NDT)は産業品質保証に不可欠である。
既存のディープラーニングベースのアプローチは、対話性、解釈可能性、そして批判的な自己評価能力に欠けることが多い。
本稿では,信頼性,解釈性,インタラクティブなNDT分析を実現するための新しいLMMベースのエージェントフレームワークであるInsightX Agentを提案する。
論文 参考訳(メタデータ) (2025-07-20T10:23:22Z) - RAGEval: Scenario Specific RAG Evaluation Dataset Generation Framework [66.93260816493553]
本稿では,様々なシナリオにまたがってRAGシステムを評価するためのフレームワークであるRAGvalを紹介する。
事実の正確性に焦点をあてて,完全性,幻覚,不適切性の3つの新しい指標を提案する。
実験結果から, RAGEvalは, 生成した試料の明瞭度, 安全性, 適合性, 豊かさにおいて, ゼロショット法とワンショット法より優れていた。
論文 参考訳(メタデータ) (2024-08-02T13:35:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。