論文の概要: Multi-Field Hybrid Retrieval-Augmented Generation for Maritime Accident Root Cause Analysis
- arxiv url: http://arxiv.org/abs/2606.13249v1
- Date: Thu, 11 Jun 2026 12:05:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-12 15:55:27.774471
- Title: Multi-Field Hybrid Retrieval-Augmented Generation for Maritime Accident Root Cause Analysis
- Title(参考訳): マルチフィールドハイブリッド検索による海事事故根本原因解析
- Authors: Seongjin Kim, Sungil Kim,
- Abstract要約: 本稿では、自動根本原因分析(RCA)のためのマルチフィールドハイブリッド検索拡張生成(RAG)フレームワークを提案する。
我々は生の偏見を「入射カード」の構造的知識基盤に変換する
我々の検索戦略は、相互ランクフュージョン(RRF)を介してスパースと高密度ランクを融合する、フィールド対応ハイブリッドアプローチを採用している。
- 参考スコア(独自算出の注目度): 4.375849701845208
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Maritime accident adjudication reports contain critical tribunal findings for root cause analysis (RCA), yet retrieving relevant precedents and drafting consistent reports from decades of records remains labor-intensive. This paper proposes a multi-field hybrid retrieval-augmented generation (RAG) framework for automated maritime RCA, utilizing a comprehensive dataset of 13,329 Korea Maritime Safety Tribunal (KMST) reports (1971-2025). We transform raw adjudications into a structured knowledge base of "incident cards", indexing three distinct fields-Summary, Causes, and Disposition-alongside a hierarchical L1/L2 cause taxonomy. Our retrieval strategy employs a field-aware hybrid approach, fusing sparse and dense rankings via Reciprocal Rank Fusion (RRF). Given the lack of large-scale expert relevance labels, we evaluate retrieval performance using ceiling-normalized recall and nDCG based on a metadata-derived proxy relevance score. Experimental results demonstrate that our proposed retrieval significantly outperforms baseline methods, improving NormRecall@100 from 0.18 to 0.55. Furthermore, grounding the generator on the retrieved precedents enhances RCA generation quality over an LLM-only baseline, increasing the LLM-as-a-judge score from 3.34 to 3.72. These findings suggest that field-aware RAG can substantially streamline maritime safety investigation workflows by enabling faster precedent search and more consistent, evidence-based RCA drafting.
- Abstract(参考訳): 海事事故の判決報告には根本原因分析(RCA)に関する重要な裁判結果が含まれているが、関連する前例を検索し、何十年もの記録から一貫した報告書を起草することは労働集約的である。
本稿では, 韓国海事安全裁判所(KMST)の総合的データセット(1971-2025)を用いて, 自動海事RCAのためのマルチフィールドハイブリッド検索拡張生成(RAG)フレームワークを提案する。
我々は生の述語を「事故カード」の構造的知識ベースに変換し、要約、原因、配置の3つの異なる分野を索引付け、階層的なL1/L2が分類の原因となる。
我々の検索戦略は、相互ランクフュージョン(RRF)を介してスパースと高密度ランクを融合する、フィールド対応ハイブリッドアプローチを採用している。
大規模な専門家関連ラベルが欠如していることを踏まえ, メタデータ由来のプロキシ関連スコアに基づいて, 天井正規化リコールとnDCGを用いた検索性能の評価を行った。
実験の結果,提案手法はベースライン法よりも優れ,NormRecall@100を0.18から0.55に改善した。
さらに、回収した前例に基づいて発電機を接地することで、LCMのみのベースライン上でのRCA生成品質が向上し、LSM-as-a-judgeスコアが3.34から3.72に向上する。
これらの結果から,現場対応RAGはより高速な前例検索とより一貫性のある証拠に基づくRCA起草を可能にし,海洋安全調査のワークフローを大幅に効率化できる可能性が示唆された。
関連論文リスト
- MARQUIS: A Three-Stage Pipeline for Video Retrieval-Augmented Generation [64.33427079838602]
ビデオからの検索強化生成は、大規模なコーパスから関連するオーディオ視覚的証拠を検索し、一貫性のある属性付きテキストに合成するシステムを必要とする。
MARQUIS:クエリ拡張、融合、再ランク付けを通じて、これらの制限に対処する3段階のパイプライン。
記事生成において、ITER-QA-BASEはCAGベースライン平均スコアを3.09から3.83に改善し、MARQUIS-RLMは3.30の人間スコアと非QAシステムの中で最も強い引用リコールを達成する。
論文 参考訳(メタデータ) (2026-05-17T20:19:04Z) - Beyond Relevance: On the Relationship Between Retrieval and RAG Information Coverage [89.58253972744531]
Retrieval-augmented Generation (RAG) システムは、文書検索と生成モデルを組み合わせて、レポート生成のような複雑な情報を求める課題に対処する。
我々は,上流の検索指標が,最終生成応答の情報カバレッジの信頼性の高い早期指標として機能するかどうかを検討する。
本研究は,トピックとシステムレベルの両方で生成した応答におけるカバレッジベース検索指標とナゲットカバレッジとの間に強い相関関係を示した。
論文 参考訳(メタデータ) (2026-03-09T18:20:20Z) - SRR-Judge: Step-Level Rating and Refinement for Enhancing Search-Integrated Reasoning in Search Agents [30.92763154920672]
SRR-Judgeは、推論と探索行動の信頼性の高い段階評価のためのフレームワークである。
SRR-Judgeは、探索積分推論のためのきめ細かいガイダンスを提供し、効率的な後トレーニングアノテーションを可能にする。
SRR-Judgeは、DeepSeek-V3.1のようなより大きなモデルよりも信頼性の高いステップレベルの評価を提供する。
論文 参考訳(メタデータ) (2026-02-08T02:07:41Z) - Reliability by design: quantifying and eliminating fabrication risk in LLMs. From generative to consultative AI: a comparative analysis in the legal domain and lessons for high-stakes knowledge bases [0.0]
本稿では,幻覚を減らし,大規模言語モデルを高額な法的作業に信頼性を持たせる方法について検討する。
1)独立した生成モデル(創造的オラクル)、(2)基本的な検索強化システム(専門的アーキビスト)、(3)高度なエンドツーエンド最適化RAGシステム(厳密なアーキビスト)の3つのAIパラダイムを区別する。
論文 参考訳(メタデータ) (2026-01-21T21:26:42Z) - Chunking, Retrieval, and Re-ranking: An Empirical Evaluation of RAG Architectures for Policy Document Question Answering [0.0]
大規模言語モデル(LLM)の公衆衛生政策分野への統合は、疾病管理予防センター(CDC)などの機関が管理する規制ガイダンスの膨大なリポジトリをナビゲートするための変革的なアプローチを提供する。
LLMが幻覚を発生させることの正当性は、情報整合性が不可能なハイテイク環境において、これらの技術を採用する上で重要な障壁となる。
この経験的評価は、信頼できる文書コンテキストにおける生成出力を基盤として、これらのリスクを軽減するために、検索型拡張生成(RAG)アーキテクチャの有効性を探求するものである。
論文 参考訳(メタデータ) (2026-01-21T20:52:48Z) - Eigen-1: Adaptive Multi-Agent Refinement with Monitor-Based RAG for Scientific Reasoning [53.45095336430027]
暗黙的な検索と構造化された協調を組み合わせた統合フレームワークを開発する。
Humanity's Last Exam (HLE) Bio/Chem Goldでは,48.3%の精度を実現している。
SuperGPQAとTRQAの結果はドメイン間の堅牢性を確認した。
論文 参考訳(メタデータ) (2025-09-25T14:05:55Z) - Question Decomposition for Retrieval-Augmented Generation [2.6409776648054764]
本稿では疑問分解をサブクエストに組み込んだRAGパイプラインを提案する。
補間的な文書を効果的に組み立てる一方で、再ランク付けによってノイズが減少することを示す。
再ランク自体は標準的なものであるが、LLMによる質問分解と既製のクロスエンコーダのペアリングは、マルチホップ質問の検索ギャップを橋渡しすることを示す。
論文 参考訳(メタデータ) (2025-07-01T01:01:54Z) - Chain-of-Retrieval Augmented Generation [91.02950964802454]
本稿では,o1-like RAGモデルを学習し,最終回答を生成する前に段階的に関連情報を抽出・推論する手法を提案する。
提案手法であるCoRAGは,進化状態に基づいて動的にクエリを再構成する。
論文 参考訳(メタデータ) (2025-01-24T09:12:52Z) - Sequencing Matters: A Generate-Retrieve-Generate Model for Building
Conversational Agents [9.191944519634111]
Georgetown InfoSense GroupはTREC iKAT 2023の課題を解決するために活動している。
提案手法は, 各カット数, 総合成功率において, nDCG において高い性能を示した。
我々のソリューションは、初期回答にLarge Language Models (LLMs) を用いること、BM25による回答基盤、ロジスティック回帰による通過品質フィルタリング、LLMによる回答生成である。
論文 参考訳(メタデータ) (2023-11-16T02:37:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。