論文の概要: Reducing Hallucinations in LLM-based Scientific Literature Analysis Using Peer Context Outlier Detection
- arxiv url: http://arxiv.org/abs/2604.01461v1
- Date: Wed, 01 Apr 2026 23:15:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-03 14:21:10.098518
- Title: Reducing Hallucinations in LLM-based Scientific Literature Analysis Using Peer Context Outlier Detection
- Title(参考訳): Peer Context Outlier Detection を用いたLLMによる科学文献分析における幻覚の低減
- Authors: Daniel Xie, Maxwell J. Jacobson, Adil Wazeer, Haiyan Wang, Xinghang Zhang, Yexiang Xue,
- Abstract要約: 本稿では,文書間の関係を利用して抽出精度を向上させる手法であるPer Context Outlier Detection (P-COD)を提案する。
抽出したデータをコーパス内の検証されたピア情報と比較することにより、信頼性スコアの調整と、専門家レビューのための低信頼度結果のフラグ付けを行う。
実験では,6つの領域にわたる異常検出の精度を最大98%向上し,幻覚を低減し,自動システムの信頼性を高め,研究者があいまいなケースに集中できることを実証した。
- 参考スコア(独自算出の注目度): 15.38900394412587
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Reducing hallucinations in Large Language Models (LLMs) is essential for improving the accuracy of data extraction from large text corpora. Current methods, like prompt engineering and chain-of-thought prompting, focus on individual documents but fail to consider relationships across a corpus. This paper introduces Peer Context Outlier Detection (P-COD), a novel approach that uses the relationships between documents to improve extraction accuracy. Our application domain is in scientific literature summarization, where papers with similar experiment settings should draw similar conclusions. By comparing extracted data to validated peer information within the corpus, we adjust confidence scores and flag low-confidence results for expert review. High-confidence results, supported by peer validation, are considered reliable. Our experiments demonstrate up to 98% precision in outlier detection across 6 domains of science, demonstrating that our design reduces hallucinations, enhances trust in automated systems, and allows researchers to focus on ambiguous cases, streamlining the data extraction workflows.
- Abstract(参考訳): 大規模言語モデル(LLM)における幻覚の低減は,大規模テキストコーパスからのデータの抽出精度の向上に不可欠である。
プロンプトエンジニアリングやチェーン・オブ・シークレット・プロンプトのような現在の手法は、個々のドキュメントにフォーカスするが、コーパス全体の関係を考慮できない。
本稿では,文書間の関係を利用して抽出精度を向上させる手法であるPer Context Outlier Detection (P-COD)を提案する。
我々の応用分野は、科学的文献の要約であり、同様の実験条件を持つ論文は、同様の結論を導出すべきである。
抽出したデータをコーパス内の検証されたピア情報と比較することにより、信頼性スコアの調整と、専門家レビューのための低信頼度結果のフラグ付けを行う。
ピア検証によって支持される高信頼度結果は信頼性が高いと考えられる。
実験では,6つの領域にわたる異常検出の精度が最大98%向上し,幻覚を低減し,自動システムの信頼性を高め,研究者があいまいなケースに集中できるようにし,データ抽出ワークフローの合理化を可能にした。
関連論文リスト
- Context Selection for Hypothesis and Statistical Evidence Extraction from Full-Text Scientific Articles [7.537972017257894]
論文の要約における一次発見の文が、論文本体の対応する仮説文に関連付けられている、逐次全文抽出設定について検討する。
対象のコンテキスト選択は、全文プロンプトに対する仮説抽出を一貫して改善する。
オラクルの段落でさえ、パフォーマンスは穏やかであり、ハイブリッドな数値-テクスチュアルステートメントを扱う際に、永続的な抽出子制限を示す。
論文 参考訳(メタデータ) (2026-03-22T12:28:21Z) - Leveraging LLM Parametric Knowledge for Fact Checking without Retrieval [60.25608870901428]
信頼性は、大規模言語モデル(LLM)上に構築されたエージェントAIシステムの中核研究課題である
本研究では,任意の自然言語クレームの検証に焦点をあて,検索なしで事実チェックを行うタスクを提案する。
論文 参考訳(メタデータ) (2026-03-05T18:42:51Z) - CiteAudit: You Cited It, But Did You Read It? A Benchmark for Verifying Scientific References in the LLM Era [51.63024682584688]
大規模言語モデル (LLM) は新たなリスクを導入している。
本稿では,科学文献における幻覚的引用のための総合的なベンチマークおよび検出フレームワークについて紹介する。
我々のフレームワークは、精度と解釈可能性の両方において、先行手法を著しく上回っている。
論文 参考訳(メタデータ) (2026-02-26T19:17:39Z) - PaperAudit-Bench: Benchmarking Error Detection in Research Papers for Critical Automated Peer Review [54.141490756509306]
本稿では、エラーデータセットであるPaperAudit-Datasetと、自動レビューフレームワークであるPaperAudit-Reviewの2つのコンポーネントからなるPaperAudit-Benchを紹介する。
PaperAudit-Benchの実験では、モデルと検出深さの誤差検出可能性に大きなばらつきが示された。
本研究では,SFTおよびRLによる軽量LLM検出器のトレーニングをサポートし,計算コストの削減による効率的な誤り検出を実現する。
論文 参考訳(メタデータ) (2026-01-07T04:26:12Z) - DeepSynth-Eval: Objectively Evaluating Information Consolidation in Deep Survey Writing [53.85037373860246]
本稿では,情報統合能力を客観的に評価するためのベンチマークであるDeep Synth-Evalを紹介する。
一般チェックリスト(実例)と制約チェックリスト(構造体)を用いたきめ細かい評価プロトコルを提案する。
その結果,エージェント型プラン・アンド・ライトは単ターン生成よりも大幅に優れていた。
論文 参考訳(メタデータ) (2026-01-07T03:07:52Z) - Improved Evidence Extraction for Document Inconsistency Detection with LLMs [10.610567456326235]
本稿では,新しい包括的エビデンス抽出指標と制約付きフィルタリングによる再試行フレームワークを提案する。
有望な実験結果で私たちの主張を支持します。
論文 参考訳(メタデータ) (2026-01-06T00:58:20Z) - Human Texts Are Outliers: Detecting LLM-generated Texts via Out-of-distribution Detection [71.59834293521074]
我々は,人間によるテキストと機械によるテキストを区別する枠組みを開発した。
提案手法は,DeepFakeデータセット上で98.3%のAUROCとAUPRを8.9%のFPR95で達成する。
コード、事前トレーニングされたウェイト、デモがリリースされる。
論文 参考訳(メタデータ) (2025-10-07T08:14:45Z) - Making Document-Level Information Extraction Right for the Right Reasons [19.00249049142611]
文書レベルの情報抽出は、情報が必ずしも1つの文でローカライズされないアプリケーションと互換性のある柔軟なフレームワークである。
この研究は、文書レベルのニューラルモデルが複雑なテキストから正しい推論を行い、それらの推論を監査可能な方法で確実にする方法を研究する。
論文 参考訳(メタデータ) (2021-10-14T19:52:47Z) - SAIS: Supervising and Augmenting Intermediate Steps for Document-Level
Relation Extraction [51.27558374091491]
本稿では,関係抽出のための中間ステップ(SAIS)を監督し,拡張することにより,関連コンテキストやエンティティタイプをキャプチャするモデルを明示的に教えることを提案する。
そこで本提案手法は,より効果的な管理を行うため,より優れた品質の関係を抽出するだけでなく,それに対応する証拠をより正確に抽出する。
論文 参考訳(メタデータ) (2021-09-24T17:37:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。