論文の概要: Evaluating the Reliability of Digital Forensic Evidence Discovered by Large Language Model: A Case Study
- arxiv url: http://arxiv.org/abs/2602.20202v1
- Date: Sun, 22 Feb 2026 18:20:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-25 17:34:53.46222
- Title: Evaluating the Reliability of Digital Forensic Evidence Discovered by Large Language Model: A Case Study
- Title(参考訳): 大規模言語モデルによるディジタル法医学的証拠の信頼性評価 : 事例研究
- Authors: Jeel Piyushkumar Khatiwala, Daniel Kwaku Ntiamoah Addai, Weifeng Xu,
- Abstract要約: 本稿では,法医学的アーティファクト抽出の自動化,大規模言語モデル (LLM) 解析によるデータの洗練,およびDigital Forensic Knowledge Graph (DFKG) を用いた結果の検証を行う構造化フレームワークを提案する。
61のアプリケーション、2,864のデータベース、5,870のテーブルを含む13GBの法医学画像データセットで評価した。
ケーススタディでは、フレームワークの有効性、アーティファクト抽出における95%以上の精度、チェーン・オブ・カストディの強い支持、法医学的関係における堅牢な文脈整合性を示す。
- 参考スコア(独自算出の注目度): 1.7102309907119588
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The growing reliance on AI-identified digital evidence raises significant concerns about its reliability, particularly as large language models (LLMs) are increasingly integrated into forensic investigations. This paper proposes a structured framework that automates forensic artifact extraction, refines data through LLM-driven analysis, and validates results using a Digital Forensic Knowledge Graph (DFKG). Evaluated on a 13 GB forensic image dataset containing 61 applications, 2,864 databases, and 5,870 tables, the framework ensures artifact traceability and evidentiary consistency through deterministic Unique Identifiers (UIDs) and forensic cross-referencing. We propose this methodology to address challenges in ensuring the credibility and forensic integrity of AI-identified evidence, reducing classification errors, and advancing scalable, auditable methodologies. A comprehensive case study on this dataset demonstrates the framework's effectiveness, achieving over 95 percent accuracy in artifact extraction, strong support of chain-of-custody adherence, and robust contextual consistency in forensic relationships. Key results validate the framework's ability to enhance reliability, reduce errors, and establish a legally sound paradigm for AI-assisted digital forensics.
- Abstract(参考訳): AIを識別するデジタルエビデンスへの依存の高まりは、その信頼性に関する大きな懸念を生じさせ、特に大規模言語モデル(LLM)が法医学的な調査にますます統合されている。
本稿では,法医学的アーティファクト抽出の自動化,LLMによる分析によるデータの洗練,およびDigital Forensic Knowledge Graph (DFKG) を用いた結果の検証を行う構造化フレームワークを提案する。
61のアプリケーション、2,864のデータベース、5,870のテーブルを含む13GBの法医学画像データセットに基づいて評価されたこのフレームワークは、決定論的Unique Identifier(UID)と法医学的相互参照を通じて、アーティファクトのトレーサビリティと明確な一貫性を保証する。
本稿では,AI識別された証拠の信頼性と法医学的整合性の確保,分類誤りの低減,拡張性のある監査可能な方法論の進展といった課題に対処する手法を提案する。
このデータセットに関する包括的なケーススタディは、このフレームワークの有効性を示し、アーティファクト抽出における95%以上の精度、チェーン・オブ・カストディ・アテンデンスに対する強力なサポート、法医学的関係における堅牢なコンテキスト整合性を実現している。
主要な結果は、信頼性を高め、エラーを低減し、AI支援デジタル法医学の法的に健全なパラダイムを確立するフレームワークの能力を検証することである。
関連論文リスト
- MERMAID: Memory-Enhanced Retrieval and Reasoning with Multi-Agent Iterative Knowledge Grounding for Veracity Assessment [8.649665560258702]
本稿では,検索処理と推論処理を密に結合するメモリ強調精度評価フレームワークを提案する。
MERMAIDはエージェント駆動検索、構造化知識表現、永続メモリモジュールをReason-Actionスタイルの反復プロセスに統合する。
我々は、3つのファクトチェックベンチマークと2つのクレーム検証データセットに対して複数のLLMを用いてMERMAIDを評価する。
論文 参考訳(メタデータ) (2026-01-29T22:12:33Z) - REVEAL: Reasoning-enhanced Forensic Evidence Analysis for Explainable AI-generated Image Detection [30.963994372913092]
我々は、AI生成画像検出のための最初の推論強化マルチモーダルベンチマークである textbfREVEAL-Bench を紹介する。
筆者らのフレームワークは,検出を専門家による新しい強化学習と統合する。
REVEALは検出精度、説明忠実度、堅牢なクロスモデル一般化を著しく向上させる。
論文 参考訳(メタデータ) (2025-11-28T13:11:08Z) - AutoMalDesc: Large-Scale Script Analysis for Cyber Threat Research [81.04845910798387]
脅威検出のための自然言語の説明を生成することは、サイバーセキュリティ研究において未解決の問題である。
本稿では,大規模に独立して動作する自動静的解析要約フレームワークAutoMalDescを紹介する。
アノテーション付きシード(0.9K)データセットや方法論,評価フレームワークなど,100万以上のスクリプトサンプルの完全なデータセットを公開しています。
論文 参考訳(メタデータ) (2025-11-17T13:05:25Z) - AI-Generated Image Detection: An Empirical Study and Future Research Directions [6.891145787446519]
AIが生成するメディア、特にディープフェイクによって引き起こされる脅威は、鑑識にとって重大な課題を提起している。
いくつかの法医学的手法が提案され、それらは3つの重大なギャップに悩まされている。
これらの制限は、公正な比較、曖昧な真の堅牢性、およびセキュリティクリティカルなアプリケーションのデプロイメントを制限する。
論文 参考訳(メタデータ) (2025-11-04T18:13:48Z) - ReliabilityRAG: Effective and Provably Robust Defense for RAG-based Web-Search [69.60882125603133]
本稿では,検索した文書の信頼性情報を明確に活用する,敵対的堅牢性のためのフレームワークであるReliabilityRAGを提案する。
我々の研究は、RAGの回収されたコーパスの腐敗に対するより効果的で確実に堅牢な防御に向けた重要な一歩である。
論文 参考訳(メタデータ) (2025-09-27T22:36:42Z) - ForensicsData: A Digital Forensics Dataset for Large Language Models [0.0]
ForensicsDataは、実際のマルウェア分析レポートから得られた広範囲なQ-C-Aデータセットである。
ユニークなワークフローを使用してデータセットを生成し、構造化されたデータを抽出した。
Gemini 2 Flashは、生成されたコンテンツを法医学用語と整合させる上で、最高のパフォーマンスを示した。
論文 参考訳(メタデータ) (2025-08-31T19:58:24Z) - Propose and Rectify: A Forensics-Driven MLLM Framework for Image Manipulation Localization [49.71303998618939]
本稿では,意味論的推論と法科学的な分析を橋渡しするPropose-Rectifyフレームワークを提案する。
提案手法は,具体的技術実証により,初期セマンティックな提案が体系的に検証され,拡張されることを保証し,包括的検出精度と局所化精度を実現する。
論文 参考訳(メタデータ) (2025-08-25T12:43:53Z) - Deep Learning Models for Robust Facial Liveness Detection [56.08694048252482]
本研究では,現代のアンチスプーフィング手法の欠陥に対処する新しい深層学習モデルを用いて,ロバストな解を提案する。
テクスチャ解析と実際の人間の特性に関連する反射特性を革新的に統合することにより、我々のモデルは、顕著な精度でレプリカと真の存在を区別する。
論文 参考訳(メタデータ) (2025-08-12T17:19:20Z) - Synchronous Faithfulness Monitoring for Trustworthy Retrieval-Augmented Generation [96.78845113346809]
Retrieval-augmented Language Model (RALMs) は、知識集約型タスクにおいて、高い性能と幅広い適用性を示している。
本稿では,非偽文の検出に微細な復号力学を利用する軽量モニタであるSynCheckを提案する。
また、長文検索拡張生成のためのビームサーチによって導かれる忠実度指向の復号アルゴリズムであるFODを導入する。
論文 参考訳(メタデータ) (2024-06-19T16:42:57Z) - Forensicability Assessment of Questioned Images in Recapturing Detection [78.45849869266834]
質問されたサンプルの鑑定可能性の定量化のための鑑定可能性評価ネットワークを提案する。
低フォレンシビリティサンプルは、実際の再適応検出プロセスの前に拒絶され、再適応システムの効率が向上する。
我々は、トレーニングされたFANetと、アンチ・スプーフィングと再適応された文書検出タスクの実践的な再適応検出スキームを統合する。
論文 参考訳(メタデータ) (2022-09-05T12:26:01Z) - Hierarchical Decision Ensembles- An inferential framework for uncertain
Human-AI collaboration in forensic examinations [0.8122270502556371]
モデルとその出力を評価するための推論フレームワークを提案する。
このフレームワークは、ドメイン固有の知識と予測モデル結果のギャップを埋めることによって、法医学の専門家への信頼を校正するように設計されている。
論文 参考訳(メタデータ) (2021-10-31T08:07:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。