論文の概要: Scout: Leveraging Large Language Models for Rapid Digital Evidence Discovery
- arxiv url: http://arxiv.org/abs/2507.18478v1
- Date: Thu, 24 Jul 2025 14:54:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-25 15:10:43.825578
- Title: Scout: Leveraging Large Language Models for Rapid Digital Evidence Discovery
- Title(参考訳): Scout: 迅速なディジタルエビデンス発見のために大規模な言語モデルを活用する
- Authors: Shariq Murtuza,
- Abstract要約: この研究は、予備的な証拠処理を行うデジタル法医学フレームワークであるScoutを提示する。
Scoutはテキストベースの大規模言語モデルを採用しており、テキスト情報で簡単にファイルを処理できる。
スカウトは調査官にとって潜在的に有望な証拠ファイルを特定し、認識することができた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent technological advancements and the prevalence of technology in day to day activities have caused a major increase in the likelihood of the involvement of digital evidence in more and more legal investigations. Consumer-grade hardware is growing more powerful, with expanding memory and storage sizes and enhanced processor capabilities. Forensics investigators often have to sift through gigabytes of data during an ongoing investigation making the process tedious. Memory forensics, disk analysis all are well supported by state of the art tools that significantly lower the effort required to be put in by a forensic investigator by providing string searches, analyzing images file etc. During the course of the investigation a lot of false positives are identified that need to be lowered. This work presents Scout, a digital forensics framework that performs preliminary evidence processing and prioritizing using large language models. Scout deploys foundational language models to identify relevant artifacts from a large number of potential evidence files (disk images, captured network packets, memory dumps etc.) which would have taken longer to get identified. Scout employs text based large language models can easily process files with textual information. For the forensic analysis of multimedia files like audio, image, video, office documents etc. multimodal models are employed by Scout. Scout was able to identify and realize the evidence file that were of potential interest for the investigator.
- Abstract(参考訳): 近年の技術進歩と日々の活動における技術の普及は、ますます法的調査にデジタル証拠が関与する可能性を大きく高めた。
コンシューマグレードのハードウェアは、メモリとストレージのサイズを拡大し、プロセッサ機能を強化して、より強力に成長している。
法医学調査員は、現在進行中の調査中に、しばしばギガバイトのデータを盗む必要があるため、このプロセスは面倒である。
メモリフォサイクス、ディスク分析はすべて最先端のツールによって十分にサポートされており、文字列検索、画像ファイルの解析などを提供することで、法医学研究者が実施する労力を大幅に削減する。
調査の過程では、多くの偽陽性が特定され、それを下げる必要がある。
この研究は、大規模な言語モデルを用いて予備的なエビデンス処理と優先順位付けを行うデジタル法医学フレームワークであるScoutを提示する。
Scoutは基本的な言語モデルをデプロイし、多くの潜在的なエビデンスファイル(ディスクイメージ、キャプチャされたネットワークパケット、メモリダンプなど)から関連するアーティファクトを特定する。
Scoutはテキストベースの大規模言語モデルを採用しており、テキスト情報で簡単にファイルを処理できる。
音声、画像、ビデオ、オフィス文書などのマルチメディアファイルの法医学的解析のために、マルチモーダルモデルがスカウトによって採用されている。
スカウトは調査官にとって潜在的に有望な証拠ファイルを特定し、認識することができた。
関連論文リスト
- DFIR-Metric: A Benchmark Dataset for Evaluating Large Language Models in Digital Forensics and Incident Response [0.0]
大規模言語モデル(LLM)は、デジタルフォサイシクスとインシデント応答(DFIR)に新たな機会を提供する
LLMは、ログ分析やメモリなどのDFIRタスクに新たな機会を提供するが、エラーや幻覚への感受性は、高い文脈で懸念を引き起こす。
本稿では,DFIR領域と実用領域の双方にわたるLSMを評価するベンチマークであるDFIR-Metricを提案する。
論文 参考訳(メタデータ) (2025-05-26T13:35:37Z) - Tevatron 2.0: Unified Document Retrieval Toolkit across Scale, Language, and Modality [74.59049806800176]
このデモペーパーでは、Tevatronツールキットの重要な特徴、学界と産業の橋渡しについて取り上げている。
強い多言語・多モーダルな有効性を実現するための密集型検索器について紹介する。
私たちはOmniEmbedもリリースしています。私たちの知る限り、テキスト、画像ドキュメント、ビデオ、オーディオ検索を統一する最初の埋め込みモデルです。
論文 参考訳(メタデータ) (2025-05-05T08:52:49Z) - Forensics-Bench: A Comprehensive Forgery Detection Benchmark Suite for Large Vision Language Models [53.55128042938329]
Forensics-Benchは、新しい偽検出評価ベンチマークスイートである。
63,292件の厳密にキュレートされたマルチチョイスの視覚的質問からなり、112件の独特な偽造検出をカバーしている。
GPT-4o, Gemini 1.5 Pro, Claude 3.5 Sonnetの22のオープンソースLVLMと3つのプロプライエタリモデルについて徹底的な評価を行った。
論文 参考訳(メタデータ) (2025-03-19T09:21:44Z) - Information-Guided Identification of Training Data Imprint in (Proprietary) Large Language Models [52.439289085318634]
情報誘導プローブを用いて,プロプライエタリな大規模言語モデル (LLM) で知られているトレーニングデータを識別する方法を示す。
我々の研究は、重要な観察の上に成り立っている: 高次数テキストパスは、暗記プローブにとって良い検索材料である。
論文 参考訳(メタデータ) (2025-03-15T10:19:15Z) - ForgerySleuth: Empowering Multimodal Large Language Models for Image Manipulation Detection [107.86009509291581]
我々はForgerySleuthを提案し、包括的ヒント融合を行い、改ざんされた領域を示すセグメンテーション出力を生成する。
ForgeryAnalysisの有効性を実証し,ForgerySleuthが既存手法の堅牢性,一般化性,説明可能性において著しく優れていたことを示す。
論文 参考訳(メタデータ) (2024-11-29T04:35:18Z) - Multimodal Misinformation Detection using Large Vision-Language Models [7.505532091249881]
大規模言語モデル(LLM)は、様々なタスクにおいて顕著なパフォーマンスを示している。
誤情報検出の一部として証拠検索を考えるアプローチはほとんどない。
マルチモーダルエビデンス検索のための新しい手法を提案する。
論文 参考訳(メタデータ) (2024-07-19T13:57:11Z) - An Innovative Tool for Uploading/Scraping Large Image Datasets on Social
Networks [9.27070946719462]
我々は、意図的に作成したデジタルツールを用いて、自動化されたアプローチを提案する。
このツールは、画像データセット全体を希望するデジタルプラットフォームに自動的にアップロードし、アップロードされたすべての写真をダウンロードすることができる。
論文 参考訳(メタデータ) (2023-11-01T23:27:37Z) - A Survey on Detection of LLMs-Generated Content [97.87912800179531]
LLMの生成する内容を検出する能力が最重要視されている。
既存の検出戦略とベンチマークの詳細な概要を提供する。
また、様々な攻撃から守るための多面的アプローチの必要性を示唆する。
論文 参考訳(メタデータ) (2023-10-24T09:10:26Z) - Audio Deepfake Attribution: An Initial Dataset and Investigation [41.62487394875349]
我々は、Audio Deepfake Attribution (ADA)と呼ばれるオーディオ生成ツールの属性に対する最初のディープフェイクオーディオデータセットを設計する。
オープンセットオーディオディープフェイク属性(OSADA)のためのクラス・マルチセンター学習(CRML)手法を提案する。
実験の結果,CRML法は実世界のシナリオにおけるオープンセットリスクに効果的に対処できることが示された。
論文 参考訳(メタデータ) (2022-08-21T05:15:40Z) - Automated Artefact Relevancy Determination from Artefact Metadata and
Associated Timeline Events [7.219077740523683]
ケースハンダーで、多年にわたるデジタル法医学的証拠バックログは、世界中の法執行機関で一般的になっている。
これは、デジタル法医学的な調査を必要とするケースが、ケースごとに処理されるデータの量の増加と相まって増え続けているためである。
以前に処理されたデジタル法医学ケースとそれらのコンポーネントのアーティファクト関連性分類を活用することは、自動化された人工知能ベースのエビデンス処理システムのトレーニングの機会を促進することができる。
論文 参考訳(メタデータ) (2020-12-02T14:14:26Z) - MEG: Multi-Evidence GNN for Multimodal Semantic Forensics [28.12652559292884]
フェイクニュースは、画像、テキスト、位置などのモダリティを横断するセマンティックな操作を伴うことが多い。
近年の研究では、画像の再利用という問題に焦点が当てられている。
マルチモーダル・セマンティック・フォサイシクスのための新しいグラフニューラルネットワークモデルを提案する。
論文 参考訳(メタデータ) (2020-11-23T09:01:28Z) - Multi-Modal Video Forensic Platform for Investigating Post-Terrorist
Attack Scenarios [55.82693757287532]
大規模ビデオ分析プラットフォーム(VAP)は、容疑者を特定し証拠を確保するために法執行機関(LEA)を支援する。
本稿では,視覚・音声分析モジュールを統合し,監視カメラからの情報と目撃者からの映像アップロードを融合するビデオ分析プラットフォームを提案する。
論文 参考訳(メタデータ) (2020-04-02T14:29:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。