論文の概要: Forensic Implications of Localized AI: Artifact Analysis of Ollama, LM Studio, and llama.cpp
- arxiv url: http://arxiv.org/abs/2603.23996v1
- Date: Wed, 25 Mar 2026 06:51:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-26 21:06:11.169322
- Title: Forensic Implications of Localized AI: Artifact Analysis of Ollama, LM Studio, and llama.cpp
- Title(参考訳): ローカライズドAIの法医学的意味:Ollama, LM Studio, llama.cppのアーティファクト分析
- Authors: Shariq Murtuza,
- Abstract要約: Ollama、LM Studio、llamaなどのローカル言語モデル(LLM)ランナーは、デジタル研究者に新たな課題を提示している。
この研究は、これらの人気のローカルLLMクライアントの体系的、クロスプラットフォームの法医学的分析を提示する。
この発見は、ユーザーのプライバシー、AI関連の証拠の許容性、および反法医学的手法の開発に重大な影響を及ぼす。
- 参考スコア(独自算出の注目度): 1.5229257192293202
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The proliferation of local Large Language Model (LLM) runners, such as Ollama, LM Studio and llama.cpp, presents a new challenge for digital forensics investigators. These tools enable users to deploy powerful AI models in an offline manner, creating a potential evidentiary blind spot for investigators. This work presents a systematic, cross platform forensic analysis of these popular local LLM clients. Through controlled experiments on Windows and Linux operating systems, we acquired and analyzed disk and memory artifacts, documenting installation footprints, configuration files, model caches, prompt histories and network activity. Our experiments uncovered a rich set of previously undocumented artifacts for each software, revealing significant differences in evidence persistence and location based on application architecture. Key findings include the recovery of plaintext prompt histories in structured JSON files, detailed model usage logs and unique file signatures suitable for forensic detection. This research provides a foundational corpus of digital evidence for local LLMs, offering forensic investigators reproducible methodologies, practical triage commands and analyse this new class of software. The findings have critical implications for user privacy, the admissibility of AI-related evidence and the development of anti-forensic techniques.
- Abstract(参考訳): Ollama、LM Studio、llama.cppなどのローカルLarge Language Model (LLM)ランナーの急増は、デジタル法医学研究者にとって新たな課題である。
これらのツールを使うと、ユーザーは強力なAIモデルをオフラインでデプロイできる。
この研究は、これらの人気のローカルLLMクライアントの体系的、クロスプラットフォームの法医学的分析を提示する。
WindowsとLinuxのオペレーティングシステムにおける制御された実験を通じて、ディスクとメモリのアーティファクトを取得し、分析し、インストールのフットプリント、構成ファイル、モデルキャッシュ、プロンプト履歴とネットワークアクティビティを文書化しました。
私たちの実験では、これまで文書化されていなかった、各ソフトウェア用の豊富な成果物を発見し、アプリケーションのアーキテクチャに基づいた証拠の持続性と位置の重大な違いを明らかにしました。
主な発見としては、構造化JSONファイルのプレーンテキストプロンプト履歴の回復、詳細なモデル使用ログ、法医学的検出に適したユニークなファイルシグネチャなどがある。
この研究は、法医学研究者が再現可能な方法論、実用的なトリアージコマンドを提供し、この新しい種類のソフトウェアを解析する、ローカルLLMのデジタルエビデンスの基礎となるコーパスを提供する。
この発見は、ユーザーのプライバシー、AI関連の証拠の許容性、および反法医学的手法の開発に重大な影響を及ぼす。
関連論文リスト
- Code Fingerprints: Disentangled Attribution of LLM-Generated Code [7.515488307576106]
生成したコードに責任を負うソースLLMを決定することを目的とした,モデルレベルのコード属性の問題について検討する。
本稿では、ソース非依存のセマンティック情報とソース-特異なスタイル表現を分離するDisentangled Code Attribution Network (DCAN)を提案する。
4つのプログラミング言語で広く使われている4つの大規模言語モデル(LLM)が生成するコードからなる,最初の大規模ベンチマークデータセットを構築した。
論文 参考訳(メタデータ) (2026-03-04T15:58:36Z) - An Explainable Memory Forensics Approach for Malware Analysis [1.2744523252873352]
メモリフォサイシクス(Memory forensics)は、ランドオフ・ザ・ランドのマルウェアを分析する効果的な方法である。
本稿では,AI支援型メモリフォサイシクス手法を提案する。
提案手法を Windows と Android のマルウェアに適用する。
論文 参考訳(メタデータ) (2026-02-23T13:30:04Z) - ForensicsData: A Digital Forensics Dataset for Large Language Models [0.0]
ForensicsDataは、実際のマルウェア分析レポートから得られた広範囲なQ-C-Aデータセットである。
ユニークなワークフローを使用してデータセットを生成し、構造化されたデータを抽出した。
Gemini 2 Flashは、生成されたコンテンツを法医学用語と整合させる上で、最高のパフォーマンスを示した。
論文 参考訳(メタデータ) (2025-08-31T19:58:24Z) - DFIR-Metric: A Benchmark Dataset for Evaluating Large Language Models in Digital Forensics and Incident Response [0.0]
大規模言語モデル(LLM)は、デジタルフォサイシクスとインシデント応答(DFIR)に新たな機会を提供する
LLMは、ログ分析やメモリなどのDFIRタスクに新たな機会を提供するが、エラーや幻覚への感受性は、高い文脈で懸念を引き起こす。
本稿では,DFIR領域と実用領域の双方にわたるLSMを評価するベンチマークであるDFIR-Metricを提案する。
論文 参考訳(メタデータ) (2025-05-26T13:35:37Z) - Information-Guided Identification of Training Data Imprint in (Proprietary) Large Language Models [52.439289085318634]
情報誘導プローブを用いて,プロプライエタリな大規模言語モデル (LLM) で知られているトレーニングデータを識別する方法を示す。
我々の研究は、重要な観察の上に成り立っている: 高次数テキストパスは、暗記プローブにとって良い検索材料である。
論文 参考訳(メタデータ) (2025-03-15T10:19:15Z) - LLM Inference Unveiled: Survey and Roofline Model Insights [62.92811060490876]
大規模言語モデル(LLM)推論は急速に進化しており、機会と課題のユニークなブレンドを提示している。
本調査は, 研究状況を要約するだけでなく, 屋上モデルに基づく枠組みを導入することによって, 従来の文献レビューから際立っている。
このフレームワークは、ハードウェアデバイスにLSMをデプロイする際のボトルネックを特定し、実用上の問題を明確に理解する。
論文 参考訳(メタデータ) (2024-02-26T07:33:05Z) - Automated Artefact Relevancy Determination from Artefact Metadata and
Associated Timeline Events [7.219077740523683]
ケースハンダーで、多年にわたるデジタル法医学的証拠バックログは、世界中の法執行機関で一般的になっている。
これは、デジタル法医学的な調査を必要とするケースが、ケースごとに処理されるデータの量の増加と相まって増え続けているためである。
以前に処理されたデジタル法医学ケースとそれらのコンポーネントのアーティファクト関連性分類を活用することは、自動化された人工知能ベースのエビデンス処理システムのトレーニングの機会を促進することができる。
論文 参考訳(メタデータ) (2020-12-02T14:14:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。