Fugu-MT 論文翻訳(概要): Do you dare to try Test-Driven Forensics? Increasing Trust in Desktop Forensics with ADARE

論文の概要: Do you dare to try Test-Driven Forensics? Increasing Trust in Desktop Forensics with ADARE

arxiv url: http://arxiv.org/abs/2605.28476v1
Date: Wed, 27 May 2026 13:38:06 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-28 17:38:56.078836
Title: Do you dare to try Test-Driven Forensics? Increasing Trust in Desktop Forensics with ADARE
Title（参考訳）: テスト駆動のForensicsを試してみるべきだろうか? ADAREによるデスクトップのForensicsの信頼度の向上
Authors: Michael Külper, Martin Lambertz, Mariia Rybalka,
Abstract要約: 本稿では,法医学的期待を実行可能な仕様として扱う実践的アプローチとして,テスト駆動型法医学を紹介する。本手法は,仮想マシン上で制御された実験を実行するオープンソースフレームワークであるADAREで実装されている。オートプシーの25バージョンレグレッション調査では、輸出されたレポートの出力に大きく、ほとんど文書化されていない変化が見られる。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Digital forensic relies on validated tools and established procedures, yet the underlying operating systems, applications, and analysis tools evolve rapidly. This evolution can cause artifact behavior and tool outputs to drift, silently degrading repeatability and confidence in long-lived forensic interpretations. We present test-driven forensics, a practical approach that treats forensic expectations as executable specifications: expected artifacts and expected tool outputs are encoded as tests that can be rerun across versions to detect regressions. Crucially, our approach also enables State Transition Testing, validating the system's expected state after each user action rather than only performing post-mortem checks on a final disk image; this supports causal attribution and makes transient behavior testable. We implement the methodology in ADARE, an open-source framework that runs controlled experiments in virtual machines and simulates realistic user activity via computer-vision-guided GUI automation. ADARE includes a companion web platform for sharing experiments, environments, and results to facilitate independent reruns and peer verification. We evaluate ADARE in five case studies spanning artifact research and tool validation. In particular, a 25-version regression study of Autopsy reveals substantial, largely undocumented changes in exported report outputs, demonstrating how executable tests make drift measurable and reproducible at scale.
Abstract（参考訳）: デジタル法医学は検証されたツールと確立された手続きに依存しているが、基盤となるオペレーティングシステム、アプリケーション、分析ツールは急速に進化している。この進化はアーティファクトの振る舞いやツールの出力を漂流させ、長く続く法医学的解釈において、繰り返し可能性と信頼性を静かに劣化させる。予測アーティファクトと期待されるツールアウトプットは、バージョン間で再実行してレグレッションを検出するテストとしてエンコードされる。重要なことに、我々のアプローチはステート遷移テストを可能にし、最終ディスクイメージのモーテムチェックのみを実行するのではなく、ユーザーアクション毎のシステムの期待状態を検証する。本手法は,仮想マシン上で制御された実験を実行し,コンピュータビジョンによるGUI自動化によって現実的なユーザアクティビティをシミュレートするオープンソースフレームワークであるADAREに実装する。 ADAREには、実験、環境、結果を共有して、独立した再実行とピア検証を容易にするWebプラットフォームが含まれている。アーティファクト研究とツール検証を対象とする5つのケーススタディにおいてADAREを評価した。特に、オートプシーの25バージョン回帰調査では、輸出されたレポート出力に大きく、ほとんど文書化されていない変化が見られ、実行可能テストが大規模にドリフトを計測可能で再現可能であることを実証している。

関連論文リスト

Claw AI Lab: An Autonomous Multi-Agent Research Team [73.07229229907435]
今回紹介するClaw AI Labは,ラボネイティブな自律型研究プラットフォームである。 1つのエージェントや固定されたシリアルワークフローを中心にシステムを集中するのではなく、ユーザーは1つのプロンプトから完全な研究チームをインスタンス化できる。 Claw-Code Harnessはローカル、データセット、チェックポイントを接続して実行可能な実験を行い、実行成果物を研究ループにフィードバックする。
論文参考訳（メタデータ） (2026-05-21T16:02:53Z)
Sibyl-AutoResearch: Autonomous Research Needs Self-Evolving Trial-and-Error Harnesses, Not Paper Generators [37.075000666622074]
我々はScientific Trial-and-Error Harnessesを中心に構築された自己進化型AutoResearchフレームワークであるSibyl-AutoResearchを紹介した。ハーネスは、エージェントが有界なトライアルを実行し、肯定的な結果と否定的な結果を保持し、後続の計画、検証、クレームスコープ、スケジューリング、批判、執筆、修復に教訓を導いてくれる。 SIBYLはファイルベースの自律的な研究システムで、状態、役割、メモリ、ゲート、アーティファクトトレースを公開して変換パスを検査する。
論文参考訳（メタデータ） (2026-05-21T11:29:08Z)
Cochise: A Reference Harness for Autonomous Penetration Testing [1.3124479769761592]
自動貫入試験のための597 LOC Pythonリファレンスハーネスであるcochiseを提案する。 Cochiseは、LSM駆動エージェントをSSH上のLinuxホストに接続し、制御されたターゲット環境をサポートする。リプレイと分析ツール: (i)コチス・リプレイ, (ii)コチス・アナライゼログ, コチス・アナライゼ-グラフ, コスト, トークン持続時間, 妥協解析。
論文参考訳（メタデータ） (2026-05-12T07:28:12Z)
Practical Limits of Autonomous Test Repair: A Multi-Agent Case Study with LLM-Driven Discovery and Self-Correction [0.0]
本稿では,実運用型エンタープライズUIテストプロトタイプの匿名実行データを用いて,マルチエージェント自律テストシステムの産業ケーススタディを提案する。システムは、人間指向のテストからハイオートノミー機能発見とテスト実行へと進化する。我々の研究結果によると、制限のない自律は不安定でしばしば誤解を招く結果をもたらすが、制約された自律はそのようなシステムを運用上実行可能なものにする。
論文参考訳（メタデータ） (2026-05-02T14:39:55Z)
AJ-Bench: Benchmarking Agent-as-a-Judge for Environment-Aware Evaluation [71.49152943451328]
我々は,AJ-Benchベンチマークを導入し,ドメイン検索,データシステム,グラフィカルユーザインタフェースの3つの領域にまたがるエージェント・アズ・ア・Judgeを評価する。実験ではLLM-as-a-Judgeベースラインよりも一貫したパフォーマンス向上を示し、エージェントベースの検証においてかなりオープンな課題を明らかにした。
論文参考訳（メタデータ） (2026-04-20T13:23:38Z)
Dynamic analysis enhances issue resolution [53.50448142467294]
DAIRA(Dynamic Analysis-enhanced Issue Resolution Agent)は、エージェントの推論サイクルに動的解析を組み込む自動修復フレームワークである。テストトレース駆動の方法論によって駆動されるDAIRAは、軽量モニタを使用して重要なランタイムデータを抽出する。 Gemini 3 Flash Previewを使用すると、DAIRAは新たな最先端(SOTA)パフォーマンスを確立し、SWE-bench Verifiedデータセットで79.4%の解像度を達成する。
論文参考訳（メタデータ） (2026-03-23T14:48:54Z)
Scaling Agentic Verifier for Competitive Coding [66.11758166379092]
大規模言語モデル(LLM)は強力なコーディング能力を示しているが、1回の試行で競合するプログラミング問題を正しく解くのに苦戦している。実行ベースの再ランク付けは、有望なテスト時間スケーリング戦略を提供するが、既存のメソッドは、難しいテストケースの生成または非効率的なランダム入力サンプリングによって制約される。本稿では,プログラムの動作を積極的に推論し,高い差別性のあるテスト入力を検索するエージェント検証手法を提案する。
論文参考訳（メタデータ） (2026-02-04T06:30:40Z)
InspectCoder: Dynamic Analysis-Enabled Self Repair through interactive LLM-Debugger Collaboration [71.18377595277018]
大きな言語モデル(LLM)は、診断が難しい複雑なロジックエラーを伴うバグの多いコードを生成することが多い。対話型デバッガ制御による動的解析を LLM に委ねる初のエージェントプログラム修復システムである InspectCoder を提案する。
論文参考訳（メタデータ） (2025-10-21T06:26:29Z)
Towards Automatic Generation of Amplified Regression Test Oracles [44.45138073080198]
回帰テストオラクルを増幅するためのテストオラクル導出手法を提案する。このアプローチはテスト実行中にオブジェクトの状態を監視し、以前のバージョンと比較して、SUTの意図した振る舞いに関連する変更を検出する。
論文参考訳（メタデータ） (2023-07-28T12:38:44Z)
Quo Vadis: Hybrid Machine Learning Meta-Model based on Contextual and Behavioral Malware Representations [5.439020425819001]
複数のディープラーニングモデルを同時に利用するハイブリッド機械学習アーキテクチャを提案する。我々は,現在の最先端モデルの能力よりも優れた検出率を報告した。
論文参考訳（メタデータ） (2022-08-20T05:30:16Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。