FileGram: Grounding Agent Personalization in File-System Behavioral Traces
Abstractの概要
FileGramは、対話履歴ではなく行動トレース(アトミックアクションとコンテンツデルタ)を用いてファイルシステムエージェントをパーソナライズするための統合フレームワークである。本フレームワークは3つのコンポーネントで構成される:640のプロファイル×タスクの組み合わせにわたりマルチモーダルなファイルシステム軌跡を生成するペルソナ条件付きデータエンジンFileGramEngine、プロファイル再構築・行動推論・トレース分離・異常検出・シフト分析・マルチモーダルグラウンディングにわたるメモリ中心のパーソナライズを評価する4,600件のQAペアからなる診断ベンチマークFileGramBench、そしてトレースを手続き的・意味的・エピソード的チャネルにエンコードしクエリ時まで抽象化を遅延させるボトムアップ型メモリアーキテクチャFileGramOSである。著者らは、既存のメモリシステムはインタラクション中心であり、ファイルシステム操作に埋め込まれた細粒度の操作パターンを見逃していると主張し、今後の研究を支援するためフレームワークをオープンソース化している。
新規性
本論文の主な新規性は、エージェントのパーソナライズを会話要約ではなくファイルシステムの行動トレースとコンテンツデルタに基づいて行う点にある。著者らが述べるところによれば、縦断的なファイルシステム操作からのメモリ中心パーソナライズに焦点を当てた初のベンチマークを導入するとともに、手続き的・意味的・エピソード的チャネルを通じてアトミックな行動証拠を保持しクエリ時まで抽象化を遅延させるボトムアップ型メモリアーキテクチャ(FileGramOS)を提案している。
成果
FileGramBenchにおいて、コンテキストベースおよびナラティブ優先のベースラインは平均精度48〜50%、マルチモーダルメモリ手法は最大44.7%に達する一方、FileGramOSは59.6%を達成し、最強ベースラインEverMemOS(49.9%)を上回った。特に手続き的統計とアクションレベルの構造保持による向上が顕著であった。異常検出はシフト帰属よりも扱いやすいことが判明し、実世界の画面録画評価ではすべての手法で精度が一桁台に低下し、シミュレーションと実世界の間に大きなギャップが存在することが明らかになった。
論文の注目点
- FileGramは、ペルソナ条件付きデータエンジン(FileGramEngine、20,028のアトミックアクションを含む640の軌跡)、診断ベンチマーク(FileGramBench、4トラックにわたる4,600件のQA項目)、およびボトムアップ型メモリシステム(FileGramOS)を組み合わせ、ファイルシステムの行動トレースからのパーソナライズを研究する。
- FileGramBenchは、手続き的・意味的・エピソード的メモリチャネルにわたる事前定義されたユーザープロファイルから導出されたグラウンドトゥルースを用いて、プロファイル再構築・行動推論・トレース分離・異常検出・シフト分析・マルチモーダルグラウンディングを評価する。
- 実験結果は、パーソナライズにおいて操作のミクロ構造の保持が重要であることを示している:FileGramOSはナラティブ抽象化を遅延させることで全ベースラインを上回る一方、シフト帰属と実世界動画グラウンディングは全手法で一桁台の精度にとどまり、依然として大きな未解決課題である。
参考リンク
- arXiv: https://arxiv.org/abs/2604.04901v1
- Fugu-MT: https://fugumt.com/fugumt/paper_check/2604.04901v1
- Hugging Face Papers: https://huggingface.co/papers/2604.04901
- GitHub: https://github.com/Synvo-ai/FileGram
- Project: https://filegram.choiszt.com