FuguReport

FileGram: Grounding Agent Personalization in File-System Behavioral Traces

著者 Shuai Liu, Shulin Tian, Kairui Hu, Yuhao Dong, Zhe Yang, Bo Li, Jingkang Yang, Chen Change Loy, Ziwei Liu
所属 Synvo AI / Nanyang Technological University
カテゴリ Method / Agent Personalization / Personalization using file system behavior, Application / File System Agent / Memory-centric file system agents, Evaluation / Open Source Framework / Support for future research
ライセンス CC BY 4.0

Abstractの概要

FileGramは、対話履歴ではなく行動トレース(アトミックアクションとコンテンツデルタ)を用いてファイルシステムエージェントをパーソナライズするための統合フレームワークである。本フレームワークは3つのコンポーネントで構成される:640のプロファイル×タスクの組み合わせにわたりマルチモーダルなファイルシステム軌跡を生成するペルソナ条件付きデータエンジンFileGramEngine、プロファイル再構築・行動推論・トレース分離・異常検出・シフト分析・マルチモーダルグラウンディングにわたるメモリ中心のパーソナライズを評価する4,600件のQAペアからなる診断ベンチマークFileGramBench、そしてトレースを手続き的・意味的・エピソード的チャネルにエンコードしクエリ時まで抽象化を遅延させるボトムアップ型メモリアーキテクチャFileGramOSである。著者らは、既存のメモリシステムはインタラクション中心であり、ファイルシステム操作に埋め込まれた細粒度の操作パターンを見逃していると主張し、今後の研究を支援するためフレームワークをオープンソース化している。

新規性

本論文の主な新規性は、エージェントのパーソナライズを会話要約ではなくファイルシステムの行動トレースとコンテンツデルタに基づいて行う点にある。著者らが述べるところによれば、縦断的なファイルシステム操作からのメモリ中心パーソナライズに焦点を当てた初のベンチマークを導入するとともに、手続き的・意味的・エピソード的チャネルを通じてアトミックな行動証拠を保持しクエリ時まで抽象化を遅延させるボトムアップ型メモリアーキテクチャ(FileGramOS)を提案している。

成果

FileGramBenchにおいて、コンテキストベースおよびナラティブ優先のベースラインは平均精度48〜50%、マルチモーダルメモリ手法は最大44.7%に達する一方、FileGramOSは59.6%を達成し、最強ベースラインEverMemOS(49.9%)を上回った。特に手続き的統計とアクションレベルの構造保持による向上が顕著であった。異常検出はシフト帰属よりも扱いやすいことが判明し、実世界の画面録画評価ではすべての手法で精度が一桁台に低下し、シミュレーションと実世界の間に大きなギャップが存在することが明らかになった。

論文の注目点

  1. FileGramは、ペルソナ条件付きデータエンジン(FileGramEngine、20,028のアトミックアクションを含む640の軌跡)、診断ベンチマーク(FileGramBench、4トラックにわたる4,600件のQA項目)、およびボトムアップ型メモリシステム(FileGramOS)を組み合わせ、ファイルシステムの行動トレースからのパーソナライズを研究する。
  2. FileGramBenchは、手続き的・意味的・エピソード的メモリチャネルにわたる事前定義されたユーザープロファイルから導出されたグラウンドトゥルースを用いて、プロファイル再構築・行動推論・トレース分離・異常検出・シフト分析・マルチモーダルグラウンディングを評価する。
  3. 実験結果は、パーソナライズにおいて操作のミクロ構造の保持が重要であることを示している:FileGramOSはナラティブ抽象化を遅延させることで全ベースラインを上回る一方、シフト帰属と実世界動画グラウンディングは全手法で一桁台の精度にとどまり、依然として大きな未解決課題である。

参考リンク

このページはGPT-5、Claude Opus 4、Gemini 3、Gemini 3.1 Flash Image 及びその上位バージョンなどの生成AIを用いて作成されています。内容の保証は一切できません。