論文の概要: Tracking the Behavioral Trajectories of Adapting Agents
- arxiv url: http://arxiv.org/abs/2606.02536v1
- Date: Mon, 01 Jun 2026 17:40:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:32.546967
- Title: Tracking the Behavioral Trajectories of Adapting Agents
- Title(参考訳): 適応剤の挙動軌跡の追跡
- Authors: Jonah Leshin, Manish Shah, Ian Timmis,
- Abstract要約: 本稿では,テキスト埋め込みモデルの埋め込み空間における特徴を方向として定義することにより,エージェント$traits$を測定する手法を提案する。
我々は、特徴ベクトルを学習するためにラベル付き"before"と"after"のスキルファイル差分に対して線形モデルを訓練し、そのベクトルに埋め込み差分を投影することで任意のスキル編集を行う。
我々は,この特性評価をエージェント・ツー・エージェント・プロトコルに組み込んで,信頼できる仲介者を通じて,あるエージェントが他のエージェントのスキルファイルの更新を評価できるようにする。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Text files such as skill files, memory files, and behavioral configuration files play a central role in defining how modern agents act. Through edits by humans or the agents themselves, these files may evolve over time, directly steering the agent's behavior in future interactions. We present a methodology and framework for measuring agent $traits$ by defining traits as directions in the embedding space of a text embedding model. We train a linear model on labeled "before" versus "after" skill file diffs to learn a trait vector, then score arbitrary skill edits by projecting their embedding diffs onto this vector. Evaluated on 68 labeled skill diff pairs for the trait of propensity to seek sensitive data, our method achieves 91.2% sign classification accuracy and a Spearman rank correlation of $ρ= 0.82$ under leave-one-out cross-validation. We build this trait evaluation into a broader agent-to-agent protocol that enables one agent to evaluate another's skill file updates through a trusted intermediary.
- Abstract(参考訳): スキルファイル、メモリファイル、行動構成ファイルなどのテキストファイルは、現代のエージェントがどのように振る舞うかを定義する上で中心的な役割を果たす。
人間やエージェント自身による編集によって、これらのファイルは時間とともに進化し、エージェントの振る舞いを直接制御する。
本稿では,テキスト埋め込みモデルの埋め込み空間における特徴を方向として定義することにより,エージェント$traits$を測定するための方法論とフレームワークを提案する。
我々は、特徴ベクトルを学習するためにラベル付き"before"と"after"のスキルファイル差分に対して線形モデルを訓練し、そのベクトルに埋め込み差分を投影することで任意のスキル編集を行う。
精度の高いデータを求めるために68のラベル付きスキル差分対を用いて評価し、91.2%の符号分類精度と、0.82$のスピアマンランク相関値を得た。
我々は,この特性評価をエージェント・ツー・エージェント・プロトコルに組み込んで,信頼できる仲介者を通じて,あるエージェントが他のエージェントのスキルファイルの更新を評価できるようにする。
関連論文リスト
- How to Interpret Agent Behavior [56.59836196946289]
本稿では,エージェントの動作を実行時に記述・解析するための分類法であるACT*ONOMYを紹介する。
共用語彙を提供することで、ACT*ONOMYは研究者、エージェントデザイナー、エンドユーザーがエージェントの振る舞いをより一貫して解釈するのに役立つ。
論文 参考訳(メタデータ) (2026-05-13T14:52:40Z) - TRAJEVAL: Decomposing Code Agent Trajectories for Fine-Grained Diagnosis [23.834704102474927]
コードエージェントはGitHubの問題を解決することができるが、失敗した場合、現在の評価は場所や理由を可視化しない。
本稿では,エージェントトラジェクトリを3つの解釈段階に分解する診断フレームワークTRAJEVALを紹介する。
我々はこれらの診断が予測可能であることを確認し、0.87-2.1% MAEでモデルレベルのPass@1予測を達成する。
論文 参考訳(メタデータ) (2026-03-25T05:27:03Z) - Agentic Peer-to-Peer Networks: From Content Distribution to Capability and Action Sharing [10.47562113256175]
本稿では,このようなコラボレーションの実現に必要なネットワーク基盤について概説する。
本稿では,接続/ID,意味発見,実行を分離する平面型参照アーキテクチャを提案する。
Tier1は評判信号に依存し、Tier2はフォールバック選択で軽量なカナリアチャレンジ応答を適用し、Tier3は署名されたツールレシートやトラスのようなエビデンスパッケージを必要とします。
論文 参考訳(メタデータ) (2026-03-04T05:58:44Z) - ET-Agent: Incentivizing Effective Tool-Integrated Reasoning Agent via Behavior Calibration [68.89572566071575]
ETAgentはエージェントのツール使用行動を調整するためのトレーニングフレームワークである。
過誤行動パターンを最適行動に段階的に校正するように設計されている。
論文 参考訳(メタデータ) (2026-01-11T11:05:26Z) - Impatient Users Confuse AI Agents: High-fidelity Simulations of Human Traits for Testing Agents [58.00130492861884]
TraitBasisは、AIエージェントを体系的にストレステストするための軽量でモデルに依存しない方法である。
TraitBasisは、ステアブルなユーザ特性に対応するアクティベーション空間で方向を学習する。
We observed on average a 2%-30% performance degradation on $tau$-Trait across frontier model。
論文 参考訳(メタデータ) (2025-10-06T05:03:57Z) - Robust Novelty Detection through Style-Conscious Feature Ranking [7.691679448855549]
我々は、タスク関連セマンティクスまたはコンテンツ変更と無関係なスタイル変更の正式な区別を提唱する。
この区別は堅牢な新規性検出の基礎を形成し、スタイルの分布シフトに耐性のある意味変化の同定を強調している。
本稿では,事前学習した大規模モデル表現を用いて環境バイアスのある特徴を選択的に破棄する手法であるStylistを紹介する。
論文 参考訳(メタデータ) (2023-10-05T17:58:32Z) - PART: Pre-trained Authorship Representation Transformer [52.623051272843426]
文書を書く著者は、自分のテキストに識別情報を印字する。
以前の作品では、手作りの機能や分類タスクを使って著者モデルを訓練していた。
セマンティクスの代わりにテキストの埋め込みを学習するために、対照的に訓練されたモデルを提案する。
論文 参考訳(メタデータ) (2022-09-30T11:08:39Z) - Explaining Reinforcement Learning Policies through Counterfactual
Trajectories [147.7246109100945]
人間の開発者は、RLエージェントがテスト時にうまく機能することを検証しなければならない。
本手法では, エージェントの挙動をより広い軌道分布で示すことにより, エージェントの挙動を分布変化下で表現する。
本研究では,2つのエージェント検証タスクのうちの1つに対して,ベースライン法よりも優れたスコアを得られることを示す。
論文 参考訳(メタデータ) (2022-01-29T00:52:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。