論文の概要: MTI: A Behavior-Based Temperament Profiling System for AI Agents
- arxiv url: http://arxiv.org/abs/2604.02145v1
- Date: Thu, 02 Apr 2026 15:15:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-03 14:21:10.875826
- Title: MTI: A Behavior-Based Temperament Profiling System for AI Agents
- Title(参考訳): MTI:AIエージェントのための行動に基づくテンポラメントプロファイリングシステム
- Authors: Jihoon Jeong,
- Abstract要約: モデルテンペラメント指数(MTI)は,4軸にわたるAIエージェントのテンペラメントを測定する行動ベースのプロファイリングシステムである。
MTIは、自分たちが何を言っているのかではなく、エージェントが何をするのかを、2段階の設計で構造化された検査プロトコルを使って測定する。
- 参考スコア(独自算出の注目度): 4.358468367889626
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: AI models of equivalent capability can exhibit fundamentally different behavioral patterns, yet no standardized instrument exists to measure these dispositional differences. Existing approaches either borrow human personality dimensions and rely on self-report (which diverges from actual behavior in LLMs) or treat behavioral variation as a defect rather than a trait. We introduce the Model Temperament Index (MTI), a behavior-based profiling system that measures AI agent temperament across four axes: Reactivity (environmental sensitivity), Compliance (instruction-behavior alignment), Sociality (relational resource allocation), and Resilience (stress resistance). Grounded in the Four Shell Model from Model Medicine, MTI measures what agents do, not what they say about themselves, using structured examination protocols with a two-stage design that separates capability from disposition. We profile 10 small language models (1.7B-9B parameters, 6 organizations, 3 training paradigms) and report five principal findings: (1) the four axes are largely independent among instruction-tuned models (all |r| < 0.42); (2) within-axis facet dissociations are empirically confirmed -- Compliance decomposes into fully independent formal and stance facets (r = 0.002), while Resilience decomposes into inversely related cognitive and adversarial facets; (3) a Compliance-Resilience paradox reveals that opinion-yielding and fact-vulnerability operate through independent channels; (4) RLHF reshapes temperament not only by shifting axis scores but by creating within-axis facet differentiation absent in the unaligned base model; and (5) temperament is independent of model size (1.7B-9B), confirming that MTI measures disposition rather than capability.
- Abstract(参考訳): 同等の能力を持つAIモデルは、基本的に異なる行動パターンを示すことができるが、これらの配置の違いを測定するための標準化された手段は存在しない。
既存のアプローチは人格の次元を借用し、自己報告(LLMの実際の行動から分岐する)に依存するか、あるいは特性よりもむしろ欠陥として振る舞いの変化を扱う。
反応(環境感度)、コンプライアンス(指導行動アライメント)、社会性(関係資源割り当て)、抵抗性(ストレス耐性)の4つの軸にわたるAIエージェントのテンペラメントを測定する行動ベースプロファイリングシステムであるモデルテンペラメント指標(MTI)を紹介する。
MTIはモデル・メディカルのフォー・シェル・モデル(Four Shell Model)に基礎を置いており、自分たちが何を言っているかではなく、エージェントが何をしているかを測定する。
我々は10個の小言語モデル(1.7B-9Bパラメータ、6つの組織、3つの訓練パラダイム)をプロファイルし、(1) 4つの軸は命令調整されたモデル(all |r| < 0.42)に大きく依存し、(2) 軸内ファセット解離は経験的に確認され、(2) コンプライアンスは完全独立な形式的および姿勢のファセット(r = 0.002)に分解される。
関連論文リスト
- Automated Self-Testing as a Quality Gate: Evidence-Driven Release Management for LLM Applications [51.56484100374058]
我々は,エビデンスに基づくリリース決定を伴う品質ゲートを導入する自動自己テストフレームワークを提案する。
内部展開型多エージェント対話型AIシステムの縦型ケーススタディにより,本フレームワークの評価を行った。
論文 参考訳(メタデータ) (2026-03-13T20:44:15Z) - Quantifying Model Uniqueness in Heterogeneous AI Ecosystems [1.1162481475388237]
In-Silico Quasi-Experimental Design に基づく監査モデル一意性に関する統計的枠組みを提案する。
モデル間で一致した介入を強制することにより、本質的なモデルのアイデンティティを分離し、一意性を Peer-Inpresentible Residual (PIER) として定量化する。
これらの結果は、信頼できるAIを単一のモデルの説明以上のものにする。
論文 参考訳(メタデータ) (2026-01-30T13:41:53Z) - HUMANLLM: Benchmarking and Reinforcing LLM Anthropomorphism via Human Cognitive Patterns [59.17423586203706]
本稿では,心理的パターンを因果力の相互作用として扱うフレームワークであるHUMANLLMを提案する。
12,000の学術論文から244のパターンを構築し、2-5のパターンが相互に強化、衝突、変調されるシナリオ11,359を合成する。
我々の二重レベルチェックリストは、個々のパターンの忠実度と創発的なマルチパターンのダイナミクスを評価し、強い人間のアライメントを達成する。
論文 参考訳(メタデータ) (2026-01-15T08:56:53Z) - M3-BENCH: Process-Aware Evaluation of LLM Agents Social Behaviors in Mixed-Motive Games [4.88323005571385]
M3-Benchは、M3-Benchのマルチステージベンチマークである。
我々は、多次元の証拠を解釈可能な社会行動像に集約するために、ビッグファイブパーソナリティモデルと社会交換理論を統合する。
論文 参考訳(メタデータ) (2026-01-13T11:38:51Z) - The Personality Illusion: Revealing Dissociation Between Self-Reports & Behavior in LLMs [60.15472325639723]
人格特性は、人間の行動の予測因子として長い間研究されてきた。
近年のLarge Language Models (LLM) は, 人工システムに類似したパターンが出現する可能性を示唆している。
論文 参考訳(メタデータ) (2025-09-03T21:27:10Z) - Persistent Instability in LLM's Personality Measurements: Effects of Scale, Reasoning, and Conversation History [7.58175460763641]
400B+モデルでさえ、相当な応答変動を示す。
連鎖推論、詳細なペルソナ指導、会話履歴の含意など、行動の安定化を期待する介入は、パラドックス的に変動を増大させる。
予測可能な行動を必要とする安全クリティカルなアプリケーションに対しては,人格に基づくアライメント戦略が根本的に不十分である可能性が示唆された。
論文 参考訳(メタデータ) (2025-08-06T19:11:33Z) - Collaborative Value Function Estimation Under Model Mismatch: A Federated Temporal Difference Analysis [55.13545823385091]
フェデレーション強化学習(FedRL)は、エージェント間のデータ交換を防止し、データのプライバシを維持しながら協調学習を可能にする。
現実世界のアプリケーションでは、各エージェントは若干異なる遷移ダイナミクスを経験し、固有のモデルミスマッチを引き起こす。
情報共有の適度なレベルでさえ、環境固有のエラーを著しく軽減することを示す。
論文 参考訳(メタデータ) (2025-03-21T18:06:28Z) - Empirical Estimates on Hand Manipulation are Recoverable: A Step Towards
Individualized and Explainable Robotic Support in Everyday Activities [80.37857025201036]
ロボットシステムの鍵となる課題は、他のエージェントの振る舞いを理解することである。
正しい推論の処理は、(衝突)因子が実験的に制御されない場合、特に困難である。
人に関する観察研究を行うために必要なツールをロボットに装備することを提案する。
論文 参考訳(メタデータ) (2022-01-27T22:15:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。