Fugu-MT 論文翻訳(概要): Persistent Instability in LLM's Personality Measurements: Effects of Scale, Reasoning, and Conversation History

論文の概要: Persistent Instability in LLM's Personality Measurements: Effects of Scale, Reasoning, and Conversation History

arxiv url: http://arxiv.org/abs/2508.04826v1
Date: Wed, 06 Aug 2025 19:11:33 GMT
ステータス: 翻訳完了
システム内更新日: 2025-08-08 18:59:39.626503
Title: Persistent Instability in LLM's Personality Measurements: Effects of Scale, Reasoning, and Conversation History
Title（参考訳）: LLMのパーソナリティ測定における永続的不安定性:尺度,推論,会話履歴の影響
Authors: Tommaso Tosato, Saskia Helbling, Yorguin-Jose Mantilla-Ramos, Mahmood Hegazy, Alberto Tosato, David John Lemay, Irina Rish, Guillaume Dumas,
Abstract要約: 400B+モデルでさえ、相当な応答変動を示す。連鎖推論、詳細なペルソナ指導、会話履歴の含意など、行動の安定化を期待する介入は、パラドックス的に変動を増大させる。予測可能な行動を必要とする安全クリティカルなアプリケーションに対しては,人格に基づくアライメント戦略が根本的に不十分である可能性が示唆された。
参考スコア（独自算出の注目度）: 7.58175460763641
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Large language models require consistent behavioral patterns for safe deployment, yet their personality-like traits remain poorly understood. We present PERSIST (PERsonality Stability in Synthetic Text), a comprehensive evaluation framework testing 25+ open-source models (1B-671B parameters) across 500,000+ responses. Using traditional (BFI-44, SD3) and novel LLM-adapted personality instruments, we systematically vary question order, paraphrasing, personas, and reasoning modes. Our findings challenge fundamental deployment assumptions: (1) Even 400B+ models exhibit substantial response variability (SD > 0.4); (2) Minor prompt reordering alone shifts personality measurements by up to 20%; (3) Interventions expected to stabilize behavior, such as chain-of-thought reasoning, detailed personas instruction, inclusion of conversation history, can paradoxically increase variability; (4) LLM-adapted instruments show equal instability to human-centric versions, confirming architectural rather than translational limitations. This persistent instability across scales and mitigation strategies suggests current LLMs lack the foundations for genuine behavioral consistency. For safety-critical applications requiring predictable behavior, these findings indicate that personality-based alignment strategies may be fundamentally inadequate.
Abstract（参考訳）: 大規模言語モデルは安全な配置のために一貫した行動パターンを必要とするが、その性格的な特徴はよく分かっていない。提案するPERSIST(Personality Stability in Synthetic Text)は,500,000以上の応答に対して25以上のオープンソースモデル(1B-671Bパラメータ)をテストする総合評価フレームワークである。従来の (BFI-44, SD3) と LLM 適応型パーソナリティ機器を用いて, 質問順, パラフレーズ, ペルソナ, 推論モードを体系的に変化させる。本研究は,(1)400B+モデルにおいても大きな応答変動(SD > 0.4)を示すこと,(2)人格測定を最大20%シフトすること,(3)チェーン・オブ・インフォメーション,詳細なペルソナ・インストラクション,会話履歴の包含など,行動の安定化を期待する介入が,パラドックス的に変動を増大させること,(4)LLM適応機器は人間中心のバージョンと同等の不安定性を示し,翻訳制限よりもアーキテクチャを裏付けること,といった基本的な展開仮定に挑戦する。このスケールにわたる永続的不安定性と緩和戦略は、現在のLCMには真の行動整合性の基盤が欠けていることを示唆している。予測可能な行動を必要とする安全クリティカルなアプリケーションに対しては,人格に基づくアライメント戦略が根本的に不十分である可能性が示唆された。

関連論文リスト

LLMEval-3: A Large-Scale Longitudinal Study on Robust and Fair Evaluation of Large Language Models [51.55869466207234]
静的ベンチマークにおけるLLM(Large Language Models)の既存の評価は、データの汚染やリーダーボードのオーバーフィッティングに弱い。 LLMの動的評価のためのフレームワークであるLLMEval-3を紹介する。 LLEval-3は、220kの卒業生レベルの質問からなるプロプライエタリなバンク上に構築されており、評価実行毎に未確認のテストセットを動的にサンプリングする。
論文参考訳（メタデータ） (2025-08-07T14:46:30Z)
Evaluating the Simulation of Human Personality-Driven Susceptibility to Misinformation with LLMs [0.18416014644193066]
大規模言語モデル(LLM)により、大規模に合成行動データを生成することができる。我々は,誤情報に対する個人的影響の変動を再現するために,Big-Fiveプロファイルに規定されたLLMエージェントの能力を評価する。
論文参考訳（メタデータ） (2025-06-30T08:16:07Z)
Spotting Out-of-Character Behavior: Atomic-Level Evaluation of Persona Fidelity in Open-Ended Generation [16.76995815742803]
より微細な粒度でペルソナの忠実度を定量化する原子レベル評価フレームワークを提案する。私たちの3つの重要な測定基準は、世代間でのペルソナのアライメントと一貫性の度合いを測定します。多様なタスクやパーソナリティの多様さからペルソナの忠実度を解析することにより,タスク構造とペルソナの嗜好性がモデル適応性にどのように影響するかを明らかにする。
論文参考訳（メタデータ） (2025-06-24T06:33:10Z)
A Comparative Study of Large Language Models and Human Personality Traits [6.354326674890978]
言語モデル(LLM)は、言語理解と生成において人間のような能力を示す。本研究では, LLMが人格的特徴を示すか, これらの特徴が人格とどのように比較されるかを検討する。
論文参考訳（メタデータ） (2025-05-01T15:10:15Z)
Self-Evolving Critique Abilities in Large Language Models [59.861013614500024]
本稿では,Large Language Models (LLM) の批判能力の向上について検討する。 SCRITは、LCMを自己生成データで訓練し、批判能力を進化させるフレームワークである。分析の結果,SCRITの性能はデータやモデルサイズと正の相関関係にあることが明らかとなった。
論文参考訳（メタデータ） (2025-01-10T05:51:52Z)
Rediscovering the Latent Dimensions of Personality with Large Language Models as Trait Descriptors [4.814107439144414]
大規模言語モデル(LLM)における潜在人格次元を明らかにする新しいアプローチを提案する。実験の結果, LLMは, 直接アンケート入力に頼ることなく, 外転, 同意性, 良性, 神経性, 開放性などの中核的性格を「発見」することがわかった。抽出した主成分を用いて、ビッグファイブ次元に沿ったパーソナリティを評価し、微調整モデルよりも平均的なパーソナリティ予測精度を最大5%向上させることができる。
論文参考訳（メタデータ） (2024-09-16T00:24:40Z)
Evaluating Interventional Reasoning Capabilities of Large Language Models [58.52919374786108]
大規模言語モデル(LLM)は意思決定タスクを自動化するために使用される。本稿では,LPMが介入に応じてデータ生成プロセスの知識を正確に更新できるかどうかを評価する。さまざまな因果グラフ(例えば、コンバウンディング、仲介)と変数タイプにまたがるベンチマークを作成します。これらのベンチマークにより、LLMが事実を記憶したり、他のショートカットを見つけたりすることで、変化を正確に予測する能力を切り離すことができます。
論文参考訳（メタデータ） (2024-04-08T14:15:56Z)
LLMs Simulate Big Five Personality Traits: Further Evidence [51.13560635563004]
Llama2, GPT4, Mixtralでシミュレートされた性格特性を解析した。このことは、パーソナリティ特性をシミュレートするLLMの能力のより広範な理解に寄与する。
論文参考訳（メタデータ） (2024-01-31T13:45:25Z)
Decoding Susceptibility: Modeling Misbelief to Misinformation Through a Computational Approach [61.04606493712002]
誤報に対する感受性は、観測不可能な不検証の主張に対する信念の度合いを記述している。既存の感受性研究は、自己報告された信念に大きく依存している。本稿では,ユーザの潜在感受性レベルをモデル化するための計算手法を提案する。
論文参考訳（メタデータ） (2023-11-16T07:22:56Z)
Personality Traits in Large Language Models [42.31355340867784]
コミュニケーションの有効性を決定する重要な要因は人格である。本稿では,広く使用されている大規模言語モデル上でのパーソナリティテストの管理と検証のための,新しい,包括的・包括的心理学的・信頼性の高い方法論を提案する。本稿では,計測・形成手法の適用と倫理的意味,特に責任あるAIについて論じる。
論文参考訳（メタデータ） (2023-07-01T00:58:51Z)
Personality testing of Large Language Models: Limited temporal stability, but highlighted prosociality [0.0]
大きな言語モデル(LLM)は、人間のような特徴と、ユーザに提供する親密さによって人気を博している。本研究は,人格楽器に対する時間的安定度と時間的合意度を2点に評価することを目的とした。短時間でLSMs反応において, レーザー間一致のレベルが異なることが判明した。
論文参考訳（メタデータ） (2023-06-07T10:14:17Z)
Revisiting the Reliability of Psychological Scales on Large Language Models [62.57981196992073]
本研究の目的は,大規模言語モデルにパーソナリティアセスメントを適用することの信頼性を明らかにすることである。 GPT-3.5、GPT-4、Gemini-Pro、LLaMA-3.1などのモデル毎の2,500設定の分析により、様々なLCMがビッグファイブインベントリに応答して一貫性を示すことが明らかになった。
論文参考訳（メタデータ） (2023-05-31T15:03:28Z)
Empirical Estimates on Hand Manipulation are Recoverable: A Step Towards Individualized and Explainable Robotic Support in Everyday Activities [80.37857025201036]
ロボットシステムの鍵となる課題は、他のエージェントの振る舞いを理解することである。正しい推論の処理は、(衝突)因子が実験的に制御されない場合、特に困難である。人に関する観察研究を行うために必要なツールをロボットに装備することを提案する。
論文参考訳（メタデータ） (2022-01-27T22:15:56Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。