Fugu-MT 論文翻訳(概要): Towards Understanding and Measuring COGNITIVE ATROPHY in LLM Behaviour

論文の概要: Towards Understanding and Measuring COGNITIVE ATROPHY in LLM Behaviour

arxiv url: http://arxiv.org/abs/2606.18129v1
Date: Tue, 16 Jun 2026 16:26:12 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-17 17:15:32.548106
Title: Towards Understanding and Measuring COGNITIVE ATROPHY in LLM Behaviour
Title（参考訳）: LLM行動におけるコグニティブアトロピーの理解と測定に向けて
Authors: Abeer Badawi, Moyosoreoluwa Olatosi, Negin Baghbanzadeh, Laleh Seyyed-Kalantari, Frank Rudzicz, R. Shayna Rosenbaum, Sara Pishdadian, Elham Dolatabadi,
Abstract要約: 既存のベンチマークは、知識、安全性、静的応答品質を測定する。我々は、この欠落した次元を、AIによるメンタルヘルス支援におけるプロセスレベルの行動尺度であるCOGNITIVE ATROPHYとして定式化する。
参考スコア（独自算出の注目度）: 10.419215828520414
License: http://creativecommons.org/publicdomain/zero/1.0/
Abstract: Recent incidents involving LLMs used for mental-health support reveal a critical evaluation gap: surface-level safety scores do not capture how models behave across realistic, emotionally sensitive interactions over time. Existing benchmarks measure knowledge, safety, or static response quality, but miss whether LLM interactions help users keep reflecting, coping, and making decisions themselves. We formalize this missing dimension as COGNITIVE ATROPHY, a process-level behavioural measure in AI-mediated mental-health support distinct from safety and helpfulness. To measure it, we introduce COGNITIVE ATROPHY BENCH, a clinically grounded benchmark built from 1,576 fully human-generated counseling conversations, 15,680 turns, and 42,230 responses from five LLMs. Three clinical and neuropsychology experts developed a 20-attribute schema spanning user context, response behaviour, and global risk flags; six trained clinical reviewers applied it with span-grounded evidence, producing 5,324 reviewer judgments. We further introduce the User-Input Risk Index (UIRI), the Cognitive Atrophy Risk Index (ARI), and trajectory summaries. Across five LLMs, models show a consistent moderate-to-high level of atrophy-aligned behaviour across single and multi-turn settings. While models generally respond to overt safety cues, they adapt less reliably when users seek solutions or decisions. The dominant recurring patterns are directive advice, problem-solving, recommendation responses, topic shifts, and forms of validation that may reinforce dependence rather than reflection. Our work makes COGNITIVE ATROPHY measurable and provides a foundation for auditing model behaviour in sensitive LLM conversations.
Abstract（参考訳）: 表面レベルの安全スコアは、時間とともに現実的で感情に敏感な相互作用を通してモデルがどのように振る舞うかを捉えない。既存のベンチマークは、知識、安全性、静的な応答品質を計測しますが、LLMインタラクションがユーザが自分自身を反映し、対処し、決定するのに役立つかどうかを見逃します。我々は、この欠落した次元を、安全と有用性とは異なるAIによるメンタルヘルスサポートにおけるプロセスレベルの行動尺度であるCOGNITIVE ATROPHYとして定式化する。そこで本研究では,1,576件の人為的カウンセリング会話,15,680件の旋回,42,230件のLSMからの回答から作成した,臨床基盤のベンチマークであるCOGNITIVE ATROPHY BENCHを紹介する。 3人の臨床・神経心理学の専門家が、ユーザコンテキスト、反応行動、グローバルリスクフラグにまたがる20の属性スキーマを開発した。さらに、UIRI(User-Input Risk Index)、ARI(Cognitive Atrophy Risk Index)、トラジェクティブサマリー(trajectory summaries)を紹介する。 5つのLLMにわたって、モデルは、シングルターンとマルチターンのセッティングに対して、一貫した適度からハイレベルのアトロフィア・アライメントの振る舞いを示す。モデルは通常、過度な安全基準に反応するが、ユーザーが解決策や決定を求めると、信頼性が低下する。主要な反復パターンは、指示的アドバイス、問題解決、レコメンデーション応答、トピックシフト、そして、リフレクションよりも依存を強める可能性のある検証形式である。我々の研究は、COGNITIVE ATROPHYを測定可能とし、感度LLM会話におけるモデル行動監査の基礎を提供する。

関連論文リスト

Inform, Coach, Relate, Listen: Auditing LLM Caregiving Support Roles [15.229339929488162]
言語モデルは、非公式な介護コンテキストにおける会話のサポートのために、ますますデプロイされています。ほとんどの安全評価は、一般的なプロンプトの下でのモデル行動を評価し、重要な疑問を未検討のまま残している。本研究は,社会支援理論に基づく4つの専門家レビュー型サポートロール(インフォーム,コーチ,リレート,リステン)を運用することによって,これを研究する。オンラインアルツハイマー病と認知症関連コミュニティから,5000件のリアルタイム質問に対して3つの言語モデルを用いて評価を行った。
論文参考訳（メタデータ） (2026-05-28T07:04:56Z)
MHSafeEval: Role-Aware Interaction-Level Evaluation of Mental Health Safety in Large Language Models [32.31200693426663]
大規模言語モデル(LLM)は、メンタルヘルスカウンセリングのためのスケーラブルなツールとして、ますます研究されている。臨床的害の相互作用と文脈に依存した性質のため、安全性を評価することは依然として困難である。我々は、ロールアウェアなメンタルヘルス安全分類であるR-MHSafeと、クローズドループエージェントベースの評価フレームワークであるMHSafeEvalを紹介する。
論文参考訳（メタデータ） (2026-04-20T02:37:45Z)
Perfecting Human-AI Interaction at Clinical Scale. Turning Production Signals into Safer, More Human Conversations [10.699629636647414]
本稿では,1億5500万以上の患者とAIのインタラクションをリアルタイムに処理する実運用検証フレームワークを提案する。これらのワイヤ内キューは、データ修正が失敗する障害モードを明らかにし、安全性と信頼性のために実行可能なトレーニングと評価信号を提供する。私たちは、自律的な患者対応ケアのための、最も安全な生成型AIソリューションを構築する際に、安全性、ドキュメント、タスク完了、およびエクイティの計測可能な向上を推進します。
論文参考訳（メタデータ） (2026-02-09T05:43:32Z)
Assessing the Quality of Mental Health Support in LLM Responses through Multi-Attribute Human Evaluation [14.243791046586347]
継続的な治療のギャップ、可用性、資格あるセラピストの不足を特徴とする世界的なメンタルヘルス危機のエスカレートは、スケーラブルなサポートのための有望な道として、Large Language Models (LLMs) を位置づけている。本稿では,治療対話におけるLLM生成応答の評価を目的とした人為的評価手法を提案する。
論文参考訳（メタデータ） (2026-01-26T16:04:19Z)
Encyclo-K: Evaluating LLMs with Dynamically Composed Knowledge Statements [78.87065404966002]
既存のベンチマークは、主に質問レベルで質問をキュレートする。ベンチマーク構築をゼロから再考するステートメントベースのベンチマークであるEncyclo-Kを提案する。
論文参考訳（メタデータ） (2025-12-31T13:55:54Z)
Evaluating & Reducing Deceptive Dialogue From Language Models with Multi-turn RL [64.3268313484078]
大規模言語モデル(LLM)は、顧客サポート、教育、医療など、世界中の何百万もの人々と対話する。故意であれ不注意であれ、偽りのアウトプットを生産する能力は、重大な安全上の懸念を生じさせる。本研究では, LLM が会話中の偽装にどの程度関与しているかを考察し, 偽装を定量化する信念の誤調整尺度を提案する。
論文参考訳（メタデータ） (2025-10-16T05:29:36Z)
Between Help and Harm: An Evaluation of Mental Health Crisis Handling by LLMs [6.0460961868478975]
臨床的にインフォームドされた6つのメンタルヘルス危機カテゴリーの統一分類を導入する。我々は、危機タイプを分類し、安全で適切な応答を生成する能力のために、3つの最先端のLCMをベンチマークする。間接的または曖昧なリスク信号の処理におけるシステム的弱点、定式的および不完全なデフォルト応答への依存、およびユーザコンテキストとの頻繁な不一致を識別する。
論文参考訳（メタデータ） (2025-09-29T14:42:23Z)
Beyond Benchmarks: Dynamic, Automatic And Systematic Red-Teaming Agents For Trustworthy Medical Language Models [87.66870367661342]
大規模言語モデル(LLM)は、医療におけるAIアプリケーションで使用される。 LLMを継続的にストレステストするレッドチームフレームワークは、4つのセーフティクリティカルなドメインで重大な弱点を明らかにすることができる。敵エージェントのスイートは、自律的に変化するテストケースに適用され、安全でないトリガー戦略を特定し、評価する。私たちのフレームワークは、進化可能でスケーラブルで信頼性の高い、次世代の医療AIのセーフガードを提供します。
論文参考訳（メタデータ） (2025-07-30T08:44:22Z)
Evaluating Large Language Models with Psychometrics [59.821829073478376]
本稿では,Large Language Models (LLMs) の心理的構造を定量化するための総合的ベンチマークを提案する。私たちの研究は、13のデータセットで評価された5つの重要な心理的構成要素、人格、価値観、感情的知性、心の理論、自己効力性を特定します。 LLMの自己報告特性と実際のシナリオにおける応答パターンとの間に大きな相違が発見され,その挙動の複雑さが明らかになった。
論文参考訳（メタデータ） (2024-06-25T16:09:08Z)
MACAROON: Training Vision-Language Models To Be Your Engaged Partners [95.32771929749514]
大規模視覚言語モデル(LVLM)は、質問が曖昧でラベルが付されていない場合でも詳細な応答を生成する。本研究では,LVLMを受動的回答提供者から積極的参加パートナーへ移行することを目的とする。我々は、LVLMに対して、ラベルなし質問に対するコントラスト応答対を自律的に生成するように指示する、ContrAstive pReference Optimizationのための自己iMaginAtionであるMACAROONを紹介する。
論文参考訳（メタデータ） (2024-06-20T09:27:33Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。