Fugu-MT 論文翻訳(概要): Inducing anxiety in large language models increases exploration and bias

論文の概要: Inducing anxiety in large language models increases exploration and bias

arxiv url: http://arxiv.org/abs/2304.11111v1
Date: Fri, 21 Apr 2023 16:29:43 GMT
ステータス: 翻訳完了
システム内更新日: 2023-04-24 13:56:09.195730
Title: Inducing anxiety in large language models increases exploration and bias
Title（参考訳）: 大規模言語モデルにおける不安誘発は探索とバイアスを増加させる
Authors: Julian Coda-Forno, Kristin Witte, Akshay K. Jagadish, Marcel Binz, Zeynep Akata, Eric Schulz
Abstract要約: 我々は、生成事前学習型トランスフォーマー3.5に焦点をあて、精神医学でよく研究される課題に焦点をあてる。以上の結果から, GPT-3.5は共通の不安アンケートに強く反応し, 被験者よりも高い不安スコアが得られた。 GPT-3.5の反応は感情誘導プロンプトを用いて予測可能に変更できる。
参考スコア（独自算出の注目度）: 29.833677055101326
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Large language models are transforming research on machine learning while galvanizing public debates. Understanding not only when these models work well and succeed but also why they fail and misbehave is of great societal relevance. We propose to turn the lens of computational psychiatry, a framework used to computationally describe and modify aberrant behavior, to the outputs produced by these models. We focus on the Generative Pre-Trained Transformer 3.5 and subject it to tasks commonly studied in psychiatry. Our results show that GPT-3.5 responds robustly to a common anxiety questionnaire, producing higher anxiety scores than human subjects. Moreover, GPT-3.5's responses can be predictably changed by using emotion-inducing prompts. Emotion-induction not only influences GPT-3.5's behavior in a cognitive task measuring exploratory decision-making but also influences its behavior in a previously-established task measuring biases such as racism and ableism. Crucially, GPT-3.5 shows a strong increase in biases when prompted with anxiety-inducing text. Thus, it is likely that how prompts are communicated to large language models has a strong influence on their behavior in applied settings. These results progress our understanding of prompt engineering and demonstrate the usefulness of methods taken from computational psychiatry for studying the capable algorithms to which we increasingly delegate authority and autonomy.
Abstract（参考訳）: 大規模な言語モデルは、公開討論の場を広げながら、機械学習の研究を変革している。これらのモデルがうまく機能し、成功したときだけでなく、なぜ失敗し、失敗するかを理解することは、社会的関連性が高い。本稿では, 異常な振る舞いを計算的に記述し, 修正するフレームワークである計算精神医学のレンズを, これらのモデルによって生成された出力に変換することを提案する。我々は、生成事前学習型トランスフォーマー3.5に着目し、精神医学でよく研究される課題に焦点をあてる。以上の結果から, GPT-3.5は共通の不安アンケートに強く反応し, 被験者よりも高い不安スコアが得られた。さらに、GPT-3.5の応答は感情誘導プロンプトを用いて予測可能に変更できる。感情誘導は、探索的意思決定を測定する認知タスクにおけるGPT-3.5の行動に影響を及ぼすだけでなく、人種差別や能力主義のようなバイアスを測定する以前に確立されたタスクにおける行動にも影響を及ぼす。重要なことに、GPT-3.5は不安を誘発するテキストによってバイアスが強く増加する。したがって、プロンプトが大規模言語モデルにどのように伝達されるかは、適用された環境での行動に強い影響を与える可能性が高い。これらの結果は,即座工学の理解を前進させ,権威と自律性を委譲する有能なアルゴリズムを研究するための計算心理学から取られた手法の有用性を実証する。

関連論文リスト

MindShift: Analyzing Language Models' Reactions to Psychological Prompts [6.696296750931842]
大規模言語モデル(LLM)は、ユーザが指定した性格特性や態度を吸収し、反映する可能性を秘めている。 LLMの心理的適応性を評価するためのベンチマークであるMindShiftを紹介した。
論文参考訳（メタデータ） (2025-12-09T21:56:54Z)
Large Language Models Do Not Simulate Human Psychology [0.8039067099377079]
一部の研究は、Large Language Models (LLM) が人間の心理学をシミュレートできるかもしれないことを示唆している。我々は、LLMが人間の心理学をシミュレートする仮説に対する概念的議論を提供する。 LLMとヒトの反応に顕著な相違が生じていることを示す。
論文参考訳（メタデータ） (2025-08-09T11:56:59Z)
Investigating VLM Hallucination from a Cognitive Psychology Perspective: A First Step Toward Interpretation with Intriguing Observations [60.63340688538124]
幻覚は、視覚言語モデル(VLM)で積極的に研究されている長年の問題である。既存の研究は、幻覚は技術的な制限や梅毒のバイアスによるもので、後者はモデルがユーザの期待に沿う誤った回答を生み出す傾向があることを意味している。本研究では, VLMの認知バイアスを分類し, サイコフィナンシー, 論理的不整合, 新たに同定された VLM の行動, 権威へのアピールなど, 幻覚へと導く。
論文参考訳（メタデータ） (2025-07-03T19:03:16Z)
From Reddit to Generative AI: Evaluating Large Language Models for Anxiety Support Fine-tuned on Social Media Data [0.931556339267682]
本研究では,大規模言語モデル(LLM)を,不安支援における潜在的有用性に対して体系的に評価する。本手法は, (i) 言語的品質, (ii) 安全性と信頼性, (iii) 支援性という3つの主要な基準を取り入れた混合メソッド評価フレームワークを利用する。その結果, 自然不安関連データを用いた微調整LDMは, 言語的品質を向上するが, 毒性やバイアスが増大し, 感情応答性が低下することがわかった。
論文参考訳（メタデータ） (2025-05-24T02:07:32Z)
Self-Adaptive Cognitive Debiasing for Large Language Models in Decision-Making [71.71796367760112]
大規模言語モデル(LLM)は意思決定アプリケーションをサポートする可能性を示している。我々は,自己適応型認知脱バイアス(SACD)という認知脱バイアス手法を提案する。オープンウェイトとクローズドウェイトの両方を用いた金融・医療・法的意思決定タスクにおけるSACDの評価を行った。
論文参考訳（メタデータ） (2025-04-05T11:23:05Z)
Mind What You Ask For: Emotional and Rational Faces of Persuasion by Large Language Models [0.0]
大規模言語モデル(LLM)は,回答の価値を説得する上で,ますます効果的になっています。本研究は,12の異なる言語モデルで使用される反応の心理言語学的特徴について検討した。 LLMによる大量誤報のリスクを軽減できるかどうかを問う。
論文参考訳（メタデータ） (2025-02-13T15:15:53Z)
CBEval: A framework for evaluating and interpreting cognitive biases in LLMs [1.4633779950109127]
大きな言語モデルは、認知過程において顕著なギャップを示す。人間の生成したデータのリフレクションとして、これらのモデルは認知バイアスを継承する可能性がある。
論文参考訳（メタデータ） (2024-12-04T05:53:28Z)
Cognitive Biases in Large Language Models: A Survey and Mitigation Experiments [24.15688619889342]
大規模言語モデル(LLM)は、人間によって書かれた大きなコーパスで訓練され、様々なタスクで高いパフォーマンスを示す。人間は認知バイアスの影響を受けやすいため、LSMはこれらのバイアスに影響され、不合理な意思決定につながる。
論文参考訳（メタデータ） (2024-11-30T02:37:59Z)
Persuasion with Large Language Models: a Survey [49.86930318312291]
大規模言語モデル (LLM) は説得力のあるコミュニケーションに新たな破壊的可能性を生み出している。政治、マーケティング、公衆衛生、電子商取引、慈善事業などの分野では、LLMシステムズは既に人間レベルや超人的説得力を達成している。 LLMをベースとした説得の現在と将来の可能性は、倫理的・社会的リスクを著しく引き起こす可能性が示唆された。
論文参考訳（メタデータ） (2024-11-11T10:05:52Z)
StressPrompt: Does Stress Impact Large Language Models and Human Performance Similarly? [7.573284169975824]
本研究では,Large Language Models (LLMs) がヒトに類似したストレス応答を示すかを検討する。我々はストレスプロンプトと呼ばれる新しいプロンプトを開発し、様々なレベルのストレスを誘発するように設計された。この結果は、LLMが人間と同様に、Yerkes-Dodson法則と一致して、適度なストレスの下で最適に機能することを示唆している。
論文参考訳（メタデータ） (2024-09-14T08:32:31Z)
Quantifying AI Psychology: A Psychometrics Benchmark for Large Language Models [57.518784855080334]
大きな言語モデル(LLM)は例外的なタスク解決能力を示しており、人間に似た役割を担っている。本稿では,LLMにおける心理学的次元を調査するための枠組みとして,心理学的識別,評価データセットのキュレーション,結果検証による評価について述べる。本研究では,個性,価値観,感情,心の理論,モチベーション,知性の6つの心理学的側面を網羅した総合的心理測定ベンチマークを導入する。
論文参考訳（メタデータ） (2024-06-25T16:09:08Z)
Can AI Relate: Testing Large Language Model Response for Mental Health Support [23.97212082563385]
大型言語モデル(LLM)はすでにニューヨーク・ラングーン、ダナ・ファーバー、NHSなどの病院システムで臨床使用のために試験されている。精神医療の自動化に向けて, LLM 反応が有効かつ倫理的な道筋であるか否かを評価するための評価枠組みを開発する。
論文参考訳（メタデータ） (2024-05-20T13:42:27Z)
"I'm Not Sure, But...": Examining the Impact of Large Language Models' Uncertainty Expression on User Reliance and Trust [51.542856739181474]
不確実性の自然言語表現の違いが、参加者の信頼、信頼、全体的なタスクパフォーマンスにどのように影響するかを示す。その結果, 一人称表情は, 参加者のシステムに対する信頼度を低下させ, 参加者の正確性を高めつつ, システムの回答に同調する傾向にあることがわかった。以上の結果から,不確実性の自然言語表現の使用は,LLMの過度な依存を軽減するための効果的なアプローチである可能性が示唆された。
論文参考訳（メタデータ） (2024-05-01T16:43:55Z)
Large Language Models are Capable of Offering Cognitive Reappraisal, if Guided [38.11184388388781]
大規模言語モデル(LLM)は感情的サポートの新しい機会を提供する。この研究は、認知的再評価に取り組み、第一歩を踏み出す。我々は、認知的再評価反応を生成するLLMのゼロショット能力について、第一種専門家による評価を行う。
論文参考訳（メタデータ） (2024-04-01T17:56:30Z)
HealMe: Harnessing Cognitive Reframing in Large Language Models for Psychotherapy [25.908522131646258]
メンタルエンハンスメント(HealMe)モデルにおける適応言語によるヘルピングとエンパワーメントについて紹介する。この新しい認知的リフレーミング療法は、根深い否定的思考に効果的に対処し、合理的でバランスの取れた視点を育む。我々は、認知リフレーミングのパフォーマンスを厳格に評価するために特別に設計された、包括的で専門的な心理学的評価指標を採用した。
論文参考訳（メタデータ） (2024-02-26T09:10:34Z)
Fine-Grained Self-Endorsement Improves Factuality and Reasoning [72.83651220132495]
本研究は, 大規模言語モデル (LLM) 世代を推定時に改善するために, ファクト・コンプレッション・幻覚を緩和する。本稿では,複数のサンプル応答におけるファクトレベルの詳細な比較を生かした自己組織化フレームワークを提案する。
論文参考訳（メタデータ） (2024-02-23T22:24:40Z)
Do LLMs exhibit human-like response biases? A case study in survey design [66.1850490474361]
大規模言語モデル(LLM)が人間の反応バイアスをどの程度反映しているかについて検討する。アンケート調査では, LLMが人間のような応答バイアスを示すかどうかを評価するためのデータセットとフレームワークを設計した。 9つのモデルに対する総合的な評価は、一般のオープンかつ商用のLCMは、一般的に人間のような振る舞いを反映しないことを示している。
論文参考訳（メタデータ） (2023-11-07T15:40:43Z)
The Confidence-Competence Gap in Large Language Models: A Cognitive Study [3.757390057317548]
大規模言語モデル(LLM)は、様々な領域にわたるパフォーマンスに対して、広く注目を集めている。我々はこれらのモデルを多様なアンケートと実世界のシナリオで活用する。この結果から,モデルが誤答しても高い信頼性を示す興味深い事例が判明した。
論文参考訳（メタデータ） (2023-09-28T03:50:09Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。