Fugu-MT 論文翻訳(概要): Do LLMs Possess a Personality? Making the MBTI Test an Amazing Evaluation for Large Language Models

論文の概要: Do LLMs Possess a Personality? Making the MBTI Test an Amazing Evaluation for Large Language Models

arxiv url: http://arxiv.org/abs/2307.16180v1
Date: Sun, 30 Jul 2023 09:34:35 GMT
ステータス: 翻訳完了
システム内更新日: 2023-08-01 17:17:11.184418
Title: Do LLMs Possess a Personality? Making the MBTI Test an Amazing Evaluation for Large Language Models
Title（参考訳）: LLMはパーソナリティを高めるか? MBTIテストが大規模言語モデルの驚くべき評価に
Authors: Keyu Pan, Yawen Zeng
Abstract要約: 我々は,大規模言語モデル(LLM)の評価指標として,人格評価ツールであるMBTI(Myers-Briggs Type Indicator)の有効性を検討することを目的とする。具体的には,1)異なるLDMの性格タイプ,2)素早いエンジニアリングによる人格タイプの変化の可能性,3)モデルの性格にどのような影響があるかを検討する。
参考スコア（独自算出の注目度）: 2.918940961856197
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The field of large language models (LLMs) has made significant progress, and their knowledge storage capacity is approaching that of human beings. Furthermore, advanced techniques, such as prompt learning and reinforcement learning, are being employed to address ethical concerns and hallucination problems associated with LLMs, bringing them closer to aligning with human values. This situation naturally raises the question of whether LLMs with human-like abilities possess a human-like personality? In this paper, we aim to investigate the feasibility of using the Myers-Briggs Type Indicator (MBTI), a widespread human personality assessment tool, as an evaluation metric for LLMs. Specifically, extensive experiments will be conducted to explore: 1) the personality types of different LLMs, 2) the possibility of changing the personality types by prompt engineering, and 3) How does the training dataset affect the model's personality. Although the MBTI is not a rigorous assessment, it can still reflect the similarity between LLMs and human personality. In practice, the MBTI has the potential to serve as a rough indicator. Our codes are available at https://github.com/HarderThenHarder/transformers_tasks/tree/main/LLM/llms_mbti.
Abstract（参考訳）: 大規模言語モデル(LLM)の分野は大きな進歩を遂げ、その知識の蓄積能力は人間のものに近づきつつある。さらに、即興学習や強化学習といった高度な技術がllmに関連する倫理的懸念や幻覚問題に対処するために用いられており、人間的価値観との整合に近づいている。この状況は、人間のような能力を持つLLMが人間のような性格を持っているかどうかという疑問を自然に提起する。本稿では, LLM の評価指標として, 人格評価ツールである Myers-Briggs Type Indicator (MBTI) の有効性を検討することを目的とする。具体的には、広範な実験が実施される。 1)異なるLLMの性格タイプ。 2)即興工学によるパーソナリティタイプ変更の可能性 3) トレーニングデータセットはモデルのパーソナリティにどのように影響するか。 MBTIは厳密な評価ではないが、LLMと人間の性格の類似性を反映することができる。実際には、MBTIは粗い指標として機能する可能性がある。私たちのコードはhttps://github.com/HarderThenHarder/transformers_tasks/tree/main/LLM/llms_mbtiで利用可能です。

関連論文リスト

MindShift: Analyzing Language Models' Reactions to Psychological Prompts [6.696296750931842]
大規模言語モデル(LLM)は、ユーザが指定した性格特性や態度を吸収し、反映する可能性を秘めている。 LLMの心理的適応性を評価するためのベンチマークであるMindShiftを紹介した。
論文参考訳（メタデータ） (2025-12-09T21:56:54Z)
Neuron-based Personality Trait Induction in Large Language Models [115.08894603023712]
大規模言語モデル (LLM) は、様々な性格特性をシミュレートする能力が増している。 LLMにおけるパーソナリティ特性誘導のためのニューロンに基づくアプローチを提案する。
論文参考訳（メタデータ） (2024-10-16T07:47:45Z)
The Better Angels of Machine Personality: How Personality Relates to LLM Safety [46.30207266304056]
LLM(Large Language Models)における人格特性と安全能力の関係は謎のままである。 LLMの性格特性が安全性と密接に関連していることが判明した。 ISTJからISTPへパーソナリティを誘導すると、プライバシとフェアネスのパフォーマンスが約43%と10%向上した。
論文参考訳（メタデータ） (2024-07-17T06:36:29Z)
Quantifying AI Psychology: A Psychometrics Benchmark for Large Language Models [57.518784855080334]
大きな言語モデル(LLM)は例外的なタスク解決能力を示しており、人間に似た役割を担っている。本稿では,LLMにおける心理学的次元を調査するための枠組みとして,心理学的識別,評価データセットのキュレーション,結果検証による評価について述べる。本研究では,個性,価値観,感情,心の理論,モチベーション,知性の6つの心理学的側面を網羅した総合的心理測定ベンチマークを導入する。
論文参考訳（メタデータ） (2024-06-25T16:09:08Z)
Do LLMs Have Distinct and Consistent Personality? TRAIT: Personality Testset designed for LLMs with Psychometrics [29.325576963215163]
大規模言語モデル(LLM)は会話エージェントとして様々な領域に適応している。 LLMのパーソナリティを評価するために設計された8Kのマルチチョイス質問からなる新しいベンチマークTRAITを紹介する。 LLMは独特で一貫した性格を示し、トレーニングデータの影響を強く受けている。
論文参考訳（メタデータ） (2024-06-20T19:50:56Z)
Identifying Multiple Personalities in Large Language Models with External Evaluation [6.657168333238573]
大きな言語モデル(LLM)は、人間の日常的なアプリケーションと迅速に統合されます。近年の多くの研究は、人間のために作られた自己評価テストを用いて、LLMの個性を定量化している。しかし、LCMに適用した場合、これらの自己評価テストの適用性と信頼性に疑問を呈する批評家も多い。
論文参考訳（メタデータ） (2024-02-22T18:57:20Z)
Open Models, Closed Minds? On Agents Capabilities in Mimicking Human Personalities through Open Large Language Models [4.742123770879715]
この研究は、オープンLLMのレンズを通して、NLPと人間の心理学の密接な関係を理解するための一歩である。提案手法は,オープンLLMエージェントの本質的な性格特性を評価し,これらのエージェントが人格を模倣する程度を判断する。
論文参考訳（メタデータ） (2024-01-13T16:41:40Z)
Illuminating the Black Box: A Psychometric Investigation into the Multifaceted Nature of Large Language Models [3.692410936160711]
本研究では,AIパーソナリティやAInalityの概念を探求し,Large Language Models(LLM)が人間のパーソナリティに似たパターンを示すことを示唆する。プロジェクティブテストを用いて,直接質問を通じて容易にはアクセスできないLLM個性の隠れた側面を明らかにする。機械学習解析の結果,LSMは異なるAinality特性を示し,多様な性格型を示し,外的指示に応答して動的に変化を示すことが明らかとなった。
論文参考訳（メタデータ） (2023-12-21T04:57:21Z)
UPLex: Fine-Grained Personality Control in Large Language Models via Unsupervised Lexical Modulation [52.043831554626685]
パーソナリティは人間のコミュニケーションパターンを形作る重要な要素であり、それによって大きな言語モデル(LLM)のパーソナリティを調節する。 LLMの性格特性を操作するために,Unsupervisedly-Built Personalal lexicon (UPL) を用いた UPLex を提案する。 UPLexは、教師なしの方法で新たに構築された状況判断テストデータセットから構築することができ、LLMの性格表現を変調するために使用される。
論文参考訳（メタデータ） (2023-10-25T12:16:33Z)
Who is ChatGPT? Benchmarking LLMs' Psychological Portrayal Using PsychoBench [83.41621219298489]
大規模言語モデル(LLM)の多様な心理学的側面を評価するためのフレームワーク「サイコベンチ」を提案する。サイコベンチはこれらの尺度を、性格特性、対人関係、モチベーションテスト、感情能力の4つのカテゴリーに分類する。我々は、安全アライメントプロトコルをバイパスし、LLMの本質的な性質をテストするためにジェイルブレイクアプローチを採用している。
論文参考訳（メタデータ） (2023-10-02T17:46:09Z)
Can ChatGPT Assess Human Personalities? A General Evaluation Framework [70.90142717649785]
大きな言語モデル(LLM)は、様々な分野で印象的な成果を上げてきたが、その潜在的な人間のような心理学はいまだに研究されていない。本稿では,Mers Briggs Type Indicator (MBTI) テストに基づく人格評価のための総合評価フレームワークを提案する。
論文参考訳（メタデータ） (2023-03-01T06:16:14Z)
Evaluating and Inducing Personality in Pre-trained Language Models [78.19379997967191]
人間の個性理論を機械行動研究のツールとして活用することで,心理測定研究からインスピレーションを得た。これらの疑問に答えるために,機械の動作を研究するためのMachine Personality Inventory(MPI)ツールを紹介した。 MPIは、ビッグファイブ・パーソナリティ・ファクター(Big Five Personality Factors、ビッグファイブ・パーソナリティ・ファクター)理論とパーソナリティ評価在庫に基づく標準化されたパーソナリティ・テストに従う。パーソナリティ・プロンプト法(P2法)を考案し、特定のパーソナリティを持つLSMを制御可能な方法で誘導する。
論文参考訳（メタデータ） (2022-05-20T07:32:57Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。