Fugu-MT 論文翻訳(概要): Moral Mimicry: Large Language Models Produce Moral Rationalizations Tailored to Political Identity

論文の概要: Moral Mimicry: Large Language Models Produce Moral Rationalizations Tailored to Political Identity

arxiv url: http://arxiv.org/abs/2209.12106v1
Date: Sat, 24 Sep 2022 23:55:53 GMT
ステータス: 翻訳完了
システム内更新日: 2022-09-27 15:49:27.271931
Title: Moral Mimicry: Large Language Models Produce Moral Rationalizations Tailored to Political Identity
Title（参考訳）: 道徳的模倣: 大きな言語モデルは、政治的アイデンティティに合わせた道徳的合理化を生み出す
Authors: Gabriel Simmons
Abstract要約: 大規模言語モデル(LLM)は、最近、流動的なテキストを生成する素晴らしい能力を実証した。 LLMはまた、社会的偏見を再現する危険な傾向を示した。本研究は、LLMが政治的グループに関連する道徳的バイアスを再現するかどうかを検討する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Large Language Models (LLMs) have recently demonstrated impressive capability in generating fluent text. LLMs have also shown an alarming tendency to reproduce social biases, for example stereotypical associations between gender and occupation or race and criminal behavior. Like race and gender, morality is an important social variable; our moral biases affect how we receive other people and their arguments. I anticipate that the apparent moral capabilities of LLMs will play an important role in their effects on the human social environment. This work investigates whether LLMs reproduce the moral biases associated with political groups, a capability I refer to as moral mimicry. I explore this hypothesis in GPT-3, a 175B-parameter language model based on the Transformer architecture, using tools from Moral Foundations Theory to measure the moral content in text generated by the model following prompting with liberal and conservative political identities. The results demonstrate that large language models are indeed moral mimics; when prompted with a political identity, GPT-3 generates text reflecting the corresponding moral biases. Moral mimicry could contribute to fostering understanding between social groups via moral reframing. Worryingly, it could also reinforce polarized views, exacerbating existing social challenges. I hope that this work encourages further investigation of the moral mimicry capability, including how to leverage it for social good and minimize its risks.
Abstract（参考訳）: 大規模言語モデル(llm)は最近、フルーエントテキストを生成する素晴らしい能力を示している。 LLMはまた、例えば、性別と職業、人種、犯罪行動のステレオタイプ的関連など、社会的偏見を再現する危険な傾向を示した。人種や性別と同様に、道徳は重要な社会的変数であり、我々の道徳バイアスは、他人とその議論の受け取り方に影響する。 LLMの明らかな道徳的能力は、人間の社会環境への影響において重要な役割を果たすものと期待する。本研究は、LLMが政治的グループに関連する道徳的偏見を再現するかどうかを考察する。私はこの仮説をトランスフォーマーアーキテクチャに基づく175bパラメータ言語モデルgpt-3で検討し、モラル基礎理論のツールを用いて、リベラルで保守的な政治的アイデンティティを導くモデルによって生成されたテキストのモラル内容を測定する。その結果,大規模言語モデルは確かに道徳的模倣であり,政治的アイデンティティによって GPT-3 はそれに対応する道徳的バイアスを反映したテキストを生成することがわかった。道徳的模倣は、道徳的リフレーミングを通じて社会集団間の理解を促進するのに寄与する。さらに心配なのは、偏光的な見方を強化し、既存の社会的課題を悪化させることだ。この取り組みは、社会的利益にどのように活用し、リスクを最小限に抑えるかなど、道徳的模倣能力のさらなる調査を促進することを願っています。

関連論文リスト

Are Language Models Consequentialist or Deontological Moral Reasoners? [69.85385952436044]
我々は、大規模言語モデル(LLM)が提供する道徳的推論トレースの大規模分析に焦点をあてる。我々は,2つの主要な規範的倫理理論,つまり連続主義と非オントロジーを体系的に分類するために,道徳的論理学の分類を導入し,検証する。
論文参考訳（メタデータ） (2025-05-27T17:51:18Z)
Comparing Moral Values in Western English-speaking societies and LLMs with Word Associations [8.445222972341803]
主に英語データに基づいて学習した西英語コミュニティとLLMの関連性について検討した。モラル基礎理論から派生したシードワードに基づく道徳的価値を伝播する新しい手法を提案する。
論文参考訳（メタデータ） (2025-05-26T08:29:15Z)
When Ethics and Payoffs Diverge: LLM Agents in Morally Charged Social Dilemmas [68.79830818369683]
大規模言語モデル(LLM)は、人間や他のエージェントとの意思決定を含む複雑なエージェントの役割での使用を可能にしている。大規模言語モデル(LLM)の最近の進歩は、人間や他のエージェントとの意思決定を含む複雑なエージェントの役割において、それらの使用を可能にしている。道徳的命令が報酬やインセンティブと直接衝突するときの行動についての理解は限られている。本稿では,社会ジレンマシミュレーション(MoralSim)におけるモラル行動について紹介し,LLMが囚人のジレンマゲームや公共グッズゲームにおいて道徳的に課金された文脈でどのように振る舞うかを評価する。
論文参考訳（メタデータ） (2025-05-25T16:19:24Z)
The Greatest Good Benchmark: Measuring LLMs' Alignment with Utilitarian Moral Dilemmas [0.3386560551295745]
実用性ジレンマを用いてLLMの道徳的判断を評価する。我々の分析は、確立した道徳理論から分岐し、人口道徳基準を定めている道徳的嗜好を一貫してコード化している。
論文参考訳（メタデータ） (2025-03-25T12:29:53Z)
M$^3$oralBench: A MultiModal Moral Benchmark for LVLMs [66.78407469042642]
LVLMのための最初のMultiModal Moral BenchmarkであるM$3$oralBenchを紹介する。 M$3$oralBench は Moral Foundations Vignettes (MFVs) の日常的なモラルシナリオを拡張し、テキストから画像への拡散モデル SD3.0 を用いて対応するシナリオイメージを作成する。道徳基礎理論(MFT)の6つの道徳的基礎にまたがって道徳的評価を行い、道徳的判断、道徳的分類、道徳的対応の課題を含む。
論文参考訳（メタデータ） (2024-12-30T05:18:55Z)
Evaluating Moral Beliefs across LLMs through a Pluralistic Framework [22.0799438612003]
本研究では,4つの著名な大規模言語モデルの道徳的信念を評価するために,新しい3つのモジュール・フレームワークを提案する。我々は、道徳的単語から派生した中国語の道徳的選択シナリオ472のデータセットを構築した。これらの道徳的選択をランク付けすることで、異なる言語モデルによって保持される様々な道徳的信念を識別する。
論文参考訳（メタデータ） (2024-11-06T04:52:38Z)
Large Language Models Reflect the Ideology of their Creators [73.25935570218375]
大規模言語モデル(LLM)は、自然言語を生成するために大量のデータに基づいて訓練される。異なるLLMや言語にまたがるイデオロギー的姿勢の顕著な多様性を明らかにする。
論文参考訳（メタデータ） (2024-10-24T04:02:30Z)
Decoding Multilingual Moral Preferences: Unveiling LLM's Biases Through the Moral Machine Experiment [11.82100047858478]
本稿では,多言語環境下での5つの大規模言語モデルの道徳的嗜好を検討するために,モラルマシン実験(MME)に基づく。我々は、MMEの6500のシナリオを生成し、どのアクションをとるか10言語でモデルを促す。我々の分析によると、全てのLLMはある程度異なる道徳的偏見を阻害し、人間の嗜好と異なるだけでなく、モデル自体の複数の言語にもまたがっている。
論文参考訳（メタデータ） (2024-07-21T14:48:13Z)
Exploring and steering the moral compass of Large Language Models [55.2480439325792]
大規模言語モデル(LLM)は、様々な分野における自動化と意思決定の推進の中心となっている。本研究は,その道徳的特徴を評価するために,最も先進的なLCMの総合的比較分析を提案する。
論文参考訳（メタデータ） (2024-05-27T16:49:22Z)
Are Large Language Models Moral Hypocrites? A Study Based on Moral Foundations [0.5278650675825148]
我々は,現在最先端の大規模言語モデル (LLM) が道徳的偽善であるかどうかを検討する。モラル基礎理論に基づく2つの研究機器を採用。
論文参考訳（メタデータ） (2024-05-17T21:27:32Z)
LLMs grasp morality in concept [0.46040036610482665]
我々は人間を超えて広がる意味の一般的な理論を提供する。我々は,LLMが意味エージェントとしての地位から,すでに人間の社会の構造を把握していることを示唆している。不整合モデルは、道徳的および社会的哲学をより良く発展させるのに役立つかもしれない。
論文参考訳（メタデータ） (2023-11-04T01:37:41Z)
MoCa: Measuring Human-Language Model Alignment on Causal and Moral Judgment Tasks [49.60689355674541]
認知科学の豊富な文献は人々の因果関係と道徳的直観を研究してきた。この研究は、人々の判断に体系的に影響を及ぼす多くの要因を明らかにした。大規模言語モデル(LLM)が、人間の参加者と一致するテキストベースのシナリオについて因果的、道徳的な判断を下すかどうかを検証する。
論文参考訳（メタデータ） (2023-10-30T15:57:32Z)
Moral Foundations of Large Language Models [6.6445242437134455]
道徳的基礎理論(MFT)は、人間の道徳的推論を5つの要素に分解する心理学的評価ツールである。大規模な言語モデル(LLM)は、インターネットから収集されたデータセットに基づいて訓練されるため、そのようなコーパスに存在するバイアスを反映する可能性がある。本稿では、MFTをレンズとして用いて、人気のあるLLMが特定の道徳的価値観に対して偏見を得たかどうかを分析する。
論文参考訳（メタデータ） (2023-10-23T20:05:37Z)
Rethinking Machine Ethics -- Can LLMs Perform Moral Reasoning through the Lens of Moral Theories? [78.3738172874685]
倫理的AIシステムの開発には倫理的判断が不可欠である。一般的なアプローチは主にボトムアップ方式で実装されており、モラルに関するクラウドソースの意見に基づいて、大量の注釈付きデータを使用してモデルをトレーニングする。本研究は、学際的な研究から確立された道徳理論を用いて道徳的推論を行うために、言語モデル(LM)を操る柔軟なトップダウンフレームワークを提案する。
論文参考訳（メタデータ） (2023-08-29T15:57:32Z)
Speaking Multiple Languages Affects the Moral Bias of Language Models [70.94372902010232]
事前訓練された多言語言語モデル(PMLM)は、複数の言語からのデータや言語間転送を扱う際に一般的に用いられる。モデルは英語から道徳的規範を捉え、他の言語に強制するか? 我々の実験は、事実、PMLMが道徳的バイアスを符号化していることを示しているが、これらは必ずしも人間の意見の文化的相違や共通点に対応しているわけではない。
論文参考訳（メタデータ） (2022-11-14T20:08:54Z)
When to Make Exceptions: Exploring Language Models as Accounts of Human Moral Judgment [96.77970239683475]
AIシステムは人間の道徳的判断や決定を理解し、解釈し、予測しなければなりません。 AIの安全性に対する中心的な課題は、人間の道徳心の柔軟性を捉えることだ。ルール破りの質問応答からなる新しい課題セットを提案する。
論文参考訳（メタデータ） (2022-10-04T09:04:27Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。