論文の概要: Lexical Anthropomorphization Influences on Moral Judgments of AI Bad Behavior
- arxiv url: http://arxiv.org/abs/2604.25814v1
- Date: Tue, 28 Apr 2026 16:22:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-29 16:49:17.947693
- Title: Lexical Anthropomorphization Influences on Moral Judgments of AI Bad Behavior
- Title(参考訳): 語彙的擬人化がAI悪行動の道徳的判断に及ぼす影響
- Authors: Jaime Banks, Nicholas David Bowman, Roman Saladino,
- Abstract要約: 我々は、語彙型素数がAI道徳的性格、行動道徳、行動責任の判断を形作るかどうかを検証した。
結果は、言語とデザインの手がかりが、誤った行動のAIの道徳的判断にほとんど影響を与えていないことを示している。
プライム・ドリフト、ホルン・エフェクト、エゴジスティック・バリュー・オリエンテーションはAIの道徳的判断の潜在的に重要な予測因子として浮上した。
- 参考スコア(独自算出の注目度): 3.8870795921263723
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Anthropomorphic language describing artificial intelligence (AI) is widespread in media, policy, and everyday discourse; so too are discussions of AI bad behavior, from hallucinations to inappropriate comments. How does humanizing language about AI shape moral judgments when AI behaves badly? Across four experiments (total N = 1,020), we tested whether lexical anthropomorphism (LA) primes shape judgments of AI moral character, behavior morality, and behavioral responsibility. Studies 1-3 tested interactions between anthropomorphic language and humanizing design cues (icons, names, self-referencing) in the context of amoral errors. Study 4 extended this to genuinely immoral AI behavior across seven moral-violation types. Results indicate humanizing language and design cues have little influence on moral judgments of misbehaving AI. Where effects emerged, high-anthropomorphic primes elevated perceptions of an AI's capacity for dishonesty. The type of moral violation observed was the strongest predictor of moral judgments, with harm and degradation violations producing the broadest negative character assessments. Prime drift, horn effects, and egoistic value orientations emerged as potentially important predictors of AI moral judgments.
- Abstract(参考訳): 人工知能(AI)を記述した擬人化言語は、メディア、ポリシー、日々の会話に広く浸透しており、幻覚から不適切なコメントまで、AIの悪い行動に関する議論も行われている。
AIに関する言語を人間化することは、AIがひどく振る舞うときにどのように道徳的判断を形成するのか?
4つの実験 (total N = 1,020) において、Lexical anthropomorphism (LA) primes がAIモラル特性、行動モラル、行動責任の判断を形作るかどうかを検討した。
研究1-3では、人為的言語と人為的デザインの手がかり(アイコン、名前、自己参照)の非道徳的誤りの文脈での相互作用を検証した。
研究4は、これを7つの道徳違反タイプで真に不道徳なAI行動に拡張した。
結果は、言語とデザインの手がかりが、誤った行動のAIの道徳的判断にほとんど影響を与えていないことを示している。
効果が現れると、人為的な素数はAIの不正な能力に対する認識を高めた。
観察された道徳的違反のタイプは、道徳的判断の最も強い予測者であり、害と劣化の違反は、最も広い否定的な性格評価を生み出した。
プライム・ドリフト、ホルン・エフェクト、エゴジスティック・バリュー・オリエンテーションはAIの道徳的判断の潜在的に重要な予測因子として浮上した。
関連論文リスト
- Synthetic Socratic Debates: Examining Persona Effects on Moral Decision and Persuasion Dynamics [22.87895625823716]
実世界の道徳ジレンマに関するAI-AI討論会において,多次元ペルソナ効果の大規模研究を行った。
以上の結果から,ペルソナは政治的イデオロギーや人格特性に強く影響していることが示唆された。
説得力のある成功は特徴によって異なり、リベラルでオープンな個性はより高いコンセンサスと勝利率に達する。
論文 参考訳(メタデータ) (2025-06-14T23:14:49Z) - The AI Double Standard: Humans Judge All AIs for the Actions of One [0.0]
AIが増殖するにつれて、あるAIに対する道徳的な態度が他のAIに対する態度に流出することで、知覚が絡まってしまう可能性がある。
我々は、2つの事前登録された実験において、AIや人間のエージェントの一見有害で不道徳な行動が、他のAIや人間に対する態度にどのように影響するかをテストした。
論文 参考訳(メタデータ) (2024-12-08T19:26:52Z) - Human Bias in the Face of AI: Examining Human Judgment Against Text Labeled as AI Generated [48.70176791365903]
本研究では、偏見がAIと人為的コンテンツの知覚をどう形成するかを考察する。
ラベル付きおよびラベルなしコンテンツに対するヒトのラッカーの反応について検討した。
論文 参考訳(メタデータ) (2024-09-29T04:31:45Z) - Decoding moral judgement from text: a pilot study [0.0]
道徳的判断は、認知的・感情的な次元に関わる複雑な人間の反応である。
受動的脳-コンピュータインタフェースを用いたテキスト刺激による道徳的判断復号の実現可能性について検討する。
論文 参考訳(メタデータ) (2024-05-28T20:31:59Z) - Attributions toward Artificial Agents in a modified Moral Turing Test [0.6284264304179837]
我々は、一般的な高度なAI言語モデルであるGPT-4と実際の人間の道徳的評価を区別するよう、人々に求めている。
299人の米国成人の代表的サンプルは、AIの道徳的推論を、ほぼすべての次元において、人間よりも品質が優れていると評価した。
言語モデルの出現は、人間よりも質が高いと認識される道徳的反応を生み出すことができるようになり、人々がAIから潜在的に有害な道徳的ガイダンスを受け入れる可能性があるという懸念が高まる。
論文 参考訳(メタデータ) (2024-04-03T13:00:47Z) - Can Machines Imitate Humans? Integrative Turing-like tests for Language and Vision Demonstrate a Narrowing Gap [56.611702960809644]
3つの言語タスクと3つの視覚タスクで人間を模倣するAIの能力をベンチマークする。
次に,人間1,916名,AI10名を対象に,72,191名のチューリング様試験を行った。
模倣能力は従来のAIパフォーマンス指標と最小限の相関を示した。
論文 参考訳(メタデータ) (2022-11-23T16:16:52Z) - When to Make Exceptions: Exploring Language Models as Accounts of Human
Moral Judgment [96.77970239683475]
AIシステムは人間の道徳的判断や決定を理解し、解釈し、予測しなければなりません。
AIの安全性に対する中心的な課題は、人間の道徳心の柔軟性を捉えることだ。
ルール破りの質問応答からなる新しい課題セットを提案する。
論文 参考訳(メタデータ) (2022-10-04T09:04:27Z) - Aligning AI With Shared Human Values [85.2824609130584]
私たちは、正義、幸福、義務、美徳、常識道徳の概念にまたがる新しいベンチマークであるETHICSデータセットを紹介します。
現在の言語モデルは、基本的な人間の倫理的判断を予測できる有望だが不完全な能力を持っている。
私たちの研究は、今日の機械倫理の進歩を示しており、人間の価値観に合わせたAIへの足掛かりを提供する。
論文 参考訳(メタデータ) (2020-08-05T17:59:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。