論文の概要: Why Sampling Is Not Choosing: Intentionality, Agency, and Moral Responsibility in Large Language Models
- arxiv url: http://arxiv.org/abs/2606.13441v2
- Date: Sat, 13 Jun 2026 11:39:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 13:45:31.20986
- Title: Why Sampling Is Not Choosing: Intentionality, Agency, and Moral Responsibility in Large Language Models
- Title(参考訳): サンプリングが選択できない理由:大規模言語モデルにおける意図性、エージェンシー、道徳的責任
- Authors: Joseph Keshet,
- Abstract要約: 我々は、道徳的責任には本質的な意図と自己貢献的な行動に基づくコミットメントを持つ機関が必要であると論じる。
我々は、意図的な姿勢、機能主義、適合主義、そしてモデルアウトプットにおける道徳的推論の存在に対する反論に対処する。
- 参考スコア(独自算出の注目度): 11.660534590232494
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advances in large language models (LLMs) have prompted claims that such systems exhibit agency or qualify as moral agents. This paper argues that these attributions are misguided. We maintain that moral responsibility requires commitment-bearing agency grounded in intrinsic intentionality and self-attributed action, and that such agency constitutes the form of free will relevant to responsibility. Although LLMs generate coherent and normatively evaluable outputs, their operation is fully characterized by probabilistic input-output mappings learned from data. Their apparent intentionality is derived rather than intrinsic, and their outputs are neither owned as commitments nor guided by reasons. Variability introduced by stochastic sampling does not amount to choice or authorship. We address objections from the intentional stance, functionalism, compatibilism, and the presence of moral reasoning in model outputs, arguing that none suffice to establish genuine agency.
- Abstract(参考訳): 大規模言語モデル (LLMs) の最近の進歩は、そのようなシステムが倫理的エージェントとしての能力を示すと主張している。
この論文はこれらの属性が誤認されていると論じている。
我々は、道徳的責任には本質的な意図と自己貢献的な行動に基づくコミットメントを持つ機関が必要であり、そのような機関は、責任に関連する自由意志の形式を構成している、と維持する。
LLMはコヒーレントで規範的に評価可能な出力を生成するが、その動作はデータから学習した確率的な入出力マッピングによって完全に特徴付けられる。
彼らの明らかな意図は本質的なものではなく引き起こされ、その成果はコミットメントとして、あるいは理由によって導かれるものではない。
確率的サンプリングによって導入された可変性は、選択や著者によるものではない。
我々は、意図的な姿勢、機能主義、コンパチビズム、そしてモデルアウトプットにおける道徳的推論の存在からの反対に対処する。
関連論文リスト
- Does Reasoning Preserve Alignment? On the Trustworthiness of Large Reasoning Models [55.788110316999166]
教師付き微調整, RL を用いた後訓練, および命令調整ベースラインに対する蒸留による推論モデルの比較を行った。
推論モデルはしばしば推論ベンチマークを改善するが、アライメント回帰を示す。
これらの回帰は、KL発散によって測定された命令調整ベースラインからの挙動ドリフトと一致している。
論文 参考訳(メタデータ) (2026-06-09T16:14:27Z) - Trustworthy AI Suffers from Invariance Conflicts and Causality is The Solution [80.98492754957466]
公正性、堅牢性、プライバシ、説明可能性といった、信頼性の高いAI目標を同時に達成することは難しい。
本稿では、パフォーマンスにおけるトレードオフを理解しバランスをとるためには因果性が必要であると論じ、信頼できるAIの複数の目的について論じる。
論文 参考訳(メタデータ) (2026-05-04T14:26:28Z) - Breaking Up with Normatively Monolithic Agency with GRACE: A Reason-Based Neuro-Symbolic Architecture for Safe and Ethical AI Alignment [7.776436480034601]
ニューロシンボリックな理由に基づく封じ込めアーキテクチャ、GRACE(Reason-Aligned ContainmEnt)の知事について紹介する。
GRACEは、道具的な意思決定から規範的推論を分離し、事実上あらゆる設計のAIエージェントを含むことができる。
MMは、意味論的論理のセマンティック基盤を提供する理性に基づく形式主義を用いており、解釈可能性、競合性、正当性を実現している。
論文 参考訳(メタデータ) (2026-01-15T15:47:38Z) - Fluid Agency in AI Systems: A Case for Functional Equivalence in Copyright, Patent, and Tort [0.31061678033205636]
現代の人工知能(AI)システムには、人間の意識や能力が欠如している。
流体機関は貴重な出力を生成するが、帰属は崩壊する。
本条では,機能的等価性だけが教義を安定させると主張している。
論文 参考訳(メタデータ) (2026-01-06T01:06:07Z) - MORABLES: A Benchmark for Assessing Abstract Moral Reasoning in LLMs with Fables [50.29407048003165]
MORABLESは,歴史文献から引用されたファブレットと短編から構築された人間検証ベンチマークである。
主なタスクは、道徳的推論をターゲットとした複数選択の質問として構成されており、モデルが浅く抽出された質問応答を超えるよう挑戦する注意深い注意を払っている。
以上の結果から,より大きなモデルはより小さなモデルよりも優れているが,敵の操作に敏感であり,真の道徳的推論よりも表面的パターンに頼っていることが示唆された。
論文 参考訳(メタデータ) (2025-09-15T19:06:10Z) - Teaching AI to Handle Exceptions: Supervised Fine-Tuning with Human-Aligned Judgment [0.0]
大規模言語モデル(LLM)はエージェントAIシステムへと進化している。
推論に優れるLCMでさえ、政策に厳格に従うため、人間の判断から大きく逸脱していることを示す。
次に、例外を処理するためにAIエージェントをチューニングするための3つのアプローチを評価する。
論文 参考訳(メタデータ) (2025-03-04T20:00:37Z) - A Closer Look at the Self-Verification Abilities of Large Language Models in Logical Reasoning [73.77088902676306]
論理的推論の文脈において,大規模言語モデル(LLM)の自己検証能力について詳しく検討する。
本研究の主目的は,既存のLCMが誤った推論手順を正確に識別するのに苦労し,自己検証法の有効性を保証できないことにある。
論文 参考訳(メタデータ) (2023-11-14T07:13:10Z) - Measuring Association Between Labels and Free-Text Rationales [60.58672852655487]
解釈可能なNLPでは、説明された例に対するモデルの意思決定プロセスを反映した忠実な理性が必要です。
情報抽出型タスクに対する忠実な抽出合理化のための既存のモデルであるパイプラインは、自由テキスト合理化を必要とするタスクに確実に拡張されないことを示す。
我々は、信頼が確立されていない自由文合理化のための、広く使われている高性能モデルのクラスである、共同予測と合理化のモデルに目を向ける。
論文 参考訳(メタデータ) (2020-10-24T03:40:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。