論文の概要: Disentangling AI Alignment: A Structured Taxonomy Beyond Safety and Ethics
- arxiv url: http://arxiv.org/abs/2506.06286v1
- Date: Fri, 02 May 2025 20:45:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-22 23:32:14.423026
- Title: Disentangling AI Alignment: A Structured Taxonomy Beyond Safety and Ethics
- Title(参考訳): AIアライメントを遠ざける - 安全と倫理を超えた構造的な分類
- Authors: Kevin Baum,
- Abstract要約: 我々は、AIアライメントを理解するための構造化された概念的フレームワークを開発する。
アライメント目標のみに焦点を当てるのではなく、アライメント目標(安全、倫理性、合法性など)、スコープ(アウトカム対実行)、選挙区(個人対集団)を区別する分類を導入する。
この構造的アプローチは複数の正統なアライメント構成を明らかにし、ドメイン間の実践的および哲学的な統合の基礎を提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advances in AI research make it increasingly plausible that artificial agents with consequential real-world impact will soon operate beyond tightly controlled environments. Ensuring that these agents are not only safe but that they adhere to broader normative expectations is thus an urgent interdisciplinary challenge. Multiple fields -- notably AI Safety, AI Alignment, and Machine Ethics -- claim to contribute to this task. However, the conceptual boundaries and interrelations among these domains remain vague, leaving researchers without clear guidance in positioning their work. To address this meta-challenge, we develop a structured conceptual framework for understanding AI alignment. Rather than focusing solely on alignment goals, we introduce a taxonomy distinguishing the alignment aim (safety, ethicality, legality, etc.), scope (outcome vs. execution), and constituency (individual vs. collective). This structural approach reveals multiple legitimate alignment configurations, providing a foundation for practical and philosophical integration across domains, and clarifying what it might mean for an agent to be aligned all-things-considered.
- Abstract(参考訳): AI研究の最近の進歩は、後続の現実世界に影響を及ぼす人工エージェントが、すぐに厳格に制御された環境を超えて機能することの可能性がますます高まっている。
これらのエージェントが安全であるだけでなく、より広範な規範的期待に従うことを保証することは、緊急の学際課題である。
AI Safety、AI Alignment、Machine Ethicsなど、複数の分野が、このタスクに貢献している。
しかし、これらの領域間の概念的境界と相互関係はあいまいであり、研究者は研究の位置づけについて明確なガイダンスを残さないままである。
このメタチャレンジに対処するために、AIアライメントを理解するための構造化された概念的フレームワークを開発する。
我々は、アライメント目標のみに焦点を合わせるのではなく、アライメント目標(安全、倫理性、合法性など)、スコープ(アウトカム対実行)、選挙区(個人対集団)を区別する分類を導入する。
この構造的アプローチは、複数の正統なアライメント構成を明らかにし、ドメイン間の実践的かつ哲学的な統合の基礎を提供し、エージェントがアライメントされたオールシングスを考えることの意味を明確にする。
関連論文リスト
- From Principles to Practice: A Deep Dive into AI Ethics and Regulations [13.753819576072127]
この記事では、欧州連合が提案する画期的なAI規制フレームワークについて、徹底的に分析する。
学術や産業がこれらの原則を守ろうとする技術的努力と戦略を考えると、我々は5つの倫理的原則の相乗効果と矛盾を探求する。
論文 参考訳(メタデータ) (2024-12-06T00:46:20Z) - Dynamic Normativity: Necessary and Sufficient Conditions for Value Alignment [0.0]
我々は,人的目標と価値を人工システムで従うことができるような方法で表現する上での課題に,不必要な敵意を伴わない「調整」の問題を見出した。
この研究は、AIシステム開発に規範的理論をもたらす、しっかりとした哲学的基礎と実践的な実装を必要とする技術的哲学的問題としてのアライメントに対処する。
論文 参考訳(メタデータ) (2024-06-16T18:37:31Z) - Towards Bidirectional Human-AI Alignment: A Systematic Review for Clarifications, Framework, and Future Directions [101.67121669727354]
近年のAIの進歩は、AIシステムを意図された目標、倫理的原則、個人とグループの価値に向けて導くことの重要性を強調している。
人間のAIアライメントの明確な定義とスコープの欠如は、このアライメントを達成するための研究領域間の共同作業を妨げる、大きな障害となる。
我々は、2019年から2024年1月までに400以上の論文を体系的にレビューし、HCI(Human-Computer Interaction)、自然言語処理(NLP)、機械学習(ML)といった複数の分野にまたがって紹介する。
論文 参考訳(メタデータ) (2024-06-13T16:03:25Z) - Foundational Moral Values for AI Alignment [0.0]
我々は、道徳哲学から引き出された5つの基本的価値観を提示し、生存、持続的世代間存在、社会、教育、真実という人間の生存に必要なものの上に構築する。
これらの価値は、技術的アライメント作業のためのより明確な方向を提供するだけでなく、これらの価値を取得し、維持するためのAIシステムからの脅威と機会を強調するためのフレームワークとしても役立ちます。
論文 参考訳(メタデータ) (2023-11-28T18:11:24Z) - AI Alignment: A Comprehensive Survey [69.61425542486275]
AIアライメントは、AIシステムが人間の意図や価値観に沿って振る舞うようにすることを目的としている。
AIアライメントの重要な目的として、ロバストネス、解釈可能性、制御可能性、倫理という4つの原則を特定します。
我々は、現在のアライメント研究を、前方アライメントと後方アライメントの2つの重要なコンポーネントに分解する。
論文 参考訳(メタデータ) (2023-10-30T15:52:15Z) - Fairness in Agreement With European Values: An Interdisciplinary
Perspective on AI Regulation [61.77881142275982]
この学際的立場の論文は、AIにおける公平性と差別に関する様々な懸念を考察し、AI規制がそれらにどう対処するかについて議論する。
私たちはまず、法律、(AI)産業、社会技術、そして(道徳)哲学のレンズを通して、AIと公正性に注目し、様々な視点を提示します。
我々は、AI公正性の懸念の観点から、AI法の取り組みを成功に導くために、AIレギュレーションが果たす役割を特定し、提案する。
論文 参考訳(メタデータ) (2022-06-08T12:32:08Z) - Artificial Intelligence, Values and Alignment [2.28438857884398]
AIアライメント問題の規範的および技術的側面は相互に関連している。
アライメントの目標を明確にすることが重要です。
理論家にとっての中心的な課題は、AIの「真の」道徳原則を特定することではない。
論文 参考訳(メタデータ) (2020-01-13T10:32:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。