論文の概要: Position: Align AI to Our Aspirations, Not Our Flaws
- arxiv url: http://arxiv.org/abs/2606.13755v1
- Date: Thu, 11 Jun 2026 16:03:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-15 16:00:42.548016
- Title: Position: Align AI to Our Aspirations, Not Our Flaws
- Title(参考訳): ポジション:AIを我々の願望に合わせ、我々の欠陥ではない
- Authors: Nikita Kazeev, Bui Nhat Huyen Phan,
- Abstract要約: 集約された人間の好みにAIを合わせることが、間違ったターゲットです。
AIは、客観的アライメントの目標を達成できないフロアにトレーニングされるべきである、と私たちは主張する。
フィルタされていない多元値の実証的現実を強調した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We argue that aligning AI to aggregated human preferences is the wrong target. With current technology, one can train AIs to share the values of a Silicon Valley techno-optimist, a degrowth environmentalist, a national-conservative culture warrior, a single-party state cadre, or a devout religious traditionalist. We should not. Human values produce societies that thrive or fail on the merits of those values - from failed states and extreme inequality to declining happiness, political polarization, and government dysfunction in the world's wealthiest democracies. The pluralistic-alignment program correctly diagnoses that there is no single "humanity" to align with, but is dangerous if taken as the main directive. We argue that AI should be trained to a non-negotiable floor of objective alignment goals - competence, bounded by the constraints of factual accuracy, honesty, and lawfulness and that pluralism belongs at the surface (language, register, conventions, missing-context defaults) and across the wide band of legitimate value tradeoffs that respect the floor, but not at the level of values that violate it. We highlight the empirical reality of unfiltered pluralistic values, propose four commitments as a constructive alternative, and engage six credible objections: commercial pressure and practical feasibility, democratic legitimacy, regulatory compliance, over-reliance on institutionalist explanations, the charge that the floor itself is culturally laden, and the limits of Coherent Extrapolated Volition.
- Abstract(参考訳): 集約された人間の好みにAIを合わせることが、間違ったターゲットである、と我々は主張する。
現在の技術では、AIを訓練してシリコンバレーのテクノ・オプティミスト、成長する環境保護主義者、国家保守文化の戦士、単一政党のカドミリスト、あるいは熱心な宗教伝統主義者の価値を共有することができる。
すべきではない。
人間の価値観は、失敗した国家や極端な不平等から、幸福の低下、政治的分極化、そして世界で最も富裕な民主主義における政府の機能不全まで、これらの価値のメリットを繁栄または失敗する社会を生み出している。
多元的アライメントプログラムは、一致すべき「人間性」が一つもないことを正しく診断するが、主指示として取り組めば危険である。
AIは、現実の正確さ、誠実さ、合法性の制約に縛られ、多元性は表面(言語、登録、規約、欠落したコンテキストのデフォルト)に属し、フロアを尊重する正当な価値トレードオフの広い範囲にまたがる。
提案する4つのコミットメントは,商業的圧力と実用的実現可能性,民主的正当性,規制の遵守,制度主義的説明への過度な信頼,フロア自体が文化的に怠慢であること,コヒーレントな外挿行動の限界である。
関連論文リスト
- Memetic Capture: A Pluralistic Policy Framework for Governing AI-Driven Cultural Disempowerment [0.0]
既存のAIガバナンスフレームワークは、文化的影響を経済的および安全上の懸念の二次として扱うことによって、重大な盲点に陥る、と我々は主張する。
我々は,定量的文化的影響指標,民主的価値アセンブリ,多元的展開標準,国際的調整機構を組み合わせた4層政策アーキテクチャであるtextbfCultural Pluralistic Governance Framework (CPGF) を提案する。
論文 参考訳(メタデータ) (2026-06-05T19:32:36Z) - Trustworthy AI Suffers from Invariance Conflicts and Causality is The Solution [80.98492754957466]
公正性、堅牢性、プライバシ、説明可能性といった、信頼性の高いAI目標を同時に達成することは難しい。
本稿では、パフォーマンスにおけるトレードオフを理解しバランスをとるためには因果性が必要であると論じ、信頼できるAIの複数の目的について論じる。
論文 参考訳(メタデータ) (2026-05-04T14:26:28Z) - Infrastructuring Contestability: A Framework for Community-Defined AI Value Pluralism [0.0]
AI駆動システムの普及は、人間とコンピュータのインタラクションとコンピュータが支援する協調作業に課題をもたらす。
集中型のトップダウン定義に依存している現在の価値アライメントへのアプローチには、意味のある競争性のためのメカニズムが欠如している。
本稿では,このギャップに対処する社会技術フレームワークであるCommunity-Defined AI Value Pluralismを紹介する。
論文 参考訳(メタデータ) (2025-07-07T16:45:50Z) - Resource Rational Contractualism Should Guide AI Alignment [69.07915246220985]
契約主義的アライメントは、多様な利害関係者が支持する合意の中で決定を下すことを提案する。
我々は、AIシステムが合理的な当事者が形成する合意を近似する枠組みであるリソース・リアリズムを提案する。
RRC対応エージェントは、効率的に機能するだけでなく、変化する人間の社会世界への適応と解釈を動的に行うことができる。
論文 参考訳(メタデータ) (2025-06-20T18:57:13Z) - Political Neutrality in AI Is Impossible- But Here Is How to Approximate It [97.59456676216115]
真の政治的中立性は、主観的な性質と、AIトレーニングデータ、アルゴリズム、ユーザーインタラクションに固有のバイアスのため、実現可能でも普遍的に望ましいものではない、と我々は主張する。
我々は、政治的中立性の「近似」という用語を使って、到達不可能な絶対値から達成不可能で実用的なプロキシへ焦点を移す。
論文 参考訳(メタデータ) (2025-02-18T16:48:04Z) - ValueCompass: A Framework for Measuring Contextual Value Alignment Between Human and LLMs [16.711615737109977]
本稿では,心理学的理論と体系的レビューに基づく基本的価値の枠組みであるバリューを紹介する。
実世界の4つのシナリオにまたがって、人間と大規模言語モデル(LLM)の価値アライメントを測定するためにバリューを適用します。
論文 参考訳(メタデータ) (2024-09-15T02:13:03Z) - Foundational Moral Values for AI Alignment [0.0]
我々は、道徳哲学から引き出された5つの基本的価値観を提示し、生存、持続的世代間存在、社会、教育、真実という人間の生存に必要なものの上に構築する。
これらの価値は、技術的アライメント作業のためのより明確な方向を提供するだけでなく、これらの価値を取得し、維持するためのAIシステムからの脅威と機会を強調するためのフレームワークとしても役立ちます。
論文 参考訳(メタデータ) (2023-11-28T18:11:24Z) - Value Kaleidoscope: Engaging AI with Pluralistic Human Values, Rights, and Duties [68.66719970507273]
価値多元性とは、複数の正しい値が互いに緊張して保持されるという考え方である。
統計的学習者として、AIシステムはデフォルトで平均に適合する。
ValuePrismは、218kの値、権利、義務の大規模なデータセットで、31kの人間が記述した状況に関連付けられています。
論文 参考訳(メタデータ) (2023-09-02T01:24:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。