論文の概要: 'AI Alignment' Encompasses Competing Technical Priorities
- arxiv url: http://arxiv.org/abs/2606.14315v1
- Date: Fri, 12 Jun 2026 09:56:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-15 16:00:42.861518
- Title: 'AI Alignment' Encompasses Competing Technical Priorities
- Title(参考訳): AIアライメント」が競合する技術的優先事項を補完
- Authors: Tushita Jha, Rory Svarc, Mateusz Bagiński,
- Abstract要約: 文献には「AIアライメント」の先頭に落ちる多くの異なる概念が含まれている。
現実的な介入は、ある概念の下で「AIアライメント」を促進しつつ、他の視点からは積極的に反生産的であると主張する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The ML literature contains many distinct concepts falling under the heading of 'AI alignment'. After noting three concepts of AI alignment in the context of their corresponding research programs, we claim that realistic interventions may promote 'AI alignment' under one conception while being actively counterproductive from the perspective of others. We suggest that tensions between alignment ideals emerge due to differences in background threat-models, alongside differences in normative orientations. In light of our analysis, researchers aiming to further the goal of 'AI alignment' should do five things. First, they should not conflate distinctions of policy and distinctions of scientific scope; second, methodological disagreements should be acknowledged explicitly; third, researchers should distinguish between 'AI alignment' as a high-level ideal and specific 'alignment proxies' used in empirical research; fourth, they should use more granular concepts to identify both the source and nature of possible AI harms/benefits; fifth, they should explicitly acknowledge the diversity of 'alignment' concepts in both empirical work and in communication with non-technical audiences.
- Abstract(参考訳): ML文献には「AIアライメント」の先頭に落ちる多くの異なる概念が含まれている。
研究プログラムの文脈でAIアライメントの3つの概念に言及した後、現実的な介入は1つの概念の下で「AIアライメント」を促進しつつ、他者の視点から積極的に反生産的であると主張している。
我々は,背景脅威モデルの違いと規範的指向の相違により,アライメント理想間の緊張が生じることを示唆する。
我々の分析を踏まえて、「AIアライメント」の目標をさらに進める研究者は5つのことを行うべきである。
第二に、研究者は「AIアライメント」を高水準の理想と特定の「アライメントプロキシ」と区別し、第四に、AIの害/利益の源泉と性質の両方を識別するために、より粒度の細かい概念を用いて、経験的作業と非技術的オーディエンスとのコミュニケーションにおいて「アライメント」概念の多様性を明確に認識すべきである。
関連論文リスト
- Position: Towards Bidirectional Human-AI Alignment [109.57781720848669]
我々は、人間とAIの双方向的・動的関係を説明するために、研究コミュニティは「調整」を明確に定義し、批判的に反映すべきであると主張する。
このフレームワークは、AIと人間の価値を整合させる従来の取り組みを取り入れているだけでなく、人間とAIを整合させるという、重要で未解明の次元も導入しています。
論文 参考訳(メタデータ) (2024-06-13T16:03:25Z) - AI Alignment: A Comprehensive Survey [69.61425542486275]
AIアライメントは、AIシステムが人間の意図や価値観に沿って振る舞うようにすることを目的としている。
AIアライメントの重要な目的として、ロバストネス、解釈可能性、制御可能性、倫理という4つの原則を特定します。
我々は、現在のアライメント研究を、前方アライメントと後方アライメントの2つの重要なコンポーネントに分解する。
論文 参考訳(メタデータ) (2023-10-30T15:52:15Z) - Fairness in Agreement With European Values: An Interdisciplinary
Perspective on AI Regulation [61.77881142275982]
この学際的立場の論文は、AIにおける公平性と差別に関する様々な懸念を考察し、AI規制がそれらにどう対処するかについて議論する。
私たちはまず、法律、(AI)産業、社会技術、そして(道徳)哲学のレンズを通して、AIと公正性に注目し、様々な視点を提示します。
我々は、AI公正性の懸念の観点から、AI法の取り組みを成功に導くために、AIレギュレーションが果たす役割を特定し、提案する。
論文 参考訳(メタデータ) (2022-06-08T12:32:08Z) - Artificial Intelligence, Values and Alignment [2.28438857884398]
AIアライメント問題の規範的および技術的側面は相互に関連している。
アライメントの目標を明確にすることが重要です。
理論家にとっての中心的な課題は、AIの「真の」道徳原則を特定することではない。
論文 参考訳(メタデータ) (2020-01-13T10:32:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。