Fugu-MT 論文翻訳(概要): Safeguarding the safeguards: How best to promote AI alignment in the public interest

論文の概要: Safeguarding the safeguards: How best to promote AI alignment in the public interest

arxiv url: http://arxiv.org/abs/2312.08039v1
Date: Wed, 13 Dec 2023 10:36:10 GMT
ステータス: 翻訳完了
システム内更新日: 2023-12-14 15:46:01.785245
Title: Safeguarding the safeguards: How best to promote AI alignment in the public interest
Title（参考訳）: 安全を守る: 公益におけるAIの整合性をいかに促進するか
Authors: Oliver Guest, Michael Aird, Se\'an \'O h\'Eigeartaigh
Abstract要約: 我々は、AIアライメントの取り組みを支援する俳優が、これらの取り組みをできるだけ効果的にすることを支援することを目指している。我々は、アライメントの取り組みが非生産的になり、大規模なAIリスクが増大する可能性のある4つの問題を述べる。我々は、公共の利益で行動しようとする機関は、アライメントの取り組みを効果的にする方法を体系的に考えるべきだというより広範な勧告を行う。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: AI alignment work is important from both a commercial and a safety lens. With this paper, we aim to help actors who support alignment efforts to make these efforts as effective as possible, and to avoid potential adverse effects. We begin by suggesting that institutions that are trying to act in the public interest (such as governments) should aim to support specifically alignment work that reduces accident or misuse risks. We then describe four problems which might cause alignment efforts to be counterproductive, increasing large-scale AI risks. We suggest mitigations for each problem. Finally, we make a broader recommendation that institutions trying to act in the public interest should think systematically about how to make their alignment efforts as effective, and as likely to be beneficial, as possible.
Abstract（参考訳）: AIアライメント作業は、商用レンズと安全レンズの両方から重要である。本稿では,これらの取り組みを可能な限り効果的にするためのアライメント活動を支援する俳優の支援と,潜在的な悪影響を避けることを目的とする。まず、公共の利益のために活動しようとする機関(政府など)は、事故や誤用リスクを低減させる具体的な調整作業を支援するべきであると提案する。次に、アライメントの取り組みが非生産的になり、大規模なAIリスクが増大する可能性のある4つの問題を述べる。各問題に対する緩和策を提案する。最後に、公共の利益のために行動しようとする機関は、自分たちの協調努力を可能な限り効果的かつ有益にする方法を体系的に考えるべきだという幅広い勧告を行ないます。

関連論文リスト

AI Workers, Geopolitics, and Algorithmic Collective Action [0.0]
この論文は、一部のAI労働者は、地政学のアクターと見なすことができると論じている。ガバナンスだけでは、責任、倫理的、あるいは堅牢なAI開発と使用を保証できない。知識、相対的な力の源泉としてAIワーカーを関与させ、より責任を持ち、単なるAI開発を促進することを提案する。
論文参考訳（メタデータ） (2025-11-21T15:52:44Z)
Misalignment or misuse? The AGI alignment tradeoff [0.0]
AGI - 未来、一般的に知性のある(ロボティックな)AIエージェント - が破滅的なリスクをもたらすという見解を擁護する。誤用リスクを増大させないアライメントアプローチの余地があることが示される。
論文参考訳（メタデータ） (2025-06-04T09:22:37Z)
Must Read: A Systematic Survey of Computational Persuasion [60.83151988635103]
AI駆動の説得は、有益なアプリケーションに活用することができるが、操作と非倫理的な影響を通じて脅威を引き起こす。本調査では,AIによる説得の安全性,公平性,有効性を高めるための今後の研究方針について概説する。
論文参考訳（メタデータ） (2025-05-12T17:26:31Z)
Public Opinion and The Rise of Digital Minds: Perceived Risk, Trust, and Regulation Support [4.982210700018631]
本研究では,機関やAI技術に対する公的な信頼と,認識されるリスク,AI規制の形式的嗜好について検討する。政府への信頼が高い人は規制を支持するが、AI企業やAI技術への信頼が高い人は規制を支持する傾向が低い。
論文参考訳（メタデータ） (2025-04-30T17:56:23Z)
An Approach to Technical AGI Safety and Security [72.83728459135101]
我々は、人類を著しく傷つけるのに十分な害のリスクに対処するアプローチを開発する。私たちは、誤用や悪用に対する技術的なアプローチに重点を置いています。これらの成分を組み合わせてAGIシステムの安全性を実現する方法について概説する。
論文参考訳（メタデータ） (2025-04-02T15:59:31Z)
Position: AI agents should be regulated based on autonomous action sequences [0.0]
AIエージェントは、自律的に取るべき行動の順序に基づいて規制されるべきである、と私たちは主張する。我々は、存在リスクに関するAI科学者の適切な規制と勧告について論じる。
論文参考訳（メタデータ） (2025-02-07T09:40:48Z)
Using AI Alignment Theory to understand the potential pitfalls of regulatory frameworks [55.2480439325792]
本稿では、欧州連合の人工知能法(EU AI法)を批判的に検討する。人工知能における技術的アライメントの潜在的な落とし穴に焦点を当てたアライメント理論(AT)研究からの洞察を利用する。これらの概念をEU AI Actに適用すると、潜在的な脆弱性と規制を改善するための領域が明らかになる。
論文参考訳（メタデータ） (2024-10-10T17:38:38Z)
Do Responsible AI Artifacts Advance Stakeholder Goals? Four Key Barriers Perceived by Legal and Civil Stakeholders [59.17981603969404]
責任あるAI(RAI)コミュニティは、透明性を促進し、AIシステムのガバナンスをサポートするために、多数のプロセスとアーティファクトを導入している。我々は、責任あるAI活動に関する政策と擁護を通知する19の政府、法律、市民社会の利害関係者と半構造化されたインタビューを行う。我々は、これらの信念を4つの障壁にまとめて、RAIアーティファクトが(必然的に)市民社会、政府、産業間での権力関係を再構成する方法を説明する。
論文参考訳（メタデータ） (2024-08-22T00:14:37Z)
Implications for Governance in Public Perceptions of Societal-scale AI Risks [0.29022435221103454]
投票者は、AIのリスクは専門家よりも可能性が高く影響も大きいと認識し、AI開発を遅くすることを主張する。政策介入は、社会規模リスクの全てのクラスにまたがる緩和努力をより慎重にバランスを取ろうとすれば、集団の懸念を和らげるのがよい。
論文参考訳（メタデータ） (2024-06-10T11:52:25Z)
A Safe Harbor for AI Evaluation and Red Teaming [124.89885800509505]
一部の研究者は、そのような研究の実施や研究成果の公表が、アカウント停止や法的報復につながることを恐れている。我々は、主要なAI開発者が法的、技術的に安全な港を提供することを約束することを提案します。これらのコミットメントは、ジェネレーティブAIのリスクに取り組むための、より包括的で意図しないコミュニティ努力への必要なステップである、と私たちは信じています。
論文参考訳（メタデータ） (2024-03-07T20:55:08Z)
Managing extreme AI risks amid rapid progress [171.05448842016125]
我々は、大規模社会被害、悪意のある使用、自律型AIシステムに対する人間の制御の不可逆的な喪失を含むリスクについて説明する。このようなリスクがどのように発生し、どのように管理するかについては、合意の欠如があります。現在のガバナンスイニシアチブには、誤用や無謀を防ぎ、自律システムにほとんど対処するメカニズムや制度が欠けている。
論文参考訳（メタデータ） (2023-10-26T17:59:06Z)
Both eyes open: Vigilant Incentives help Regulatory Markets improve AI Safety [69.59465535312815]
Regulatory Markets for AIは、適応性を考慮して設計された提案である。政府はAI企業が達成すべき結果に基づく目標を設定する必要がある。我々は、規制市場がこの目標を達成するのを阻止するインセンティブについて、非常に簡単に対応できることを警告する。
論文参考訳（メタデータ） (2023-03-06T14:42:05Z)
Fairness in Agreement With European Values: An Interdisciplinary Perspective on AI Regulation [61.77881142275982]
この学際的立場の論文は、AIにおける公平性と差別に関する様々な懸念を考察し、AI規制がそれらにどう対処するかについて議論する。私たちはまず、法律、(AI)産業、社会技術、そして(道徳)哲学のレンズを通して、AIと公正性に注目し、様々な視点を提示します。我々は、AI公正性の懸念の観点から、AI法の取り組みを成功に導くために、AIレギュレーションが果たす役割を特定し、提案する。
論文参考訳（メタデータ） (2022-06-08T12:32:08Z)
Five Ps: Leverage Zones Towards Responsible AI [0.0]
我々は介入が効果的であると理解される範囲を改善する機会があると主張している。システム思考」の文献から適応したレバレッジゾーンの概念を用いて,介入の有効性を評価する新しいアプローチを提案する。
論文参考訳（メタデータ） (2022-04-20T04:20:14Z)
Voluntary safety commitments provide an escape from over-regulation in AI development [8.131948859165432]
この研究は、ピアまたは機関による制裁による自発的なコミットメントが、社会的に有益な結果をもたらすことを初めて明らかにしている。結果は、倫理的で責任あるAI技術開発プロセスを保証することを目的としたガバナンスと規制ポリシーの設計に直接関係しています。
論文参考訳（メタデータ） (2021-04-08T12:54:56Z)
The Tragedy of the AI Commons [0.0]
我々は進化ゲーム力学を用いて、人工知能の倫理的発展の文脈における社会的ジレンマをモデル化する。このようなシナリオでは,効果によって協調が実現可能であることを示す。彼らは、協力のコストが低く、失敗のリスクが高い小さなグループで共通の利益の調整を試みるべきであることを示唆している。
論文参考訳（メタデータ） (2020-06-09T12:01:01Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。