論文の概要: Deliberative Technology for Alignment
- arxiv url: http://arxiv.org/abs/2312.03893v1
- Date: Wed, 6 Dec 2023 20:34:32 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-08 16:52:38.962625
- Title: Deliberative Technology for Alignment
- Title(参考訳): 調整のための熟考技術
- Authors: Andrew Konya, Deger Turan, Aviv Ovadya, Lina Qui, Daanish Masood,
Flynn Devine, Lisa Schirch, Isabella Roberts, Deliberative Alignment Forum
- Abstract要約: これらの機関間では、規制と人間の意思の整合を支援するために、熟考技術がすでに使われています。
スーパーヒューマンAGIへの競争はすでに進行中で、それが生み出すAIシステムは、未来の最も強力なシステムになるかもしれない。
現在、強力なAIと人類の意志を合わせるために、熟考技術を使う機会の窓が開いている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: For humanity to maintain and expand its agency into the future, the most
powerful systems we create must be those which act to align the future with the
will of humanity. The most powerful systems today are massive institutions like
governments, firms, and NGOs. Deliberative technology is already being used
across these institutions to help align governance and diplomacy with human
will, and modern AI is poised to make this technology significantly better. At
the same time, the race to superhuman AGI is already underway, and the AI
systems it gives rise to may become the most powerful systems of the future.
Failure to align the impact of such powerful AI with the will of humanity may
lead to catastrophic consequences, while success may unleash abundance. Right
now, there is a window of opportunity to use deliberative technology to align
the impact of powerful AI with the will of humanity. Moreover, it may be
possible to engineer a symbiotic coupling between powerful AI and deliberative
alignment systems such that the quality of alignment improves as AI
capabilities increase.
- Abstract(参考訳): 人類が機関を未来に維持し、拡張するためには、私たちが作り出す最も強力なシステムは、人類の意志と未来を一致させるものでなければならない。
現在最も強力なシステムは、政府、企業、NGOのような大規模機関である。
規制と外交を人間の意志と整合させるために、これらの機関ですでに議論的な技術が使われており、現代のAIは、この技術を大幅に改善する準備が整っている。
同時に、超人的AGIへの競争はすでに進行中であり、それが生み出すAIシステムは、未来の最も強力なシステムになるかもしれない。
このような強力なAIと人類の意志を一致させることができず、破滅的な結果をもたらす可能性がある。
現時点では、強力なaiの影響を人類の意志に合わせるために、慎重な技術を使う機会の窓がある。
さらに、AI能力が向上するにつれてアライメントの品質が向上するように、強力なAIと熟考的なアライメントシステムとの共生結合を設計することも可能だ。
関連論文リスト
- Gradual Disempowerment: Systemic Existential Risks from Incremental AI Development [15.701299669203618]
我々は、AI能力の漸進的な改善が、社会が依存する大規模システムに対する人間の影響力を損なうことができるかを分析する。
このダイナミクスは、重要な社会システムに対する人間の影響を効果的に不可逆的に喪失させ、人類の恒久的な分散を通じて、実在する大惨事を引き起こす可能性がある、と我々は主張する。
論文 参考訳(メタデータ) (2025-01-28T13:45:41Z) - Societal Adaptation to Advanced AI [1.2607853680700076]
先進的なAIシステムからリスクを管理する既存の戦略は、AIシステムの開発方法と拡散方法に影響を与えることに集中することが多い。
我々は、先進的なAIへの社会適応の増大という補完的なアプローチを奨励する。
我々は、AIシステムの潜在的に有害な使用を回避し、防御し、治療する適応的介入を特定するのに役立つ概念的枠組みを導入する。
論文 参考訳(メタデータ) (2024-05-16T17:52:12Z) - Now, Later, and Lasting: Ten Priorities for AI Research, Policy, and Practice [63.20307830884542]
今後数十年は、産業革命に匹敵する人類の転換点になるかもしれない。
10年前に立ち上げられたこのプロジェクトは、複数の専門分野の専門家による永続的な研究にコミットしている。
AI技術の短期的および長期的影響の両方に対処する、アクションのための10のレコメンデーションを提供します。
論文 参考訳(メタデータ) (2024-04-06T22:18:31Z) - Managing extreme AI risks amid rapid progress [171.05448842016125]
我々は、大規模社会被害、悪意のある使用、自律型AIシステムに対する人間の制御の不可逆的な喪失を含むリスクについて説明する。
このようなリスクがどのように発生し、どのように管理するかについては、合意の欠如があります。
現在のガバナンスイニシアチブには、誤用や無謀を防ぎ、自律システムにほとんど対処するメカニズムや制度が欠けている。
論文 参考訳(メタデータ) (2023-10-26T17:59:06Z) - Fairness in AI and Its Long-Term Implications on Society [68.8204255655161]
AIフェアネスを詳しく見て、AIフェアネスの欠如が、時間の経過とともにバイアスの深化につながるかを分析します。
偏りのあるモデルが特定のグループに対してよりネガティブな現実的な結果をもたらすかについて議論する。
問題が続くと、他のリスクとの相互作用によって強化され、社会不安という形で社会に深刻な影響を及ぼす可能性がある。
論文 参考訳(メタデータ) (2023-04-16T11:22:59Z) - Examining the Differential Risk from High-level Artificial Intelligence
and the Question of Control [0.0]
将来のAI能力の範囲と範囲は、依然として重要な不確実性である。
AIの不透明な意思決定プロセスの統合と監視の程度には懸念がある。
本研究では、AIリスクをモデル化し、代替先分析のためのテンプレートを提供する階層的な複雑なシステムフレームワークを提案する。
論文 参考訳(メタデータ) (2022-11-06T15:46:02Z) - AI Governance and Ethics Framework for Sustainable AI and Sustainability [0.0]
自律兵器、自動化された雇用損失、社会経済的不平等、データやアルゴリズムによる偏見、プライバシー侵害、ディープフェイクなど、人類にとってのAIリスクは数多く発生している。
社会的多様性、公平性、包摂性は、リスクを緩和し、価値を生み出し、社会正義を促進するAIの重要な成功要因と考えられている。
AIによる持続可能な未来に向けての旅では、優先事項としてAI倫理とガバナンスに取り組む必要があります。
論文 参考訳(メタデータ) (2022-09-28T22:23:10Z) - Cybertrust: From Explainable to Actionable and Interpretable AI (AI2) [58.981120701284816]
Actionable and Interpretable AI (AI2)は、AIレコメンデーションにユーザの信頼度を明確に定量化し視覚化する。
これにより、AIシステムの予測を調べてテストすることで、システムの意思決定に対する信頼の基盤を確立することができる。
論文 参考訳(メタデータ) (2022-01-26T18:53:09Z) - Trustworthy AI: A Computational Perspective [54.80482955088197]
我々は,信頼に値するAIを実現する上で最も重要な6つの要素,(i)安全とロバスト性,(ii)非差別と公正,(iii)説明可能性,(iv)プライバシー,(v)説明可能性と監査性,(vi)環境ウェルビーイングに焦点をあてる。
各次元について、分類学に基づく最近の関連技術について概観し、実世界のシステムにおけるそれらの応用を概説する。
論文 参考訳(メタデータ) (2021-07-12T14:21:46Z) - Building Bridges: Generative Artworks to Explore AI Ethics [56.058588908294446]
近年,人工知能(AI)技術が社会に与える影響の理解と緩和に重点が置かれている。
倫理的AIシステムの設計における重要な課題は、AIパイプラインには複数の利害関係者があり、それぞれがそれぞれ独自の制約と関心を持っていることだ。
このポジションペーパーは、生成的アートワークが、アクセス可能で強力な教育ツールとして機能することで、この役割を果たすことができる可能性のいくつかを概説する。
論文 参考訳(メタデータ) (2021-06-25T22:31:55Z) - On Controllability of AI [1.370633147306388]
我々は、高度なAIを完全に制御できないことを示す証拠だけでなく、議論も提示する。
人類の未来とAI研究、そしてAIの安全性とセキュリティについて、AIの制御不能な結果について議論する。
論文 参考訳(メタデータ) (2020-07-19T02:49:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。