論文の概要: Introduction to AI Safety, Ethics, and Society
- arxiv url: http://arxiv.org/abs/2411.01042v2
- Date: Fri, 15 Nov 2024 23:19:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-19 14:31:36.268950
- Title: Introduction to AI Safety, Ethics, and Society
- Title(参考訳): AI安全・倫理・社会入門
- Authors: Dan Hendrycks,
- Abstract要約: この本は、AIリスクを理解するための包括的なアプローチを提供することを目的としている。
この本は様々な背景から読者がアクセスできるように設計されている。
コンテンツはスリムでモジュラーなので、どの章を読むかを選べる。
- 参考スコア(独自算出の注目度): 28.592959509694957
- License:
- Abstract: Artificial Intelligence is rapidly embedding itself within militaries, economies, and societies, reshaping their very foundations. Given the depth and breadth of its consequences, it has never been more pressing to understand how to ensure that AI systems are safe, ethical, and have a positive societal impact. This book aims to provide a comprehensive approach to understanding AI risk. Our primary goals include consolidating fragmented knowledge on AI risk, increasing the precision of core ideas, and reducing barriers to entry by making content simpler and more comprehensible. The book has been designed to be accessible to readers from diverse backgrounds. You do not need to have studied AI, philosophy, or other such topics. The content is skimmable and somewhat modular, so that you can choose which chapters to read. We introduce mathematical formulas in a few places to specify claims more precisely, but readers should be able to understand the main points without these.
- Abstract(参考訳): 人工知能は軍、経済、社会に急速に浸透し、その基盤を再構築している。
結果の深さと幅を考えれば、AIシステムが安全で倫理的であり、ポジティブな社会的影響を持つことを確実にする方法を理解するのに、これ以上の圧力はかからない。
この本は、AIリスクを理解するための包括的なアプローチを提供することを目的としている。
私たちの主な目標は、AIリスクに関する断片的な知識の統合、コアアイデアの精度の向上、コンテンツをよりシンプルで理解しやすいものにすることで、参入障壁を減らすことです。
この本は様々な背景から読者がアクセスできるように設計されている。
AIや哲学、その他のトピックを学ぶ必要はありません。
コンテンツはスリムでモジュラーなので、どの章を読むかを選べる。
より正確にクレームを特定するために数箇所で数式を導入するが、読者はこれらを使わずに主要なポイントを理解できなければならない。
関連論文リスト
- Imagining and building wise machines: The centrality of AI metacognition [78.76893632793497]
AIシステムは知恵を欠いている。
AI研究はタスクレベルの戦略に焦点を当てているが、メタ認知はAIシステムでは未発達である。
メタ認知機能をAIシステムに統合することは、その堅牢性、説明可能性、協力性、安全性を高めるために不可欠である。
論文 参考訳(メタデータ) (2024-11-04T18:10:10Z) - Using AI Alignment Theory to understand the potential pitfalls of regulatory frameworks [55.2480439325792]
本稿では、欧州連合の人工知能法(EU AI法)を批判的に検討する。
人工知能における技術的アライメントの潜在的な落とし穴に焦点を当てたアライメント理論(AT)研究からの洞察を利用する。
これらの概念をEU AI Actに適用すると、潜在的な脆弱性と規制を改善するための領域が明らかになる。
論文 参考訳(メタデータ) (2024-10-10T17:38:38Z) - Trust, Accountability, and Autonomy in Knowledge Graph-based AI for
Self-determination [1.4305544869388402]
知識グラフ(KG)は、インテリジェントな意思決定を支えるための基盤として登場した。
KGと神経学習の統合は、現在活発な研究のトピックである。
本稿では,KGベースのAIによる自己決定を支援するための基礎的なトピックと研究の柱を概念化する。
論文 参考訳(メタデータ) (2023-10-30T12:51:52Z) - Deep Learning and Ethics [3.3842793760651557]
この章では、AIシステムの設計と使用から生じる潜在的な害について考察する。
これにはアルゴリズムバイアス、説明可能性の欠如、データのプライバシー侵害、軍事化、詐欺、環境問題などが含まれる。
論文 参考訳(メタデータ) (2023-05-24T15:24:19Z) - Circumventing interpretability: How to defeat mind-readers [0.0]
ミスアライメントされた人工知能は 思考の理解を難しくする 集中的なインセンティブを持つでしょう
有能なAIがスケーラブルな解釈可能性手法を回避できる多くの方法について議論し、これらの潜在的な将来のリスクについて考えるためのフレームワークを提案する。
論文 参考訳(メタデータ) (2022-12-21T23:52:42Z) - X-Risk Analysis for AI Research [24.78742908726579]
我々は、AI x-riskの分析方法のガイドを提供する。
まず、今日のシステムの安全性についてレビューする。
次に,今後のシステムの安全性に長期的影響を与える戦略について議論する。
論文 参考訳(メタデータ) (2022-06-13T00:22:50Z) - Metaethical Perspectives on 'Benchmarking' AI Ethics [81.65697003067841]
ベンチマークは、人工知能(AI)研究の技術的進歩を測定するための基盤とみられている。
AIの顕著な研究領域は倫理であり、現在、ベンチマークのセットも、AIシステムの「倫理性」を測定する一般的な方法もない。
我々は、現在と将来のAIシステムのアクションを考えるとき、倫理よりも「価値」について話す方が理にかなっていると論じる。
論文 参考訳(メタデータ) (2022-04-11T14:36:39Z) - Cybertrust: From Explainable to Actionable and Interpretable AI (AI2) [58.981120701284816]
Actionable and Interpretable AI (AI2)は、AIレコメンデーションにユーザの信頼度を明確に定量化し視覚化する。
これにより、AIシステムの予測を調べてテストすることで、システムの意思決定に対する信頼の基盤を確立することができる。
論文 参考訳(メタデータ) (2022-01-26T18:53:09Z) - Building Bridges: Generative Artworks to Explore AI Ethics [56.058588908294446]
近年,人工知能(AI)技術が社会に与える影響の理解と緩和に重点が置かれている。
倫理的AIシステムの設計における重要な課題は、AIパイプラインには複数の利害関係者があり、それぞれがそれぞれ独自の制約と関心を持っていることだ。
このポジションペーパーは、生成的アートワークが、アクセス可能で強力な教育ツールとして機能することで、この役割を果たすことができる可能性のいくつかを概説する。
論文 参考訳(メタデータ) (2021-06-25T22:31:55Z) - Empowering Things with Intelligence: A Survey of the Progress,
Challenges, and Opportunities in Artificial Intelligence of Things [98.10037444792444]
AIがIoTをより速く、より賢く、よりグリーンで、より安全にするための力を与える方法を示します。
まず、認識、学習、推論、行動の4つの視点から、IoTのためのAI研究の進歩を示す。
最後に、私たちの世界を深く再形成する可能性が高いAIoTの有望な応用をいくつかまとめる。
論文 参考訳(メタデータ) (2020-11-17T13:14:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。