Fugu-MT 論文翻訳(概要): Artificial Intelligence: Arguments for Catastrophic Risk

論文の概要: Artificial Intelligence: Arguments for Catastrophic Risk

arxiv url: http://arxiv.org/abs/2401.15487v1
Date: Sat, 27 Jan 2024 19:34:13 GMT
ステータス: 翻訳完了
システム内更新日: 2024-01-30 18:02:11.712284
Title: Artificial Intelligence: Arguments for Catastrophic Risk
Title（参考訳）: 人工知能: 破滅的なリスクの議論
Authors: Adam Bales, William D'Alessandro, Cameron Domenico Kirk-Giannini
Abstract要約: 我々は、AIが破滅的なリスクにどう影響するかを示すために、2つの影響力ある議論をレビューする。電力探究の問題の最初の議論は、先進的なAIシステムが危険な電力探究行動に関与する可能性が高いと主張している。第2の主張は、人間レベルのAIの開発が、さらなる進歩を早めるだろう、というものである。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Recent progress in artificial intelligence (AI) has drawn attention to the technology's transformative potential, including what some see as its prospects for causing large-scale harm. We review two influential arguments purporting to show how AI could pose catastrophic risks. The first argument -- the Problem of Power-Seeking -- claims that, under certain assumptions, advanced AI systems are likely to engage in dangerous power-seeking behavior in pursuit of their goals. We review reasons for thinking that AI systems might seek power, that they might obtain it, that this could lead to catastrophe, and that we might build and deploy such systems anyway. The second argument claims that the development of human-level AI will unlock rapid further progress, culminating in AI systems far more capable than any human -- this is the Singularity Hypothesis. Power-seeking behavior on the part of such systems might be particularly dangerous. We discuss a variety of objections to both arguments and conclude by assessing the state of the debate.
Abstract（参考訳）: 人工知能(AI)の最近の進歩は、この技術の変革の可能性に注意を向けている。我々は、AIが破滅的なリスクにどう影響するかを示す2つの影響力ある議論をレビューする。最初の議論 -- 電力探索の問題 -- は、ある仮定の下では、高度なAIシステムは彼らの目標を追求する危険な電力探索行動に関与する可能性が高いと主張している。我々は、AIシステムが力を求めるかもしれない、それを得るかもしれない、それが大惨事につながるかもしれない、そしていずれにせよそのようなシステムを構築、展開するかもしれないと考える理由をレビューする。第2の主張は、人間レベルのAIの開発が、人間よりもはるかに有能なAIシステムにおいて、さらなる進歩を素早く解き放つ、というものである。このようなシステムの一部で電力を探す行動は特に危険かもしれない。いずれの議論にも様々な異議を唱え、議論の状況を評価することによって結論づける。

関連論文リスト

AI Deception: Risks, Dynamics, and Controls [153.71048309527225]
このプロジェクトは、AI偽装分野の包括的で最新の概要を提供する。我々は、動物の偽装の研究からシグナル伝達理論に基づく、AI偽装の正式な定義を同定する。我々は,AI偽装研究の展望を,偽装発生と偽装処理の2つの主要な構成要素からなる偽装サイクルとして整理する。
論文参考訳（メタデータ） (2025-11-27T16:56:04Z)
AI Consciousness and Existential Risk [8.264344308830797]
AIでは、存在リスクは、人間性を根絶する能力と目的の両方を持つ人工システムによって引き起こされる仮説上の脅威を意味する。 AI意識と生存リスクという2つの質問は、前者が後者に関係しているかのように、時に混同される。この見解は、意識と知性の共通した混同に由来すると説明します。しかし、いずれの方向にも、意識が生存リスクに影響を与えるような偶然のシナリオがある。
論文参考訳（メタデータ） (2025-11-24T13:48:02Z)
AI Automatons: AI Systems Intended to Imitate Humans [54.19152688545896]
人々の行動、仕事、能力、類似性、または人間性を模倣するように設計されたAIシステムが増加している。このようなAIシステムの研究、設計、展開、可用性は、幅広い法的、倫理的、その他の社会的影響に対する懸念を喚起している。
論文参考訳（メタデータ） (2025-03-04T03:55:38Z)
Superintelligent Agents Pose Catastrophic Risks: Can Scientist AI Offer a Safer Path? [37.13209023718946]
未確認のAI機関は、公共の安全とセキュリティに重大なリスクをもたらす。これらのリスクが現在のAIトレーニング方法からどのように生じるかについて議論する。我々は,非エージェント型AIシステムの開発をさらに進めるために,コアビルディングブロックを提案する。
論文参考訳（メタデータ） (2025-02-21T18:28:36Z)
Imagining and building wise machines: The centrality of AI metacognition [78.76893632793497]
AIシステムは知恵を欠いている。 AI研究はタスクレベルの戦略に焦点を当てているが、メタ認知はAIシステムでは未発達である。メタ認知機能をAIシステムに統合することは、その堅牢性、説明可能性、協力性、安全性を高めるために不可欠である。
論文参考訳（メタデータ） (2024-11-04T18:10:10Z)
Taking AI Welfare Seriously [0.5617572524191751]
我々は、近い将来、一部のAIシステムが意識的または堅牢に作用する可能性があると論じている。これは近い将来の問題であり、AI企業や他のアクターはそれを真剣に取り始める責任がある。
論文参考訳（メタデータ） (2024-11-04T17:57:57Z)
Towards evaluations-based safety cases for AI scheming [37.399946932069746]
本論では,安全事例がスケジューリングに有効である,という3つの論点を提案する。第一に、フロンティアAIシステムの開発者は、AIシステムはスケジューリングができないと主張するかもしれない。第二に、AIシステムはスケジューリングによって害を与えることができない、という主張もある。第三に、AIシステムが意図的にそれらを覆そうと試みても、AIシステムを取り巻く制御手段が受け入れられない結果を防ぐと論じることもできる。
論文参考訳（メタデータ） (2024-10-29T17:55:29Z)
Hype, Sustainability, and the Price of the Bigger-is-Better Paradigm in AI [67.58673784790375]
AIパラダイムは、科学的に脆弱なだけでなく、望ましくない結果をもたらすものだ、と私たちは主張する。第一に、計算要求がモデルの性能よりも早く増加し、不合理な経済要求と不均等な環境フットプリントにつながるため、持続可能ではない。第二に、健康、教育、気候などの重要な応用は別として、他人を犠牲にして特定の問題に焦点をあてることである。
論文参考訳（メタデータ） (2024-09-21T14:43:54Z)
Managing extreme AI risks amid rapid progress [171.05448842016125]
我々は、大規模社会被害、悪意のある使用、自律型AIシステムに対する人間の制御の不可逆的な喪失を含むリスクについて説明する。このようなリスクがどのように発生し、どのように管理するかについては、合意の欠如があります。現在のガバナンスイニシアチブには、誤用や無謀を防ぎ、自律システムにほとんど対処するメカニズムや制度が欠けている。
論文参考訳（メタデータ） (2023-10-26T17:59:06Z)
An Overview of Catastrophic AI Risks [38.84933208563934]
本稿では,破滅的なAIリスクの主な要因について概説し,その要因を4つのカテゴリに分類する。個人やグループが意図的にAIを使用して危害を及ぼす悪用; 競争環境がアクターに安全でないAIを配置させたり、AIに制御を強制するAIレース。組織的リスクは人的要因と複雑なシステムが破滅的な事故の可能性を高めることを示しています不正なAIは、人間よりもはるかにインテリジェントなエージェントを制御することの難しさを説明する。
論文参考訳（メタデータ） (2023-06-21T03:35:06Z)
Fairness in AI and Its Long-Term Implications on Society [68.8204255655161]
AIフェアネスを詳しく見て、AIフェアネスの欠如が、時間の経過とともにバイアスの深化につながるかを分析します。偏りのあるモデルが特定のグループに対してよりネガティブな現実的な結果をもたらすかについて議論する。問題が続くと、他のリスクとの相互作用によって強化され、社会不安という形で社会に深刻な影響を及ぼす可能性がある。
論文参考訳（メタデータ） (2023-04-16T11:22:59Z)
Current and Near-Term AI as a Potential Existential Risk Factor [5.1806669555925975]
我々は、現在および短期的な人工知能技術が、現実的なリスクに寄与する可能性があるという考えを問題視する。我々は、すでに文書化されているAIの効果が、実在するリスク要因として機能する、という仮説を提案する。私たちの主な貢献は、潜在的なAIリスク要因とそれら間の因果関係の展示です。
論文参考訳（メタデータ） (2022-09-21T18:56:14Z)
X-Risk Analysis for AI Research [24.78742908726579]
我々は、AI x-riskの分析方法のガイドを提供する。まず、今日のシステムの安全性についてレビューする。次に,今後のシステムの安全性に長期的影響を与える戦略について議論する。
論文参考訳（メタデータ） (2022-06-13T00:22:50Z)
Cybertrust: From Explainable to Actionable and Interpretable AI (AI2) [58.981120701284816]
Actionable and Interpretable AI (AI2)は、AIレコメンデーションにユーザの信頼度を明確に定量化し視覚化する。これにより、AIシステムの予測を調べてテストすることで、システムの意思決定に対する信頼の基盤を確立することができる。
論文参考訳（メタデータ） (2022-01-26T18:53:09Z)
Trustworthy AI: A Computational Perspective [54.80482955088197]
我々は,信頼に値するAIを実現する上で最も重要な6つの要素,(i)安全とロバスト性,(ii)非差別と公正,(iii)説明可能性,(iv)プライバシー,(v)説明可能性と監査性,(vi)環境ウェルビーイングに焦点をあてる。各次元について、分類学に基づく最近の関連技術について概観し、実世界のシステムにおけるそれらの応用を概説する。
論文参考訳（メタデータ） (2021-07-12T14:21:46Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。