Fugu-MT 論文翻訳(概要): AI Safety: Necessary, but insufficient and possibly problematic

論文の概要: AI Safety: Necessary, but insufficient and possibly problematic

arxiv url: http://arxiv.org/abs/2403.17419v1
Date: Tue, 26 Mar 2024 06:18:42 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-27 16:26:20.389219
Title: AI Safety: Necessary, but insufficient and possibly problematic
Title（参考訳）: AIの安全性:必要だが不十分で、おそらく問題がある
Authors: Deepak P,
Abstract要約: この記事では、AI安全性に関する最近の誇大広告について批判的に考察する。 AIの安全性」とは実際に何を意味するのかを考察し、AIの安全性のデジタルフットプリントが持つ支配的な概念を概説する。私たちは、AIの安全性が、悪用され有害なAIに安全を害することで、構造的危害を助長するAIを正規化する方法に関する懸念を共有します。
参考スコア（独自算出の注目度）: 1.6797508081737678
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: This article critically examines the recent hype around AI safety. We first start with noting the nature of the AI safety hype as being dominated by governments and corporations, and contrast it with other avenues within AI research on advancing social good. We consider what 'AI safety' actually means, and outline the dominant concepts that the digital footprint of AI safety aligns with. We posit that AI safety has a nuanced and uneasy relationship with transparency and other allied notions associated with societal good, indicating that it is an insufficient notion if the goal is that of societal good in a broad sense. We note that the AI safety debate has already influenced some regulatory efforts in AI, perhaps in not so desirable directions. We also share our concerns on how AI safety may normalize AI that advances structural harm through providing exploitative and harmful AI with a veneer of safety.
Abstract（参考訳）: この記事では、AI安全性に関する最近の誇大広告について批判的に考察する。私たちはまず、AIの安全性の誇大宣伝が政府や企業によって支配されていることを指摘し、社会改善に関するAI研究の他の方法と対比することから始めます。 AIの安全性」とは実際に何を意味するのかを考察し、AIの安全性のデジタルフットプリントが持つ支配的な概念を概説する。 AIの安全性は、透明性や社会的善に関連する他の関連概念とあいまいで不安な関係にあると仮定し、その目的が広い意味での社会的善である場合、それは不十分な概念であることを示す。 AIの安全性に関する議論は、おそらくそれほど望ましい方向ではなく、AIにおける規制の取り組みにすでに影響を与えている。私たちはまた、AIの安全性が、悪用され有害なAIを安全のために提供することによって、構造的な害を助長するAIを正規化する方法に関する懸念も共有しています。

関連論文リスト

The Singapore Consensus on Global AI Safety Research Priorities [128.58674892183657]
2025年シンガポールAI会議(SCAI: International Scientific Exchange on AI Safety)は、この分野での研究を支援することを目的としている。ヨシュア・ベンジオが議長を務める国際AI安全レポート(AI Safety Report)は、33の政府によって支援されている。レポートは、AI安全研究ドメインを3つのタイプに分類する。信頼に値するAIシステム(開発)作成の課題、リスク評価の課題(評価)、デプロイメント後の監視と介入の課題(会議)。
論文参考訳（メタデータ） (2025-06-25T17:59:50Z)
What Is AI Safety? What Do We Want It to Be? [0.0]
研究プロジェクトは、AIシステムによって引き起こされる害を防ぎ、軽減しようとする場合にのみ、AIの安全性の見地に入る。その単純さと魅力にもかかわらず、私たちは、AI安全研究者と組織がAI安全について考え話し合う方法に関して、少なくとも2つのトレンドと緊張関係にあると主張している。
論文参考訳（メタデータ） (2025-05-05T01:55:00Z)
Designing AI-Enabled Countermeasures to Cognitive Warfare [0.0]
ソーシャルメディアプラットフォーム上での外国情報操作は、民主主義社会に重大なリスクをもたらす。人工知能(AI)の台頭により、この脅威は強化され、潜在的に圧倒的な人間の防御者となる可能性がある。本稿では,認知戦争に対するAI対応対策の可能性を提案する。
論文参考訳（メタデータ） (2025-04-14T11:36:03Z)
Why do Experts Disagree on Existential Risk and P(doom)? A Survey of AI Experts [0.0]
破滅的なリスクとAIアライメントに関する研究は、専門家による懐疑的な見方がしばしばある。 AIの実在するリスクに関するオンライン議論が、部族化し始めた。 AIの安全性の概念に精通している111人のAI専門家を調査しました。
論文参考訳（メタデータ） (2025-01-25T01:51:29Z)
Position: A taxonomy for reporting and describing AI security incidents [57.98317583163334]
AIシステムのセキュリティインシデントを記述し報告するためには、具体的が必要である、と我々は主張する。非AIセキュリティまたは汎用AI安全インシデントレポートの既存のフレームワークは、AIセキュリティの特定の特性をキャプチャするには不十分である。
論文参考訳（メタデータ） (2024-12-19T13:50:26Z)
Trustworthy, Responsible, and Safe AI: A Comprehensive Architectural Framework for AI Safety with Challenges and Mitigations [14.150792596344674]
AI安全性は、AIシステムの安全な採用とデプロイにおいて重要な領域である。私たちの目標は、AI安全研究の進歩を促進し、究極的には、デジタルトランスフォーメーションに対する人々の信頼を高めることです。
論文参考訳（メタデータ） (2024-08-23T09:33:48Z)
Safetywashing: Do AI Safety Benchmarks Actually Measure Safety Progress? [59.96471873997733]
我々は、より有意義な安全指標を開発するための実証的な基盤を提案し、機械学習研究の文脈でAIの安全性を定義する。我々は、AI安全研究のためのより厳格なフレームワークを提供し、安全性評価の科学を前進させ、測定可能な進歩への道筋を明らかにすることを目指している。
論文参考訳（メタデータ） (2024-07-31T17:59:24Z)
Views on AI aren't binary -- they're plural [0.10241134756773229]
単純なバイナリはAI談話の正確なモデルではない、と私たちは主張する。私たちは、AI開発とガバナンスに取り組んでいる人々の広いコミュニティにおいて、個人がus-vs-themの衝突の発生を避けるためにどのように役立つかを具体的に提案します。
論文参考訳（メタデータ） (2023-12-21T17:50:06Z)
Managing extreme AI risks amid rapid progress [171.05448842016125]
我々は、大規模社会被害、悪意のある使用、自律型AIシステムに対する人間の制御の不可逆的な喪失を含むリスクについて説明する。このようなリスクがどのように発生し、どのように管理するかについては、合意の欠如があります。現在のガバナンスイニシアチブには、誤用や無謀を防ぎ、自律システムにほとんど対処するメカニズムや制度が欠けている。
論文参考訳（メタデータ） (2023-10-26T17:59:06Z)
The Promise and Peril of Artificial Intelligence -- Violet Teaming Offers a Balanced Path Forward [56.16884466478886]
本稿では、不透明で制御不能なAIシステムにおける新興問題についてレビューする。信頼性と責任のあるAIを開発するために、紫外チームと呼ばれる統合フレームワークを提案する。それは、設計によって積極的にリスクを管理するためのAI安全研究から生まれた。
論文参考訳（メタデータ） (2023-08-28T02:10:38Z)
Cybertrust: From Explainable to Actionable and Interpretable AI (AI2) [58.981120701284816]
Actionable and Interpretable AI (AI2)は、AIレコメンデーションにユーザの信頼度を明確に定量化し視覚化する。これにより、AIシステムの予測を調べてテストすることで、システムの意思決定に対する信頼の基盤を確立することができる。
論文参考訳（メタデータ） (2022-01-26T18:53:09Z)
Trustworthy AI: A Computational Perspective [54.80482955088197]
我々は,信頼に値するAIを実現する上で最も重要な6つの要素,(i)安全とロバスト性,(ii)非差別と公正,(iii)説明可能性,(iv)プライバシー,(v)説明可能性と監査性,(vi)環境ウェルビーイングに焦点をあてる。各次元について、分類学に基づく最近の関連技術について概観し、実世界のシステムにおけるそれらの応用を概説する。
論文参考訳（メタデータ） (2021-07-12T14:21:46Z)
The Threat of Offensive AI to Organizations [52.011307264694665]
この調査は、組織に対する攻撃的なAIの脅威を調査する。まず、AIが敵の方法、戦略、目標、および全体的な攻撃モデルをどのように変えるかについて議論する。そして、文献レビューを通じて、敵が攻撃を強化するために使用できる33の攻撃的AI能力を特定します。
論文参考訳（メタデータ） (2021-06-30T01:03:28Z)
AI Failures: A Review of Underlying Issues [0.0]
私たちは、概念化、設計、デプロイメントの欠陥を考慮して、AIの失敗に焦点を当てています。 AIシステムは、AIシステムの設計において、欠落とコミッショニングエラーのために失敗する。 AIシステムは、事実上道徳的な判断を下すことが求められる状況で、かなり失敗する可能性が高い。
論文参考訳（メタデータ） (2020-07-18T15:31:29Z)
Could regulating the creators deliver trustworthy AI? [2.588973722689844]
AIは広く普及しており、私たちの知識なしに日々のテクノロジー、デバイス、サービスにデプロイされることが多い。恐怖は、信頼できるAIの源を指し示すことができないことによって複雑化している。信頼できるAIは、関連する法律に準拠するものだと考える人もいる。倫理や基準に従う必要性を指摘する者もいる。
論文参考訳（メタデータ） (2020-06-26T01:32:53Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。