Fugu-MT 論文翻訳(概要): Coordinated Disclosure of Dual-Use Capabilities: An Early Warning System for Advanced AI

論文の概要: Coordinated Disclosure of Dual-Use Capabilities: An Early Warning System for Advanced AI

arxiv url: http://arxiv.org/abs/2407.01420v3
Date: Fri, 04 Oct 2024 19:06:02 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-02 04:05:29.70476
Title: Coordinated Disclosure of Dual-Use Capabilities: An Early Warning System for Advanced AI
Title（参考訳）: デュアルユース能力の協調公開:AIの早期警告システム
Authors: Joe O'Brien, Shaun Ee, Jam Kraprayoon, Bill Anderson-Samways, Oscar Delaney, Zoe Williams,
Abstract要約: 本稿では,先進的なAI開発者や米国政府機関,その他の民間企業との早期情報共有を支援するプロセスとして,CDDC(Coordinated Disclosure of Dual-Use Capabilities)を提案する。これは、米国政府、デュアルユースファンデーションモデル開発者、その他のアクターに、公衆の安全とセキュリティに大きな影響を与える可能性のあるAI機能の概要と、対応の最大時間を提供することを目的としている。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Advanced AI systems may be developed which exhibit capabilities that present significant risks to public safety or security. They may also exhibit capabilities that may be applied defensively in a wide set of domains, including (but not limited to) developing societal resilience against AI threats. We propose Coordinated Disclosure of Dual-Use Capabilities (CDDC) as a process to guide early information-sharing between advanced AI developers, US government agencies, and other private sector actors about these capabilities. The process centers around an information clearinghouse (the "coordinator") which receives evidence of dual-use capabilities from finders via mandatory and/or voluntary reporting pathways, and passes noteworthy reports to defenders for follow-up (i.e., further analysis and response). This aims to provide the US government, dual-use foundation model developers, and other actors with an overview of AI capabilities that could significantly impact public safety and security, as well as maximal time to respond.
Abstract（参考訳）: 高度なAIシステムは、公共の安全やセキュリティに重大なリスクをもたらす能力を示すことができる。また、AI脅威に対する社会的レジリエンスの発達を含む、幅広い領域で防御的に適用される可能性がある。我々は、先進的なAI開発者や米国政府機関、その他の民間機関との早期の情報共有を支援するプロセスとして、CDDC(Coordinated Disclosure of Dual-Use Capabilities)を提案する。このプロセスは、インフォメーション・クリアリングハウス(コーディネーター)を中心にしており、インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション・インフォメーション( これは、米国政府、デュアルユースファンデーションモデル開発者、その他のアクターに、公衆の安全とセキュリティに大きな影響を及ぼす可能性のあるAI機能の概要と、対応の最大時間を提供することを目的としている。

関連論文リスト

Frontier AI Auditing: Toward Rigorous Third-Party Assessment of Safety and Security Practices at Leading AI Companies [57.521647436515785]
私たちはフロンティアAIの監査を、フロンティアAI開発者の安全とセキュリティに関する主張の厳格な第三者による検証として定義しています。本稿では,AI保証レベル(AAL-1からAAL-4)について紹介する。
論文参考訳（メタデータ） (2026-01-16T18:44:09Z)
Ask What Your Country Can Do For You: Towards a Public Red Teaming Model [1.4138385478350077]
我々は,協調型公開AIリピート演習を提案する。最初の個人によるデモ隊演習はCAMLIS 2024と共同で行われた。このアプローチは有意義な結果を提供できると同時に、多くのAI開発管轄区域にも拡張性がある、と私たちは主張する。
論文参考訳（メタデータ） (2025-10-22T22:24:21Z)
Verifying International Agreements on AI: Six Layers of Verification for Rules on Large-Scale AI Development and Deployment [0.7364983833280243]
このレポートは、政策の専門家と技術研究者の両方を対象とした、AI検証の詳細な概要を提供する。本稿では、新しい概念フレームワーク、詳細な実装オプション、そして重要なR&D課題について述べる。州は最終的に6つのほぼ独立した検証手法を用いてコンプライアンスを検証できることがわかった。
論文参考訳（メタデータ） (2025-07-21T17:45:15Z)
Securing AI Systems: A Guide to Known Attacks and Impacts [0.0]
本稿では,予測型および生成型AIシステムに特有の敵攻撃の概要について述べる。我々は11種類の主要な攻撃タイプを特定し、その影響に攻撃テクニックを明示的にリンクする。我々は、AI固有のリスクを認識し、効果的な防御を実装するための基礎知識を、研究者、開発者、セキュリティ実践者、および政策立案者に提供することを目的としています。
論文参考訳（メタデータ） (2025-06-29T15:32:03Z)
Open Challenges in Multi-Agent Security: Towards Secure Systems of Interacting AI Agents [0.0]
分散AIエージェントはすぐにインターネットプラットフォーム間で対話し、従来のサイバーセキュリティやAI安全フレームワークを超えたセキュリティ上の課題を生み出す。 textbfmulti-agent Securityは、分散化されたAIエージェントのネットワークを、そのインタラクションを通じて出現または増幅する脅威に対して保護する、新たな分野である。
論文参考訳（メタデータ） (2025-05-04T12:03:29Z)
AI threats to national security can be countered through an incident regime [55.2480439325792]
我々は、AIシステムからの潜在的な国家安全保障脅威に対抗することを目的とした、法的に義務付けられたポストデプロイAIインシデントシステムを提案する。提案したAIインシデント体制は,3段階に分けられる。第1フェーズは,‘AIインシデント’とみなすような,新たな運用方法を中心に展開される。第2フェーズと第3フェーズでは、AIプロバイダが政府機関にインシデントを通知し、政府機関がAIプロバイダのセキュリティおよび安全手順の修正に関与するべきだ、と説明されている。
論文参考訳（メタデータ） (2025-03-25T17:51:50Z)
In-House Evaluation Is Not Enough: Towards Robust Third-Party Flaw Disclosure for General-Purpose AI [93.33036653316591]
我々はシステムの安全性を高めるために3つの介入を要求します。まず、標準化されたAI欠陥レポートと研究者へのエンゲージメントのルールを用いることを提案する。第2に,GPAIシステムプロバイダが広視野欠陥開示プログラムを採用することを提案する。第3に,欠陥報告の分布を調整するための改良されたインフラの開発を提唱する。
論文参考訳（メタデータ） (2025-03-21T05:09:46Z)
Position: A taxonomy for reporting and describing AI security incidents [57.98317583163334]
AIシステムのセキュリティインシデントを記述し報告するためには、具体的が必要である、と我々は主張する。非AIセキュリティまたは汎用AI安全インシデントレポートの既存のフレームワークは、AIセキュリティの特定の特性をキャプチャするには不十分である。
論文参考訳（メタデータ） (2024-12-19T13:50:26Z)
Considerations Influencing Offense-Defense Dynamics From Artificial Intelligence [0.0]
AIは防御能力を向上するだけでなく、悪意ある搾取と大規模な社会的危害のための道も提示する。本稿では、AIシステムが主に脅威を生じているか、社会に保護的利益をもたらすかに影響を及ぼす主要な要因をマップし、検証するための分類法を提案する。
論文参考訳（メタデータ） (2024-12-05T10:05:53Z)
Security Threats in Agentic AI System [0.0]
AIシステムの複雑さと、大量のデータを処理して分析する能力が組み合わさって、データ漏洩や漏洩の可能性が高まる。 AIエージェントがより自律的に進化するにつれて、セキュリティ対策を回避または活用する能力が懸念される。
論文参考訳（メタデータ） (2024-10-16T06:40:02Z)
Do Responsible AI Artifacts Advance Stakeholder Goals? Four Key Barriers Perceived by Legal and Civil Stakeholders [59.17981603969404]
責任あるAI(RAI)コミュニティは、透明性を促進し、AIシステムのガバナンスをサポートするために、多数のプロセスとアーティファクトを導入している。我々は、責任あるAI活動に関する政策と擁護を通知する19の政府、法律、市民社会の利害関係者と半構造化されたインタビューを行う。我々は、これらの信念を4つの障壁にまとめて、RAIアーティファクトが(必然的に)市民社会、政府、産業間での権力関係を再構成する方法を説明する。
論文参考訳（メタデータ） (2024-08-22T00:14:37Z)
AI Emergency Preparedness: Examining the federal government's ability to detect and respond to AI-related national security threats [0.2008854179910039]
緊急準備は、政府のAI進捗の監視と予測能力を向上させることができる。 1)コントロールの喪失(人間のコントロールを逃れることのできる強力なAIシステムからの脅威)、(2)悪意のあるアクターによるサイバーセキュリティの脅威、(3)生物兵器の増殖。
論文参考訳（メタデータ） (2024-07-03T17:54:01Z)
AI Agents Under Threat: A Survey of Key Security Challenges and Future Pathways [10.16690494897609]
人工知能(AI)エージェント(英: Artificial Intelligence, AI)は、自律的にタスクを実行したり、事前に定義された目的やデータ入力に基づいて決定を行うソフトウェアエンティティである。この調査は、AIエージェントが直面している新たなセキュリティ脅威を掘り下げ、これらを4つの重要な知識ギャップに分類する。これらの脅威を体系的にレビューすることにより、この論文はAIエージェントの保護における進歩と既存の制限の両方を強調している。
論文参考訳（メタデータ） (2024-06-04T01:22:31Z)
A Safe Harbor for AI Evaluation and Red Teaming [124.89885800509505]
一部の研究者は、そのような研究の実施や研究成果の公表が、アカウント停止や法的報復につながることを恐れている。我々は、主要なAI開発者が法的、技術的に安全な港を提供することを約束することを提案します。これらのコミットメントは、ジェネレーティブAIのリスクに取り組むための、より包括的で意図しないコミュニティ努力への必要なステップである、と私たちは信じています。
論文参考訳（メタデータ） (2024-03-07T20:55:08Z)
Managing extreme AI risks amid rapid progress [171.05448842016125]
我々は、大規模社会被害、悪意のある使用、自律型AIシステムに対する人間の制御の不可逆的な喪失を含むリスクについて説明する。このようなリスクがどのように発生し、どのように管理するかについては、合意の欠如があります。現在のガバナンスイニシアチブには、誤用や無謀を防ぎ、自律システムにほとんど対処するメカニズムや制度が欠けている。
論文参考訳（メタデータ） (2023-10-26T17:59:06Z)
AI Potentiality and Awareness: A Position Paper from the Perspective of Human-AI Teaming in Cybersecurity [18.324118502535775]
我々は、人間とAIのコラボレーションはサイバーセキュリティに価値があると論じている。私たちは、AIの計算能力と人間の専門知識を取り入れたバランスのとれたアプローチの重要性を強調します。
論文参考訳（メタデータ） (2023-09-28T01:20:44Z)
Cybertrust: From Explainable to Actionable and Interpretable AI (AI2) [58.981120701284816]
Actionable and Interpretable AI (AI2)は、AIレコメンデーションにユーザの信頼度を明確に定量化し視覚化する。これにより、AIシステムの予測を調べてテストすることで、システムの意思決定に対する信頼の基盤を確立することができる。
論文参考訳（メタデータ） (2022-01-26T18:53:09Z)
Trustworthy AI Inference Systems: An Industry Research View [58.000323504158054]
我々は、信頼できるAI推論システムの設計、展開、運用にアプローチするための業界調査ビューを提供する。信頼された実行環境を用いたAIシステムの機会と課題を強調します。我々は,産業,アカデミック,政府研究者のグローバルな集団的注意を必要とする,さらなる発展の分野を概説する。
論文参考訳（メタデータ） (2020-08-10T23:05:55Z)
Toward Trustworthy AI Development: Mechanisms for Supporting Verifiable Claims [59.64274607533249]
AI開発者は、責任を負うことのできる検証可能な主張をする必要がある。このレポートは、さまざまな利害関係者がAIシステムに関するクレームの妥当性を改善するための様々なステップを示唆している。我々は、この目的のための10のメカニズム、すなわち、組織、ソフトウェア、ハードウェアを分析し、それらのメカニズムの実装、探索、改善を目的とした推奨を行う。
論文参考訳（メタデータ） (2020-04-15T17:15:35Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。