論文の概要: What Should Frontier AI Developers Disclose About Internal Deployments?
- arxiv url: http://arxiv.org/abs/2604.23065v1
- Date: Fri, 24 Apr 2026 23:28:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.133178
- Title: What Should Frontier AI Developers Disclose About Internal Deployments?
- Title(参考訳): フェデラルなAI開発者は内部展開について何を知るべきか?
- Authors: Jacob Charnock, Raja Mehta Moreno, Justin Miller, William L. Anderson,
- Abstract要約: 開発者は、内部にデプロイされたモデルが安全であるという証拠を提供する必要がある。
企業が4つのカテゴリにまたがって社内に展開するモデルについて開示すべき重要な情報を特定します。
私たちのフレームワークは、開発者がモデルシステムカードのような公開透明性文書と、新たなフロンティアAI規制の下で必要とされるプライベート定期的なレポートの両方を通知するために使用することができる。
- 参考スコア(独自算出の注目度): 0.6113106953880909
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Frontier AI developers are increasingly deploying highly capable models internally to automate AI R&D, but these deployments currently face limited external oversight. It is essential, therefore, that developers provide evidence that internally deployed models are safe. While recent work has highlighted the risks of internal deployments and proposed broad approaches to transparency and governance, there remains little guidance on the specific information developers should disclose about them. We address this gap by identifying key information that companies should disclose about internally deployed models across four categories: capabilities, usage, safety mitigations, and governance. For each category, we analyse the key benefits and limitations of disclosure and consider how disclosure-related risks can be mitigated. Our framework could be used by developers to inform both public transparency documents, such as model system cards, and private periodic reports required under emerging frontier AI regulation.
- Abstract(参考訳): 最先端のAI開発者は、AI R&Dを自動化するために高度な能力を持つモデルを社内に展開する傾向にあるが、これらのデプロイメントは現在、限られた外部監視に直面している。
したがって、開発者は内部にデプロイされたモデルが安全であるという証拠を提供する必要がある。
最近の研究は、内部デプロイメントのリスクを強調し、透明性とガバナンスに対する幅広いアプローチを提案しているが、開発者が公開すべき特定の情報に関するガイダンスはほとんど残っていない。
このギャップに対処するために、企業が4つのカテゴリ(機能、使用法、安全対策、ガバナンス)にまたがって内部に展開するモデルについて開示すべき重要な情報を特定します。
各カテゴリにおいて、開示の主なメリットと限界を分析し、開示に関連するリスクを緩和する方法を検討する。
私たちのフレームワークは、開発者がモデルシステムカードのような公開透明性文書と、新たなフロンティアAI規制の下で必要とされるプライベート定期的なレポートの両方を通知するために使用することができる。
関連論文リスト
- Beyond the Binary: A nuanced path for open-weight advanced AI [0.0]
オープンウェイトAIモデル(Open-weight Advanced AI Model)は、パラメータが自由にダウンロードおよび適応できるシステムである。
このレポートは、'オープン'と'クローズ'のAIのバイナリフレーミングを越えている。
開発者や司法機関間での安全性の実践には大きな違いがある。
本稿では,厳密なリスクアセスメントによって開放性が決定され,安全性が実証されたモデルリリースに対して,階層的かつ安全性に配慮したアプローチを提案する。
論文 参考訳(メタデータ) (2026-02-23T10:26:23Z) - Frontier AI Risk Management Framework in Practice: A Risk Analysis Technical Report v1.5 [61.787178868669265]
この技術レポートは、サイバー犯罪、説得と操作、戦略上の詐欺、制御されていないAIR&D、自己複製の5つの重要な側面について、更新されきめ細かな評価を提示する。
この作業は、現在のAIフロンティアのリスクに対する理解を反映し、これらの課題を軽減するための集団行動を促します。
論文 参考訳(メタデータ) (2026-02-16T04:30:06Z) - Aegis: Towards Governance, Integrity, and Security of AI Voice Agents [52.7512082818639]
音声エージェントのガバナンス,整合性,セキュリティのためのフレームワークであるAegisを提案する。
我々は,銀行コールセンタ,ITサポート,ロジスティクスにおけるケーススタディを通じて,この枠組みを評価する。
モデルファミリ間の系統的な差異を観察し,より感受性の高いオープンウェイトモデルを示した。
論文 参考訳(メタデータ) (2026-02-07T05:51:36Z) - Frontier AI Auditing: Toward Rigorous Third-Party Assessment of Safety and Security Practices at Leading AI Companies [57.521647436515785]
私たちはフロンティアAIの監査を、フロンティアAI開発者の安全とセキュリティに関する主張の厳格な第三者による検証として定義しています。
本稿では,AI保証レベル(AAL-1からAAL-4)について紹介する。
論文 参考訳(メタデータ) (2026-01-16T18:44:09Z) - International AI Safety Report 2025: Second Key Update: Technical Safeguards and Risk Management [115.92752850425272]
2025年の国際AI安全レポートの第2の更新は、この1年で汎用AIリスク管理の新しい展開を評価している。
研究者、公共機関、AI開発者が汎用AIのリスク管理にどのようにアプローチしているかを調べる。
論文 参考訳(メタデータ) (2025-11-25T03:12:56Z) - AI Behind Closed Doors: a Primer on The Governance of Internal Deployment [33.99253912746621]
内部デプロイメントは、フロンティアAIシステムによるメリットとリスクの主な源泉である。
このレポートは、内部デプロイメントのガバナンスに関する会話を予備して、この欠如に対処することを目的としている。
そこでは,AI研究開発パイプラインに対するAIシステムの内部適用による制御の喪失に関連するリスクについて論じる。
論文 参考訳(メタデータ) (2025-04-16T15:21:13Z) - AgentDAM: Privacy Leakage Evaluation for Autonomous Web Agents [66.29263282311258]
我々は、AIウェブナビゲーションエージェントがデータ最小化のプライバシー原則に従うかどうかを測定する新しいベンチマークAgentDAMを紹介する。
我々のベンチマークは、現実的なWebインタラクションシナリオをエンドツーエンドでシミュレートし、既存のWebナビゲーションエージェントに適応する。
論文 参考訳(メタデータ) (2025-03-12T19:30:31Z) - Deployment Corrections: An incident response framework for frontier AI
models [0.0]
本稿では,デプロイ前リスク管理が不十分な場合の緊急計画について検討する。
危険な機能に対応するためにAI開発者が使用できるデプロイメント修正ツールキットについて説明する。
私たちは、フロンティアAI開発者、標準設定組織、そして規制当局が協力して標準化された業界全体のアプローチを定義することを推奨します。
論文 参考訳(メタデータ) (2023-09-30T10:07:39Z) - Frontier AI Regulation: Managing Emerging Risks to Public Safety [15.85618115026625]
脆弱なAI」モデルは、公共の安全に深刻なリスクをもたらすのに十分な危険能力を持つ可能性がある。
業界の自己規制は重要な第一歩です。
安全基準の最初のセットを提案する。
論文 参考訳(メタデータ) (2023-07-06T17:03:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。