論文の概要: Code World Model Preparedness Report
- arxiv url: http://arxiv.org/abs/2605.00932v1
- Date: Fri, 01 May 2026 00:52:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.49084
- Title: Code World Model Preparedness Report
- Title(参考訳): Code World Model Preparednessレポート
- Authors: Daniel Song, Peter Ney, Cristina Menghini, Faizan Ahmad, Aidan Boyd, Nathaniel Li, Ziwen Han, Jean-Christophe Testud, Saisuke Okabayashi, Maeve Ryan, Jinpeng Miao, Hamza Kwisaba, Felix Binder, Spencer Whitman, Jim Gust, Esteban Arcaute, Dhaval Kapil, Jacob Kahn, Ayaz Minhas, Tristan Goodman, Lauren Deason, Alexander Vaughan, Shengjia Zhao, Summer Yue,
- Abstract要約: 本稿では,Code World Model (CWM) の準備性評価について報告する。
私たちはFrontier AI Frameworkで特定されたドメイン間でプレリリーステストを実施しました。
我々の評価によると、CWMは現在のAIエコシステムに存在するもの以上の、新たなフロンティアリスクを生じさせない。
- 参考スコア(独自算出の注目度): 33.69574631827376
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This report documents the preparedness assessment of Code World Model (CWM), a model for code generation and reasoning about code from Meta. We conducted pre-release testing across domains identified in our Frontier AI Framework as potentially presenting catastrophic risks, and also evaluated the model's misaligned propensities. Our assessment found that CWM does not pose additional frontier risks beyond those present in the current AI ecosystem. We therefore release it as an open-weight model.
- Abstract(参考訳): 本稿では,メタからのコード生成と推論のためのモデルであるCode World Model (CWM) の準備性評価について報告する。
私たちは、Frontier AI Frameworkで特定されたドメイン間でプレリリーステストを実施し、破滅的なリスクを示す可能性があり、モデルの不整合性を評価しました。
我々の評価によると、CWMは現在のAIエコシステムに存在するもの以上の、新たなフロンティアリスクを生じさせない。
したがって、オープンウェイトモデルとしてリリースします。
関連論文リスト
- Risk-Aware World Model Predictive Control for Generalizable End-to-End Autonomous Driving [82.69496624372944]
「専門家のように運転するのが普通」は限定的な一般化に苦しむ。
E2E-ADシステムは専門家の行動監督なしに信頼できる判断を下せるか?
本稿では,リスクを意識した世界モデル予測制御という統合フレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-26T17:32:30Z) - stable-worldmodel-v1: Reproducible World Modeling Research and Evaluation [46.55784222514516]
安定世界モデル(SWM)は,モジュール型,テスト型,文書化された世界モデル研究エコシステムである。
SWMは効率的なデータ収集ツール、標準化された環境、計画アルゴリズム、ベースライン実装を提供する。
DINO-WMにおけるゼロショットロバスト性の研究でSWMの有用性を実証する。
論文 参考訳(メタデータ) (2026-02-09T18:04:22Z) - The Tail Tells All: Estimating Model-Level Membership Inference Vulnerability Without Reference Models [8.453525669833853]
本稿では,モデルレベルの脆弱性である低FPRにおけるTPRを,参照モデルを必要としないメンバシップ推論攻撃に推定するための新しいアプローチを提案する。
本手法は,RMIAなどの低コスト(参照モデル)攻撃と,他の分布差の測定値よりも優れていることを示す。
論文 参考訳(メタデータ) (2025-10-22T17:03:55Z) - MER-Inspector: Assessing model extraction risks from an attack-agnostic perspective [13.494862189390398]
モデル抽出攻撃(MEA)として知られるモデル関数リークの理論について検討する。
本稿では,モデル抽出リスクインスペクタ(MER-Inspector)というフレームワークを提案する。
提案した指標はモデル抽出リスクと高い相関を持ち、MER-Inspectorは2つのモデルの抽出リスクを89.58%まで正確に比較することができる。
論文 参考訳(メタデータ) (2025-09-23T02:57:57Z) - AI in a vat: Fundamental limits of efficient world modelling for agent sandboxing and interpretability [84.52205243353761]
最近の研究は、世界モデルを使用して、AIエージェントをデプロイ前にテストできる制御された仮想環境を生成することを提案する。
評価対象のAIエージェントに非依存な世界モデルを簡単にする方法を検討する。
論文 参考訳(メタデータ) (2025-04-06T20:35:44Z) - Uncertainty-Aware Decoding with Minimum Bayes Risk [70.6645260214115]
予測されたリスクに応じてモデル生成を選択する最小ベイズリスク復号法を,原理化された不確実性認識復号法に一般化する方法を示す。
この修正された予測リスクは、出力の選択と生成をいつ中止するかの判断の両方に有用であり、オーバーヘッドを発生させることなく改善を提供できることを示す。
論文 参考訳(メタデータ) (2025-03-07T10:55:12Z) - A Formal Framework for Assessing and Mitigating Emergent Security Risks in Generative AI Models: Bridging Theory and Dynamic Risk Mitigation [0.3413711585591077]
大規模言語モデル(LLM)や拡散モデルを含む生成AIシステムが急速に進歩するにつれ、その採用が増加し、新たな複雑なセキュリティリスクがもたらされた。
本稿では,これらの突発的なセキュリティリスクを分類・緩和するための新しい形式的枠組みを提案する。
我々は、潜時空間利用、マルチモーダル・クロスアタック・ベクター、フィードバックループによるモデル劣化など、未探索のリスクを特定した。
論文 参考訳(メタデータ) (2024-10-15T02:51:32Z) - When Demonstrations Meet Generative World Models: A Maximum Likelihood
Framework for Offline Inverse Reinforcement Learning [62.00672284480755]
本稿では, 専門家エージェントから, 一定の有限個の実演において観測された動作を過小評価する報酬と環境力学の構造を復元することを目的とする。
タスクを実行するための正確な専門知識モデルは、臨床的意思決定や自律運転のような安全に敏感な応用に応用できる。
論文 参考訳(メタデータ) (2023-02-15T04:14:20Z) - SimSCOOD: Systematic Analysis of Out-of-Distribution Generalization in
Fine-tuned Source Code Models [58.78043959556283]
本研究は,Low-Rank Adaptation (LoRA)ファインチューニング手法を含む,異なる微調整手法によるモデルの挙動について検討する。
解析の結果、LoRAファインチューニングは様々なシナリオにおけるフルファインチューニングよりも、OODの一般化性能が大幅に向上していることが判明した。
論文 参考訳(メタデータ) (2022-10-10T16:07:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。