論文の概要: Evaluating Nova 2.0 Lite model under Amazon's Frontier Model Safety Framework
- arxiv url: http://arxiv.org/abs/2601.19134v1
- Date: Tue, 27 Jan 2026 03:03:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 14:02:58.986107
- Title: Evaluating Nova 2.0 Lite model under Amazon's Frontier Model Safety Framework
- Title(参考訳): AmazonのFrontier Model Safety FrameworkによるNova 2.0 Liteモデルの評価
- Authors: Satyapriya Krishna, Matteo Memelli, Tong Wang, Abhinav Mohanty, Claire O'Brien Rajkumar, Payal Motwani, Rahul Gupta, Spyros Matsoukas,
- Abstract要約: 我々はNova 2.0 Liteの評価を行う。
このモデルは、最大100万トークンのコンテキスト長でテキスト、画像、ビデオを処理する。
我々は、フロンティアモデルに関連する新たなリスクと能力が特定されるにつれて、安全評価と緩和パイプラインの強化を続けます。
- 参考スコア(独自算出の注目度): 14.28493845517867
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Amazon published its Frontier Model Safety Framework (FMSF) as part of the Paris AI summit, following which we presented a report on Amazon's Premier model. In this report, we present an evaluation of Nova 2.0 Lite. Nova 2.0 Lite was made generally available from amongst the Nova 2.0 series and is one of its most capable reasoning models. The model processes text, images, and video with a context length of up to 1M tokens, enabling analysis of large codebases, documents, and videos in a single prompt. We present a comprehensive evaluation of Nova 2.0 Lite's critical risk profile under the FMSF. Evaluations target three high-risk domains-Chemical, Biological, Radiological and Nuclear (CBRN), Offensive Cyber Operations, and Automated AI R&D-and combine automated benchmarks, expert red-teaming, and uplift studies to determine whether the model exceeds release thresholds. We summarize our methodology and report core findings. We will continue to enhance our safety evaluation and mitigation pipelines as new risks and capabilities associated with frontier models are identified.
- Abstract(参考訳): AmazonはパリAIサミットの一環として、Frontier Model Safety Framework(FMSF)を公開した。
本稿では,Nova 2.0 Liteの評価について述べる。
Nova 2.0 LiteはNova 2.0シリーズの中で一般に利用可能であり、最も有能な推論モデルの一つである。
このモデルは、最大100万トークンのコンテキスト長でテキスト、画像、ビデオを処理し、単一のプロンプトで大きなコードベース、ドキュメント、ビデオの分析を可能にする。
FMSFにおけるNova 2.0 Liteの臨界リスクプロファイルを総合的に評価する。
評価対象は、化学、生物学、放射線学、核(CBRN)、攻撃的サイバーオペレーション、自動AIR&Dの3つのハイリスクドメインであり、自動ベンチマーク、専門家のレッドチーム、そしてモデルがリリースしきい値を超えたかどうかを判断するアップリフト研究を組み合わせたものだ。
方法論を要約し、中核的な発見を報告する。
我々は、フロンティアモデルに関連する新たなリスクと能力が特定されるにつれて、安全評価と緩和パイプラインの強化を続けます。
関連論文リスト
- Evaluating the Critical Risks of Amazon's Nova Premier under the Frontier Model Safety Framework [15.122109053923817]
Nova PremierはAmazonで最も有能なマルチモーダルファンデーションモデルである。
テキスト、画像、動画を100万件のコンテキストウィンドウで処理する。
我々は,ノバス・プレミアの臨界リスクプロファイルの総合評価を行った。
論文 参考訳(メタデータ) (2025-07-07T13:33:35Z) - The Amazon Nova Family of Models: Technical Report and Model Card [380.6072792059853]
Amazon Novaは、フロンティアインテリジェンスと業界主導の価格パフォーマンスを提供する、新しい世代のファンデーションモデルである。
Amazon Nova Proは、さまざまなタスクに最適な精度、スピード、コストの組み合わせを備えた、高機能なマルチモーダルモデルである。
Amazon Nova Liteは低コストのマルチモーダルモデルで、画像、ビデオ、ドキュメント、テキストを高速に処理できる。
Amazon Nova Microはテキストのみのモデルで、低レイテンシのレスポンスを極めて低コストで提供します。
論文 参考訳(メタデータ) (2025-03-17T15:18:49Z) - Evaluating Frontier Models for Dangerous Capabilities [59.129424649740855]
危険な能力」の評価プログラムを導入し、Gemini 1.0モデルで試行する。
評価対象は,(1)説得と騙し,(2)サイバーセキュリティ,(3)自己増殖,(4)自己推論の4分野である。
我々の目標は、将来のモデルに備えて、危険な能力評価の厳格な科学を前進させることです。
論文 参考訳(メタデータ) (2024-03-20T17:54:26Z) - Gemma: Open Models Based on Gemini Research and Technology [128.57714343844074]
Gemmaは、Geminiモデルを作成するために使用される研究と技術から構築された、軽量で最先端のオープンモデルのファミリーである。
Gemmaモデルは、言語理解、推論、安全性のための学術ベンチマークで強力なパフォーマンスを示している。
論文 参考訳(メタデータ) (2024-03-13T06:59:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。