Fugu-MT 論文翻訳(概要): Towards AI Safety: A Taxonomy for AI System Evaluation

論文の概要: Towards AI Safety: A Taxonomy for AI System Evaluation

arxiv url: http://arxiv.org/abs/2404.05388v1
Date: Mon, 8 Apr 2024 10:49:59 GMT
ステータス: 翻訳完了
システム内更新日: 2024-04-09 14:44:37.703919
Title: Towards AI Safety: A Taxonomy for AI System Evaluation
Title（参考訳）: AI安全性を目指して - AIシステム評価のための分類学
Authors: Boming Xia, Qinghua Lu, Liming Zhu, Zhenchang Xing,
Abstract要約: 高度なAIの出現は、包括的安全性評価の必要性を前面に浮かび上がらせる。本稿では,3つのコンポーネントからなる総合的なAIシステム評価フレームワークを提案する。
参考スコア（独自算出の注目度）: 23.92695048003188
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The advent of advanced AI brings to the forefront the need for comprehensive safety evaluation. However, divergent practices and terminologies across different communities (i.e., AI, software engineering, and governance), combined with the complexity of AI systems and environmental affordances (e.g., access to tools), call for a holistic evaluation approach. This paper proposes a framework for comprehensive AI system evaluation comprising three components: 1) harmonised terminology to facilitate communication across disciplines involved in AI safety evaluation; 2) a taxonomy identifying essential elements for AI system evaluation; 3) a mapping between AI lifecycle, stakeholders, and requisite evaluations for accountable AI supply chain. This framework catalyses a deeper discourse on AI system evaluation beyond model-centric approaches.
Abstract（参考訳）: 高度なAIの出現は、包括的安全性評価の必要性を前面に浮かび上がらせる。しかし、異なるコミュニティ(AI、ソフトウェアエンジニアリング、ガバナンスなど)にまたがる異なる実践と用語は、AIシステムと環境余裕(ツールへのアクセスなど)の複雑さと相まって、総合的な評価アプローチを要求している。本稿では,3つのコンポーネントからなる総合的なAIシステム評価フレームワークを提案する。 1)AI安全評価に関わる分野間のコミュニケーションを促進するための調和した用語 2)AIシステム評価に不可欠な要素を特定する分類 3) 説明可能なAIサプライチェーンに対するAIライフサイクル、利害関係者、必要な評価のマッピング。このフレームワークは、モデル中心のアプローチを越えて、AIシステム評価に関するより深い議論を触媒する。

関連論文リスト

AILuminate: Introducing v1.0 of the AI Risk and Reliability Benchmark from MLCommons [62.374792825813394]
本稿ではAI製品リスクと信頼性を評価するための業界標準ベンチマークとして,AIluminate v1.0を紹介する。このベンチマークは、危険、違法、または望ましくない行動を12の危険カテゴリーで引き起こすように設計されたプロンプトに対するAIシステムの抵抗を評価する。
論文参考訳（メタデータ） (2025-02-19T05:58:52Z)
AI Benchmarks and Datasets for LLM Evaluation [0.46960837342692324]
EU AI Actは、2024年3月13日に欧州議会が提出したEUAIActを引用し、AIシステムの開発、配備、使用に関するEU全体の最初の包括的な要件を定めている。 AIシステムによって引き起こされる技術的課題に効果的に対処するために、この方法論を実用的なベンチマークで強化する必要性を強調している。私たちは、AIベンチマークの収集と分類を目的とした、AI Safety Bulgariaイニシアチブ(citeAI_Safety_Bulgaria)の一部として、プロジェクトをローンチした。
論文参考訳（メタデータ） (2024-12-02T00:38:57Z)
Evaluating AI Evaluation: Perils and Prospects [8.086002368038658]
本稿では,これらのシステムに対する評価手法が根本的に不適切であることを主張する。 AIシステムを評価するためには改革が必要であり、インスピレーションを得るために認知科学に目を向けるべきである、と私は主張する。
論文参考訳（メタデータ） (2024-07-12T12:37:13Z)
Combining AI Control Systems and Human Decision Support via Robustness and Criticality [53.10194953873209]
我々は、逆説(AE)の方法論を最先端の強化学習フレームワークに拡張する。学習したAI制御システムは、敵のタンパリングに対する堅牢性を示す。トレーニング/学習フレームワークでは、この技術は人間のインタラクションを通じてAIの決定と説明の両方を改善することができる。
論文参考訳（メタデータ） (2024-07-03T15:38:57Z)
Towards Bidirectional Human-AI Alignment: A Systematic Review for Clarifications, Framework, and Future Directions [101.67121669727354]
近年のAIの進歩は、AIシステムを意図された目標、倫理的原則、個人とグループの価値に向けて導くことの重要性を強調している。人間のAIアライメントの明確な定義とスコープの欠如は、このアライメントを達成するための研究領域間の共同作業を妨げる、大きな障害となる。我々は、2019年から2024年1月までに400以上の論文を体系的にレビューし、HCI(Human-Computer Interaction)、自然言語処理(NLP)、機械学習(ML)といった複数の分野にまたがって紹介する。
論文参考訳（メタデータ） (2024-06-13T16:03:25Z)
Towards Guaranteed Safe AI: A Framework for Ensuring Robust and Reliable AI Systems [88.80306881112313]
我々は、AI安全性に対する一連のアプローチを紹介し、定義する。これらのアプローチの中核的な特徴は、高保証の定量的安全性保証を備えたAIシステムを作ることである。これら3つのコアコンポーネントをそれぞれ作成するためのアプローチを概説し、主な技術的課題を説明し、それらに対する潜在的なソリューションをいくつか提案します。
論文参考訳（メタデータ） (2024-05-10T17:38:32Z)
Quantifying AI Vulnerabilities: A Synthesis of Complexity, Dynamical Systems, and Game Theory [0.0]
システム複雑度指数(SCI)、Lyapunov Exponent for AI stability(LEAIS)、Nash Equilibrium Robustness(NER)の3つの指標を導入する新しいアプローチを提案する。 SCIはAIシステムの固有の複雑さを定量化し、LEAISはその安定性と摂動に対する感受性を捉え、NERは敵の操作に対する戦略的堅牢性を評価する。
論文参考訳（メタデータ） (2024-04-07T07:05:59Z)
Testing autonomous vehicles and AI: perspectives and challenges from cybersecurity, transparency, robustness and fairness [53.91018508439669]
この研究は、人工知能を自律走行車(AV)に統合する複雑さを探求する AIコンポーネントがもたらした課題と、テスト手順への影響を調べます。本稿は、重要な課題を特定し、AV技術におけるAIの研究・開発に向けた今後の方向性を提案する。
論文参考訳（メタデータ） (2024-02-21T08:29:42Z)
Artificial intelligence in government: Concepts, standards, and a unified framework [0.0]
人工知能(AI)の最近の進歩は、政府の変革を約束している。新しいAIシステムは、社会の規範的な期待に沿うように振る舞うことが重要である。
論文参考訳（メタデータ） (2022-10-31T10:57:20Z)
A Human-Centric Assessment Framework for AI [11.065260433086024]
説明可能なAIシステムをどのように評価すべきかに関して合意された基準はない。チューリングテストに触発されて,人間中心のアセスメントフレームワークを導入する。このセットアップは、広範囲の人間中心のAIシステムアセスメントのためのフレームワークとして機能する。
論文参考訳（メタデータ） (2022-05-25T12:59:13Z)
An interdisciplinary conceptual study of Artificial Intelligence (AI) for helping benefit-risk assessment practices: Towards a comprehensive qualification matrix of AI programs and devices (pre-print 2020) [55.41644538483948]
本稿では,インテリジェンスの概念に対処するさまざまな分野の既存の概念を包括的に分析する。目的は、AIシステムを評価するための共有概念や相違点を特定することである。
論文参考訳（メタデータ） (2021-05-07T12:01:31Z)
Towards an Interface Description Template for AI-enabled Systems [77.34726150561087]
再利用(Reuse)は、システムアーキテクチャを既存のコンポーネントでインスタンス化しようとする、一般的なシステムアーキテクチャのアプローチである。現在、コンポーネントが当初目的としていたものと異なるシステムで運用する可搬性を評価するために必要な情報の選択をガイドするフレームワークは存在しない。我々は、AI対応コンポーネントの主情報をキャプチャするインターフェイス記述テンプレートの確立に向けて、現在進行中の作業について述べる。
論文参考訳（メタデータ） (2020-07-13T20:30:26Z)
AAAI FSS-19: Human-Centered AI: Trustworthiness of AI Models and Data Proceedings [8.445274192818825]
予測モデルは不確実性を認識し、信頼できる予測をもたらすことが不可欠である。このシンポジウムの焦点は、データ品質と技術的堅牢性と安全性を改善するAIシステムであった。広く定義された領域からの提出はまた、説明可能なモデル、人間の信頼、AIの倫理的側面といった要求に対処するアプローチについても論じた。
論文参考訳（メタデータ） (2020-01-15T15:30:29Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。