論文の概要: Towards Measurement Theory for Artificial Intelligence
- arxiv url: http://arxiv.org/abs/2507.05587v1
- Date: Tue, 08 Jul 2025 01:52:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-09 16:34:37.478731
- Title: Towards Measurement Theory for Artificial Intelligence
- Title(参考訳): 人工知能の計測理論に向けて
- Authors: Elija Perrier,
- Abstract要約: i)システムとそれらに適用した評価方法の比較、(ii)エンジニアリングと安全科学から得られた確立された定量的リスク分析技術とフロンティアAI評価を結びつけること、(iii)AI能力として数えられるものは、私たちが使用する測定操作とスケールにどのように影響するかを前もって述べること。
我々は、層状測定スタックをスケッチし、間接観測対象と直接区別し、これらの成分がAI現象の統一的、校正可能な分類への道のりを提供することを示すサインポストを作成した。
- 参考スコア(独自算出の注目度): 0.6526824510982799
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We motivate and outline a programme for a formal theory of measurement of artificial intelligence. We argue that formalising measurement for AI will allow researchers, practitioners, and regulators to: (i) make comparisons between systems and the evaluation methods applied to them; (ii) connect frontier AI evaluations with established quantitative risk analysis techniques drawn from engineering and safety science; and (iii) foreground how what counts as AI capability is contingent upon the measurement operations and scales we elect to use. We sketch a layered measurement stack, distinguish direct from indirect observables, and signpost how these ingredients provide a pathway toward a unified, calibratable taxonomy of AI phenomena.
- Abstract(参考訳): 我々は、人工知能の測定に関する公式な理論のプログラムを動機付け、概説する。
AIのための測定の形式化によって、研究者、実践者、規制機関は次のようになる、と私たちは主張する。
一 システムとそれらに適用した評価方法の比較をする。
二)フロンティアAI評価と工学・安全科学から引き出された確立した定量的リスク分析手法を結びつけること。
(iii)AI能力として数えられるものは、私たちが使用する測定操作とスケールにどのように影響するかを前もって説明します。
我々は、層状測定スタックをスケッチし、間接観測対象と直接区別し、これらの成分がAI現象の統一的、校正可能な分類への道のりを提供することを示すサインポストを作成した。
関連論文リスト
- Position: Evaluating Generative AI Systems Is a Social Science Measurement Challenge [78.35388859345056]
我々は,MLコミュニティが,GenAIシステム評価のための計測機器を開発する際に,社会科学の学習と図面の恩恵を受けることを論じる。
我々は,GenAIシステムの能力,行動,および影響に関する概念を測定するための,社会科学からの計測理論に基づく4段階の枠組みを提案する。
論文 参考訳(メタデータ) (2025-02-01T21:09:51Z) - Evaluating Generative AI Systems is a Social Science Measurement Challenge [78.35388859345056]
我々は,GenAIシステムの能力,影響,機会,リスクに関連する概念を測定するための枠組みを提案する。
このフレームワークは、背景概念、体系化された概念、測定器、インスタンスレベルの測定そのものの4つのレベルを区別する。
論文 参考訳(メタデータ) (2024-11-17T02:35:30Z) - An Experimental Investigation into the Evaluation of Explainability
Methods [60.54170260771932]
この研究は、9つの最先端XAI法と3つのダミー法(例えば、ランダム・サリエンシ・マップ)に適用された14の異なるメトリクスを比較した。
実験の結果、これらの指標のどれが高い相関関係を示し、潜在的な冗長性を示している。
論文 参考訳(メタデータ) (2023-05-25T08:07:07Z) - Interpretable Uncertainty Quantification in AI for HEP [2.922388615593672]
不確実性の推定は、HEPにおける科学的測定の核心にある。
不確実性定量化(UQ)の目標は「これらの不確実性をどのように物理的に統計的に解釈するか」という問題と密接に関連している。
HEPにおける人工知能(AI)応用には、UQの解釈可能な手法が不可欠である分野がいくつかある。
論文 参考訳(メタデータ) (2022-08-05T17:20:27Z) - An Objective Metric for Explainable AI: How and Why to Estimate the
Degree of Explainability [3.04585143845864]
本稿では, 客観的手法を用いて, 正しい情報のeX説明可能性の度合いを測定するための, モデルに依存しない新しい指標を提案する。
私たちは、医療とファイナンスのための2つの現実的なAIベースのシステムについて、いくつかの実験とユーザースタディを設計しました。
論文 参考訳(メタデータ) (2021-09-11T17:44:13Z) - Measuring Ethics in AI with AI: A Methodology and Dataset Construction [1.6861004263551447]
我々は、AI技術のこのような新しい機能を使用して、AI測定能力を増強することを提案する。
我々は倫理的問題や関心事に関連する出版物を分類するモデルを訓練する。
私たちは、AIメトリクス、特に信頼できる公正なAIベースのツールや技術開発への彼らの貢献の意味を強調します。
論文 参考訳(メタデータ) (2021-07-26T00:26:12Z) - A Comparative Approach to Explainable Artificial Intelligence Methods in
Application to High-Dimensional Electronic Health Records: Examining the
Usability of XAI [0.0]
XAIは、コミュニケーション手段によって人間に達成される信頼の実証的要因を生み出すことを目的としている。
機械を信頼して人間の生き方に向くというイデオロギーは倫理的な混乱を引き起こします。
XAIメソッドは、ローカルレベルとグローバルレベルの両方で出力される特定のモデルに対する機能貢献を視覚化します。
論文 参考訳(メタデータ) (2021-03-08T18:15:52Z) - Neuro-symbolic Architectures for Context Understanding [59.899606495602406]
本稿では,データ駆動型アプローチと知識駆動型アプローチの強みを組み合わせたフレームワークとして,ハイブリッドAI手法を提案する。
具体的には、知識ベースを用いて深層ニューラルネットワークの学習過程を導く方法として、ニューロシンボリズムの概念を継承する。
論文 参考訳(メタデータ) (2020-03-09T15:04:07Z) - A general framework for scientifically inspired explanations in AI [76.48625630211943]
我々は、AIシステムの説明を実装可能な一般的なフレームワークの理論的基盤として、科学的説明の構造の概念をインスタンス化する。
このフレームワークは、AIシステムの"メンタルモデル"を構築するためのツールを提供することを目的としている。
論文 参考訳(メタデータ) (2020-03-02T10:32:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。