Fugu-MT 論文翻訳(概要): The Problem with Metrics is a Fundamental Problem for AI

論文の概要: The Problem with Metrics is a Fundamental Problem for AI

arxiv url: http://arxiv.org/abs/2002.08512v1
Date: Thu, 20 Feb 2020 00:56:11 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-30 08:01:42.969672
Title: The Problem with Metrics is a Fundamental Problem for AI
Title（参考訳）: メトリクスの問題はaiの基本的な問題である
Authors: Rachel Thomas and David Uminsky
Abstract要約: メトリクスの過剰な強調は、操作、ゲーム、短期的な目標に焦点を合わせることにつながる。本稿では,AIにおけるメトリクスの過度の強調による害を軽減するための枠組みを提案する。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Optimizing a given metric is a central aspect of most current AI approaches, yet overemphasizing metrics leads to manipulation, gaming, a myopic focus on short-term goals, and other unexpected negative consequences. This poses a fundamental contradiction for AI development. Through a series of real-world case studies, we look at various aspects of where metrics go wrong in practice and aspects of how our online environment and current business practices are exacerbating these failures. Finally, we propose a framework towards mitigating the harms caused by overemphasis of metrics within AI by: (1) using a slate of metrics to get a fuller and more nuanced picture, (2) combining metrics with qualitative accounts, and (3) involving a range of stakeholders, including those who will be most impacted.
Abstract（参考訳）: メトリクスの最適化は、現在のほとんどのAIアプローチの中心的な側面であるが、メトリクスの過剰な強調は、操作、ゲーム、短期的な目標に対するミオニックな焦点、その他の予期せぬネガティブな結果につながる。これはAI開発に根本的な矛盾をもたらす。一連の実世界のケーススタディを通じて、メトリクスの実践における悪さのさまざまな側面と、オンライン環境と現在のビジネスプラクティスがこれらの失敗を悪化させる方法のさまざまな側面に注目します。最後に、AIにおけるメトリクスの過度の強調による害を軽減するためのフレームワークを提案する。(1) メトリクスのスレートを使用して、より精細な画像を得る、(2) メトリクスを質的なアカウントと組み合わせる、(3) 利害関係者を含む様々な利害関係者を含む。

関連論文リスト

Position: All Current Generative Fidelity and Diversity Metrics are Flawed [58.815519650465774]
現在のジェネレーティブの忠実度と多様性の指標がすべて欠陥があることを示します。私たちの目標は、モデルではなく、メトリクスの開発により多くの労力を費やすように研究コミュニティを説得することにあります。
論文参考訳（メタデータ） (2025-05-28T15:10:33Z)
Can We Trust AI Benchmarks? An Interdisciplinary Review of Current Issues in AI Evaluation [2.2241228857601727]
本稿では,定量的なベンチマーク手法の欠点を論じる,約100の学術研究の学際的メタレビューを示す。これは、より広範な社会技術的問題を伴うベンチマークの設計と適用において、多くのきめ細かい問題をもたらす。レビューではまた、不正なインセンティブ、妥当性の問題の構築、未知の未知、ベンチマーク結果のゲームに関する問題など、現在のプラクティスにおける一連のシステム的欠陥についても取り上げている。
論文参考訳（メタデータ） (2025-02-10T15:25:06Z)
Hype, Sustainability, and the Price of the Bigger-is-Better Paradigm in AI [67.58673784790375]
AIパラダイムは、科学的に脆弱なだけでなく、望ましくない結果をもたらすものだ、と私たちは主張する。第一に、計算要求がモデルの性能よりも早く増加し、不合理な経済要求と不均等な環境フットプリントにつながるため、持続可能ではない。第二に、健康、教育、気候などの重要な応用は別として、他人を犠牲にして特定の問題に焦点をあてることである。
論文参考訳（メタデータ） (2024-09-21T14:43:54Z)
MR-Ben: A Meta-Reasoning Benchmark for Evaluating System-2 Thinking in LLMs [55.20845457594977]
大規模言語モデル(LLM)は、問題解決と意思決定の能力の向上を示している。本稿ではメタ推論技術を必要とするプロセスベースのベンチマークMR-Benを提案する。メタ推論のパラダイムは,システム2のスロー思考に特に適しています。
論文参考訳（メタデータ） (2024-06-20T03:50:23Z)
Crossing the principle-practice gap in AI ethics with ethical problem-solving [0.0]
AI開発の技術的側面から倫理的言説を分離する原則-実践的ギャップを埋めるには、依然として未解決の問題である。 EPSは、責任、人間中心、価値指向のAI開発を促進する方法論である。 EPSを青写真として利用し、Ethics as a Service Platformの実装を提案します。
論文参考訳（メタデータ） (2024-04-16T14:35:13Z)
Towards a Responsible AI Metrics Catalogue: A Collection of Metrics for AI Accountability [28.67753149592534]
本研究は,包括的メトリクスカタログへの取り組みを導入することで,説明責任のギャップを埋めるものである。我々のカタログは、手続き的整合性を支えるプロセスメトリクス、必要なツールやフレームワークを提供するリソースメトリクス、AIシステムのアウトプットを反映する製品メトリクスを記述しています。
論文参考訳（メタデータ） (2023-11-22T04:43:16Z)
LAMBO: Large AI Model Empowered Edge Intelligence [71.56135386994119]
次世代エッジインテリジェンスは、オフロード技術を通じて様々なアプリケーションに恩恵をもたらすことが期待されている。従来のオフロードアーキテクチャは、不均一な制約、部分的な認識、不確実な一般化、トラクタビリティの欠如など、いくつかの問題に直面している。我々は、これらの問題を解決するための10億以上のパラメータを持つLarge AI Model-Based Offloading (LAMBO)フレームワークを提案する。
論文参考訳（メタデータ） (2023-08-29T07:25:42Z)
Beyond Sharing: Conflict-Aware Multivariate Time Series Anomaly Detection [18.796225184893874]
本稿では,衝突を意識した異常検出アルゴリズムCADを紹介する。その結果,バニラMMoEの粗悪な性能は,MTS定式化の入力出力ミスアライメント設定に起因していることが判明した。 CADは3つの公開データセットの平均F1スコアが0.943であることを示す。
論文参考訳（メタデータ） (2023-08-17T11:00:01Z)
Joint Metrics Matter: A Better Standard for Trajectory Forecasting [67.1375677218281]
マルチモーダル・トラジェクトリ・予測法 : シングルエージェント・メトリクス(マージナル・メトリクス)を用いた評価余分な指標にのみ注目することは、グループとして明確に一緒に歩いている人々のために、軌跡の衝突や軌跡のばらつきといった、不自然な予測につながる可能性がある。本稿では,JADE,JFDE,衝突速度といったマルチエージェントメトリクス(ジョイントメトリクス)に関して,最先端トラジェクトリ予測手法の総合評価を行った。
論文参考訳（メタデータ） (2023-05-10T16:27:55Z)
Evaluating Machine Unlearning via Epistemic Uncertainty [78.27542864367821]
本研究では,不確実性に基づく機械学習アルゴリズムの評価を行う。これは私たちの最良の知識の一般的な評価の最初の定義です。
論文参考訳（メタデータ） (2022-08-23T09:37:31Z)
Metrics reloaded: Recommendations for image analysis validation [59.60445111432934]
メトリクスのリロード(Metrics Reloaded)は、メトリクスの問題を意識した選択において研究者を導く包括的なフレームワークである。このフレームワークは多段階のDelphiプロセスで開発され、問題指紋という新しい概念に基づいている。問題指紋に基づいて、ユーザは適切なバリデーションメトリクスを選択して適用するプロセスを通じてガイドされる。
論文参考訳（メタデータ） (2022-06-03T15:56:51Z)
Measuring Disparate Outcomes of Content Recommendation Algorithms with Distributional Inequality Metrics [5.74271110290378]
我々は,経済学,分布不平等指標,およびTwitterのアルゴリズム・タイムラインにおけるコンテンツ露出の差異を測定する能力から,一連の指標を評価した。これらのメトリクスを用いて、ユーザ間の歪んだ結果に強く寄与するコンテンツ提案アルゴリズムを特定できることを示す。
論文参考訳（メタデータ） (2022-02-03T14:41:39Z)
Contingency-Aware Influence Maximization: A Reinforcement Learning Approach [52.109536198330126]
インフルエンス(IM)問題は、インフルエンスの普及を最大化する、ソーシャルネットワーク内のシードノードのサブセットを見つけることを目的としている。本研究では、招待されたノードがシードであるかどうかが不確実なIM問題(contingency-aware IM)に焦点をあてる。最初の成功にもかかわらず、より多くのコミュニティへのソリューションの推進における大きな実践上の障害は、欲張りのアルゴリズムの巨大な実行時である。
論文参考訳（メタデータ） (2021-06-13T16:42:22Z)
Project and Forget: Solving Large-Scale Metric Constrained Problems [7.381113319198104]
データポイント間で異なる測定値のセットが与えられた場合、入力された測定値と最も「一致」したメトリック表現を決定することは、多くの機械学習アルゴリズムにおいて重要なステップである。既存の手法は、そのような問題に大量のメートル法制約があるため、特定の種類のメトリクスや小さな問題のサイズに制限される。本稿では,多くの(指数関数的に)不等式制約を持つ計量制約問題の解法として,ブレグマン射影を用いたプロジェクト・アンド・フォーゲット(Project and Forget)を提案する。
論文参考訳（メタデータ） (2020-05-08T04:50:54Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。