Fugu-MT 論文翻訳(概要): Performance is not enough: the story told by a Rashomon quartet

論文の概要: Performance is not enough: the story told by a Rashomon quartet

arxiv url: http://arxiv.org/abs/2302.13356v4
Date: Thu, 11 Apr 2024 17:46:31 GMT
ステータス: 翻訳完了
システム内更新日: 2024-04-12 19:37:39.784867
Title: Performance is not enough: the story told by a Rashomon quartet
Title（参考訳）: パフォーマンスだけでは不十分:羅生門四重奏団が語る話
Authors: Przemyslaw Biecek, Hubert Baniecki, Mateusz Krzyzinski, Dianne Cook,
Abstract要約: 本稿では,ほぼ同一の予測性能を有する合成データセット上に構築された4つのモデルについて紹介する。視覚的な探索によって、データ内の関係に関する明確な説明が明らかになる。この図示的な例は、モデルビジュアライゼーションのためのメソッドを使用して、パフォーマンス以上の予測モデルを比較することを目的としています。
参考スコア（独自算出の注目度）: 7.9572053302356585
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The usual goal of supervised learning is to find the best model, the one that optimizes a particular performance measure. However, what if the explanation provided by this model is completely different from another model and different again from another model despite all having similarly good fit statistics? Is it possible that the equally effective models put the spotlight on different relationships in the data? Inspired by Anscombe's quartet, this paper introduces a Rashomon Quartet, i.e. a set of four models built on a synthetic dataset which have practically identical predictive performance. However, the visual exploration reveals distinct explanations of the relations in the data. This illustrative example aims to encourage the use of methods for model visualization to compare predictive models beyond their performance.
Abstract（参考訳）: 教師付き学習の通常の目的は、特定のパフォーマンス指標を最適化する最良のモデルを見つけることです。しかし、もしこのモデルが提供する説明が他のモデルと完全に異なり、同様に適合する統計を持つにもかかわらず、別のモデルと全く異なるとしたらどうだろう? 等しく効果的なモデルが、データ内の異なる関係にスポットライトを当てることが可能か? アンスコムの四重項にインスパイアされた本論文では、ラショモン四重項(Rashomon Quartet)、すなわち、ほぼ同一の予測性能を持つ合成データセット上に構築された4つのモデルについて紹介する。しかし、視覚的な探索によって、データ内の関係に関する明確な説明が明らかになる。この図示的な例は、モデルビジュアライゼーションのためのメソッドを使用して、パフォーマンス以上の予測モデルを比較することを目的としています。

関連論文リスト

Exploring Query Efficient Data Generation towards Data-free Model Stealing in Hard Label Setting [38.755154033324374]
データフリーモデルは、ターゲットモデルの構造、パラメータ、トレーニングデータにアクセスすることなく、ターゲットモデルの機能を代替モデルに複製する。本稿では Query Efficient Data Generation (textbfQEDG) と呼ばれる新しいデータフリーモデルステーリング手法を提案する。対象モデルの決定境界に密接に一様に整合する十分なサンプルの生成を保証するために、2つの異なる損失関数を導入する。
論文参考訳（メタデータ） (2024-12-18T03:03:15Z)
A Collaborative Ensemble Framework for CTR Prediction [73.59868761656317]
我々は、複数の異なるモデルを活用するための新しいフレームワーク、CETNet(Collaborative Ensemble Training Network)を提案する。ナイーブなモデルスケーリングとは違って,私たちのアプローチは,共同学習による多様性とコラボレーションを重視しています。当社のフレームワークは,Metaの3つのパブリックデータセットと大規模産業データセットに基づいて検証する。
論文参考訳（メタデータ） (2024-11-20T20:38:56Z)
Embedding-based statistical inference on generative models [10.948308354932639]
生成モデルの埋め込みに基づく表現に関する結果を、古典的な統計的推論設定に拡張する。類似」の概念の基盤として視点空間を用いることは、複数のモデルレベルの推論タスクに有効であることを示す。
論文参考訳（メタデータ） (2024-10-01T22:28:39Z)
Knowledge is a Region in Weight Space for Fine-tuned Language Models [48.589822853418404]
異なるモデルの重み空間と下層の損失景観が相互に相互に相互に相互に相互に相互に相互に関連しているかを検討する。同じデータセットで微調整された言語モデルが重み空間で厳密なクラスタを形成し、同じタスクから異なるデータセットで微調整されたモデルがより緩いクラスタを形成することを示す。
論文参考訳（メタデータ） (2023-02-09T18:59:18Z)
Investigating Ensemble Methods for Model Robustness Improvement of Text Classifiers [66.36045164286854]
既存のバイアス機能を分析し、すべてのケースに最適なモデルが存在しないことを実証します。適切なバイアスモデルを選択することで、より洗練されたモデル設計でベースラインよりもロバスト性が得られる。
論文参考訳（メタデータ） (2022-10-28T17:52:10Z)
Inter-model Interpretability: Self-supervised Models as a Case Study [0.2578242050187029]
テキスト・インター・モデル・インタプリタビリティを導入するためのDissectと呼ばれる最近の解釈可能性技術を構築した。我々は、学習概念の観点から、モデル間の近さを明らかにする学習概念埋め込み空間に、トップパフォーマンスの自己教師型モデル13を投影する。この実験により、モデルを3つのカテゴリに分類し、異なるタスクが必要とする視覚概念の種類を初めて明らかにしました。
論文参考訳（メタデータ） (2022-07-24T22:50:18Z)
Model Comparison in Approximate Bayesian Computation [0.456877715768796]
自然科学における一般的な問題は、観測されたデータに照らして競合するモデルの比較である。この枠組みは、実際に使用されるほとんどのモデルにとって難解な確率関数の計算に依存している。 ABCにおけるベイズモデルの比較を行うための新しい効率的な手法を提案する。
論文参考訳（メタデータ） (2022-03-15T10:24:16Z)
Combining Diverse Feature Priors [90.74601233745047]
多様な機能事前セットでトレーニングされたモデルには、重複する障害モードが少なくなることを示す。また、追加(ラベルなし)データでそのようなモデルを共同でトレーニングすることで、互いのミスを修正できることも示しています。
論文参考訳（メタデータ） (2021-10-15T17:31:10Z)
Comparing Test Sets with Item Response Theory [53.755064720563]
我々は,18の事前学習トランスフォーマーモデルから予測した29のデータセットを個別のテスト例で評価した。 Quoref、HellaSwag、MC-TACOは最先端のモデルを区別するのに最適である。また、QAMRやSQuAD2.0のようなQAデータセットに使用されるスパン選択タスク形式は、強いモデルと弱いモデルとの差別化に有効である。
論文参考訳（メタデータ） (2021-06-01T22:33:53Z)
What do we expect from Multiple-choice QA Systems? [70.86513724662302]
複数のMultiple Choice Question Answering(MCQA)データセット上で,トップパフォーマンスモデルを検討する。このようなモデルから得られる可能性のある一連の期待値に対して、モデル入力のゼロ情報摂動を用いて評価する。
論文参考訳（メタデータ） (2020-11-20T21:27:10Z)
Pattern Similarity-based Machine Learning Methods for Mid-term Load Forecasting: A Comparative Study [0.0]
パターン類似性に基づく年次電力需要予測手法について検討した。モデルの不可欠な部分は、時系列シーケンスのパターンを用いた時系列表現である。近接モデル,ファジィ近傍モデル,カーネル回帰モデル,一般回帰ニューラルネットワークの4つのモデルを考える。
論文参考訳（メタデータ） (2020-03-03T12:14:36Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。