Fugu-MT 論文翻訳(概要): Performance is not enough: a story of the Rashomon's quartet

論文の概要: Performance is not enough: a story of the Rashomon's quartet

arxiv url: http://arxiv.org/abs/2302.13356v1
Date: Sun, 26 Feb 2023 17:22:40 GMT
ステータス: 翻訳完了
システム内更新日: 2023-02-28 17:35:50.046642
Title: Performance is not enough: a story of the Rashomon's quartet
Title（参考訳）: 演奏不足:羅生門四重奏の物語
Authors: Przemyslaw Biecek, Hubert Baniecki, Mateusz Krzyznski
Abstract要約: 本稿では,異なるクラスの4つのモデルがほぼ同一の予測性能を持つ合成データセットを提案する。この単純な図は、データサイエンティストが予測モデルをよりよく理解するために視覚化することを促すと信じています。
参考スコア（独自算出の注目度）: 7.812073412066698
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Predictive modelling is often reduced to finding a single best model that optimises a selected model quality criterion. But what if the second best model describes the data equally well but in a completely different way? What about the third best? Following the Anscombe's quartet point, in this paper, we present a synthetic dataset for which four models from different classes have practically identical predictive performance. But, visualisation of these models reveals that they describe this dataset in very different ways. We believe that this simple illustration will encourage data scientists to visualise predictive models in order to better understand them. Explanatory analysis of the set of equally good models can provide valuable information and we need to develop more techniques for this task.
Abstract（参考訳）: 予測モデルはしばしば、選択されたモデル品質基準を最適化する単一の最良のモデルを見つけるために還元される。しかし、もし第2の最良のモデルがデータを均等に表現するが、全く異なる方法で説明するとしたらどうだろう? 第3のベストは? 本稿では,アンスコムのカルテット・ポイントに従って,異なるクラスの4つのモデルがほぼ同一の予測性能を持つ合成データセットを提案する。しかし、これらのモデルの可視化は、このデータセットをまったく異なる方法で記述していることを明らかにする。この単純な図は、データサイエンティストが予測モデルをよりよく理解するために視覚化することを促すと信じています。等しく優れたモデルの集合の説明分析は貴重な情報を提供することができ、我々はこのタスクのためにより多くの技術を開発する必要がある。

関連論文リスト

Exploring Query Efficient Data Generation towards Data-free Model Stealing in Hard Label Setting [38.755154033324374]
データフリーモデルは、ターゲットモデルの構造、パラメータ、トレーニングデータにアクセスすることなく、ターゲットモデルの機能を代替モデルに複製する。本稿では Query Efficient Data Generation (textbfQEDG) と呼ばれる新しいデータフリーモデルステーリング手法を提案する。対象モデルの決定境界に密接に一様に整合する十分なサンプルの生成を保証するために、2つの異なる損失関数を導入する。
論文参考訳（メタデータ） (2024-12-18T03:03:15Z)
A Collaborative Ensemble Framework for CTR Prediction [73.59868761656317]
我々は、複数の異なるモデルを活用するための新しいフレームワーク、CETNet(Collaborative Ensemble Training Network)を提案する。ナイーブなモデルスケーリングとは違って,私たちのアプローチは,共同学習による多様性とコラボレーションを重視しています。当社のフレームワークは,Metaの3つのパブリックデータセットと大規模産業データセットに基づいて検証する。
論文参考訳（メタデータ） (2024-11-20T20:38:56Z)
Embedding-based statistical inference on generative models [10.948308354932639]
生成モデルの埋め込みに基づく表現に関する結果を、古典的な統計的推論設定に拡張する。類似」の概念の基盤として視点空間を用いることは、複数のモデルレベルの推論タスクに有効であることを示す。
論文参考訳（メタデータ） (2024-10-01T22:28:39Z)
Knowledge is a Region in Weight Space for Fine-tuned Language Models [48.589822853418404]
異なるモデルの重み空間と下層の損失景観が相互に相互に相互に相互に相互に相互に相互に関連しているかを検討する。同じデータセットで微調整された言語モデルが重み空間で厳密なクラスタを形成し、同じタスクから異なるデータセットで微調整されたモデルがより緩いクラスタを形成することを示す。
論文参考訳（メタデータ） (2023-02-09T18:59:18Z)
Investigating Ensemble Methods for Model Robustness Improvement of Text Classifiers [66.36045164286854]
既存のバイアス機能を分析し、すべてのケースに最適なモデルが存在しないことを実証します。適切なバイアスモデルを選択することで、より洗練されたモデル設計でベースラインよりもロバスト性が得られる。
論文参考訳（メタデータ） (2022-10-28T17:52:10Z)
Inter-model Interpretability: Self-supervised Models as a Case Study [0.2578242050187029]
テキスト・インター・モデル・インタプリタビリティを導入するためのDissectと呼ばれる最近の解釈可能性技術を構築した。我々は、学習概念の観点から、モデル間の近さを明らかにする学習概念埋め込み空間に、トップパフォーマンスの自己教師型モデル13を投影する。この実験により、モデルを3つのカテゴリに分類し、異なるタスクが必要とする視覚概念の種類を初めて明らかにしました。
論文参考訳（メタデータ） (2022-07-24T22:50:18Z)
Model Comparison in Approximate Bayesian Computation [0.456877715768796]
自然科学における一般的な問題は、観測されたデータに照らして競合するモデルの比較である。この枠組みは、実際に使用されるほとんどのモデルにとって難解な確率関数の計算に依存している。 ABCにおけるベイズモデルの比較を行うための新しい効率的な手法を提案する。
論文参考訳（メタデータ） (2022-03-15T10:24:16Z)
Combining Diverse Feature Priors [90.74601233745047]
多様な機能事前セットでトレーニングされたモデルには、重複する障害モードが少なくなることを示す。また、追加(ラベルなし)データでそのようなモデルを共同でトレーニングすることで、互いのミスを修正できることも示しています。
論文参考訳（メタデータ） (2021-10-15T17:31:10Z)
Comparing Test Sets with Item Response Theory [53.755064720563]
我々は,18の事前学習トランスフォーマーモデルから予測した29のデータセットを個別のテスト例で評価した。 Quoref、HellaSwag、MC-TACOは最先端のモデルを区別するのに最適である。また、QAMRやSQuAD2.0のようなQAデータセットに使用されるスパン選択タスク形式は、強いモデルと弱いモデルとの差別化に有効である。
論文参考訳（メタデータ） (2021-06-01T22:33:53Z)
What do we expect from Multiple-choice QA Systems? [70.86513724662302]
複数のMultiple Choice Question Answering(MCQA)データセット上で,トップパフォーマンスモデルを検討する。このようなモデルから得られる可能性のある一連の期待値に対して、モデル入力のゼロ情報摂動を用いて評価する。
論文参考訳（メタデータ） (2020-11-20T21:27:10Z)
Pattern Similarity-based Machine Learning Methods for Mid-term Load Forecasting: A Comparative Study [0.0]
パターン類似性に基づく年次電力需要予測手法について検討した。モデルの不可欠な部分は、時系列シーケンスのパターンを用いた時系列表現である。近接モデル,ファジィ近傍モデル,カーネル回帰モデル,一般回帰ニューラルネットワークの4つのモデルを考える。
論文参考訳（メタデータ） (2020-03-03T12:14:36Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。