論文の概要: deep-significance - Easy and Meaningful Statistical Significance Testing
in the Age of Neural Networks
- arxiv url: http://arxiv.org/abs/2204.06815v1
- Date: Thu, 14 Apr 2022 08:24:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-15 23:03:53.248289
- Title: deep-significance - Easy and Meaningful Statistical Significance Testing
in the Age of Neural Networks
- Title(参考訳): deep-significance - ニューラルネットワーク時代における容易で有意義な統計的意義テスト
- Authors: Dennis Ulmer, Christian Hardmeier, Jes Frellsen
- Abstract要約: 異なる重要なテストとユーティリティ機能を含む使い易いパッケージを提供する。
このパッケージは研究ニーズとユーザビリティに特化している。
- 参考スコア(独自算出の注目度): 7.3372471678239215
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A lot of Machine Learning (ML) and Deep Learning (DL) research is of an
empirical nature. Nevertheless, statistical significance testing (SST) is still
not widely used. This endangers true progress, as seeming improvements over a
baseline might be statistical flukes, leading follow-up research astray while
wasting human and computational resources. Here, we provide an easy-to-use
package containing different significance tests and utility functions
specifically tailored towards research needs and usability.
- Abstract(参考訳): 機械学習(ML)とディープラーニング(DL)の研究の多くは、実証的な性質を持っています。
しかし、統計的意義試験(SST)はいまだに広く使われていない。
このことは、ベースラインに対する改善が統計的分岐であるように見えるため、人や計算資源を浪費しながら、追跡研究の混乱を招いている。
ここでは,研究ニーズとユーザビリティに特化した,さまざまな重要度テストとユーティリティ機能を含む,使いやすいパッケージを提供する。
関連論文リスト
- MLXP: A framework for conducting replicable Machine Learning eXperiments
in Python [71.22547130430371]
MLXPはPythonをベースとした,オープンソースの,シンプルで,軽量な実験管理ツールである。
実験プロセスを最小限のオーバーヘッドで合理化し、高いレベルの実践的オーバーヘッドを確保します。
論文 参考訳(メタデータ) (2024-02-21T14:22:20Z) - Pareto Frontiers in Neural Feature Learning: Data, Compute, Width, and
Luck [35.6883212537938]
オフラインスパースパリティ学習は,多層パーセプトロンの勾配に基づくトレーニングにおいて,統計的クエリの下限を許容する教師付き分類問題である。
理論上, 実験上, 疎初期化とネットワーク幅の増大がサンプル効率を著しく向上させることを示す。
また,合成スパースパリティタスクは,軸方向の特徴学習を必要とする現実的な問題のプロキシとして有用であることを示す。
論文 参考訳(メタデータ) (2023-09-07T15:52:48Z) - Hypothesis Transfer Learning with Surrogate Classification Losses:
Generalization Bounds through Algorithmic Stability [3.908842679355255]
仮説伝達学習(HTL)は、以前のタスクレバレッジを新たなターゲットにすることで、ドメイン適応と対比する。
本稿では,機械学習アルゴリズム解析のための魅力的な理論フレームワークであるアルゴリズム安定性によるHTLの学習理論について検討する。
論文 参考訳(メタデータ) (2023-05-31T09:38:21Z) - A Sieve Quasi-likelihood Ratio Test for Neural Networks with
Applications to Genetic Association Studies [0.32771631221674324]
そこで本研究では,NNを用いた疑似シーブ様比検定を行い,複雑な関連性をテストするための隠蔽層を1つ提案する。
分布の妥当性をシミュレーションにより検討した。
アルツハイマー病神経画像イニシアチブ(ADNI)のシークエンシングデータの遺伝的アソシエーション解析により,提案試験の有用性を実証する。
論文 参考訳(メタデータ) (2022-12-16T02:54:46Z) - Sample-Efficient Reinforcement Learning in the Presence of Exogenous
Information [77.19830787312743]
実世界の強化学習アプリケーションでは、学習者の観察空間は、その課題に関する関連情報と無関係情報の両方でユビキタスに高次元である。
本稿では,強化学習のための新しい問題設定法であるExogenous Decision Process (ExoMDP)を導入する。
内因性成分の大きさのサンプル複雑度で準最適ポリシーを学習するアルゴリズムであるExoRLを提案する。
論文 参考訳(メタデータ) (2022-06-09T05:19:32Z) - Do Deep Neural Networks Always Perform Better When Eating More Data? [82.6459747000664]
Identically Independent Distribution(IID)とOut of Distribution(OOD)による実験を設計する。
IID条件下では、情報の量は各サンプルの効果度、サンプルの寄与度、クラス間の差がクラス情報の量を決定する。
OOD条件下では、試料のクロスドメイン度が寄与を決定づけ、無関係元素によるバイアス適合はクロスドメインの重要な要素である。
論文 参考訳(メタデータ) (2022-05-30T15:40:33Z) - Simple Techniques Work Surprisingly Well for Neural Network Test
Prioritization and Active Learning (Replicability Study) [4.987581730476023]
ディープニューラルネットワーク(DNN)のTIP(Test Input Prioritizers)は、一般的に非常に大規模なテストデータセットを効率的に処理するための重要なテクニックである。
Fengらは、非常に高速でシンプルなTIPであるDeepGiniを提案し、ニューロンやサプライズカバレッジのようなより精巧な技術よりも優れていることを示した。
論文 参考訳(メタデータ) (2022-05-02T05:47:34Z) - What Makes Good Contrastive Learning on Small-Scale Wearable-based
Tasks? [59.51457877578138]
本研究では,ウェアラブル型行動認識タスクにおけるコントラスト学習について検討する。
本稿では,PyTorchライブラリのtextttCL-HAR について述べる。
論文 参考訳(メタデータ) (2022-02-12T06:10:15Z) - Deep neural networks approach to microbial colony detection -- a
comparative analysis [52.77024349608834]
本稿では,AGARデータセットを用いた3つの深層学習手法の性能について検討する。
得られた結果は将来の実験のベンチマークとして機能するかもしれない。
論文 参考訳(メタデータ) (2021-08-23T12:06:00Z) - ALT-MAS: A Data-Efficient Framework for Active Testing of Machine
Learning Algorithms [58.684954492439424]
少量のラベル付きテストデータのみを用いて機械学習モデルを効率的にテストする新しいフレームワークを提案する。
ベイズニューラルネットワーク(bnn)を用いたモデルアンダーテストの関心指標の推定が目的である。
論文 参考訳(メタデータ) (2021-04-11T12:14:04Z) - Targeting Learning: Robust Statistics for Reproducible Research [1.1455937444848387]
ターゲティング・ラーニング(Targeted Learning)は、因果推論、機械学習、統計理論の進歩を統一して、科学的に影響のある質問に統計的信頼性で答えるのに役立つ統計分野である。
ターゲット学習のロードマップは、仮説を最小化し、利用可能な科学的知識にのみ注意深く根ざすように、統計的手続きを調整することを強調する。
論文 参考訳(メタデータ) (2020-06-12T17:17:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。