論文の概要: Independence Tests Without Ground Truth for Noisy Learners
- arxiv url: http://arxiv.org/abs/2010.15662v1
- Date: Wed, 28 Oct 2020 13:03:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-02 04:52:59.197212
- Title: Independence Tests Without Ground Truth for Noisy Learners
- Title(参考訳): 騒々しい学習者のための根拠のない独立テスト
- Authors: Andr\'es Corrada-Emmanuel, Edward Pantridge, Eddie Zahrebelski, Aditya
Chaganti, Simeon Simeonov
- Abstract要約: 独立二項分類器の正確な解について論じる。
その実用性はその唯一の前提によって妨げられている。
スカラー回帰器の基底真理不変系の同様の予想は解ける。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Exact ground truth invariant polynomial systems can be written for
arbitrarily correlated binary classifiers. Their solutions give estimates for
sample statistics that require knowledge of the ground truth of the correct
labels in the sample. Of these polynomial systems, only a few have been solved
in closed form. Here we discuss the exact solution for independent binary
classifiers - resolving an outstanding problem that has been presented at this
conference and others. Its practical applicability is hampered by its sole
remaining assumption - the classifiers need to be independent in their sample
errors. We discuss how to use the closed form solution to create a
self-consistent test that can validate the independence assumption itself
absent the correct labels ground truth. It can be cast as an algebraic geometry
conjecture for binary classifiers that remains unsolved. A similar conjecture
for the ground truth invariant algebraic system for scalar regressors is
solvable, and we present the solution here. We also discuss experiments on the
Penn ML Benchmark classification tasks that provide further evidence that the
conjecture may be true for the polynomial system of binary classifiers.
- Abstract(参考訳): 完全基底真理不変多項式系は任意に関連付けられた二項分類器に対して書ける。
それらの解は、サンプル内の正しいラベルの基底真理の知識を必要とするサンプル統計に対して推定を与える。
これらの多項式系のうち、閉形式で解かれたものはわずかである。
ここでは,独立バイナリ分類器の厳密な解決法について論じる。
その実用性は、唯一の仮定によって妨げられ、分類器はそのサンプルエラーに独立していなければならない。
我々は,閉じた形状の解を用いて,独立性の仮定自体が正しいラベルの根拠の真理を欠いていることを検証できる自己整合性テストを作成する方法について論じる。
それは未解決のバイナリ分類子に対する代数的幾何予想としてキャストできる。
基底真理不変代数系のスカラー回帰器に対する同様の予想は解決可能であり、ここでは解を提示する。
また、Penn ML Benchmark分類タスクに関する実験を議論し、この予想が二項分類器の多項式系に対して真であることを示す。
関連論文リスト
- Bisimulation Learning [55.859538562698496]
我々は、大きな、潜在的に無限の状態空間を持つ状態遷移系の有限バイシミュレートを計算する。
提案手法は,実際に行われている他の最先端ツールよりも高速な検証結果が得られる。
論文 参考訳(メタデータ) (2024-05-24T17:11:27Z) - When Noisy Labels Meet Long Tail Dilemmas: A Representation Calibration
Method [40.25499257944916]
実世界のデータセットは騒々しくラベル付けされ、クラス不均衡である。
本稿では,表現キャリブレーション手法RCALを提案する。
我々は,表現キャリブレーションの有効性を論じるために理論的結果を得る。
論文 参考訳(メタデータ) (2022-11-20T11:36:48Z) - Testing Independence of Exchangeable Random Variables [19.973896010415977]
十分なシャッフルデータがあれば、データ項目が統計的に(非)依存しているかどうかを判断できますか?
これは可能であることを示し、データが独立で同一に分散されているというヌル仮説を確実に拒否できるテストを開発する。
潜在的なアプリケーションはDeep Learningで、データはしばしばインターネット全体から取り除かれ、重複は多い。
論文 参考訳(メタデータ) (2022-10-22T08:55:48Z) - Nonparametric Conditional Local Independence Testing [69.31200003384122]
条件付き局所独立は、連続的な時間プロセス間の独立関係である。
条件付き地域独立の非パラメトリックテストは行われていない。
二重機械学習に基づく非パラメトリックテストを提案する。
論文 参考訳(メタデータ) (2022-03-25T10:31:02Z) - Measuring dissimilarity with diffeomorphism invariance [94.02751799024684]
DID(DID)は、幅広いデータ空間に適用可能なペアワイズな相似性尺度である。
我々は、DIDが理論的研究と実用に関係のある特性を享受していることを証明する。
論文 参考訳(メタデータ) (2022-02-11T13:51:30Z) - Test Set Sizing Via Random Matrix Theory [91.3755431537592]
本稿ではランダム行列理論の手法を用いて、単純な線形回帰に対して理想的なトレーニング-テストデータ分割を求める。
それは「理想」を整合性計量を満たすものとして定義し、すなわち経験的モデル誤差は実際の測定ノイズである。
本論文は,任意のモデルのトレーニングとテストサイズを,真に最適な方法で解決した最初の論文である。
論文 参考訳(メタデータ) (2021-12-11T13:18:33Z) - Deterministic Certification to Adversarial Attacks via Bernstein
Polynomial Approximation [5.392822954974537]
ランダム化された平滑化は、高い確率で$ell$標準敵攻撃に対する最先端の証明可能な堅牢性を確立している。
自然の精度を維持しながらランダム化せずにスムーズな分類器を構築することは可能か?
本手法は,決定境界平滑化のための決定論的アルゴリズムを提供する。
また、非線形方程式系の数値解を通したノルム非独立性証明ロバストネスの特異なアプローチも導入する。
論文 参考訳(メタデータ) (2020-11-28T08:27:42Z) - Tractable Inference in Credal Sentential Decision Diagrams [116.6516175350871]
確率感性決定図は、解離ゲートの入力が確率値によってアノテートされる論理回路である。
我々は、局所確率を質量関数のクレーダル集合に置き換えることができる確率の一般化である、クレーダル感性決定図を開発する。
まず,ノイズの多い7セグメント表示画像に基づく簡単なアプリケーションについて検討する。
論文 参考訳(メタデータ) (2020-08-19T16:04:34Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z) - Algebraic Ground Truth Inference: Non-Parametric Estimation of Sample
Errors by AI Algorithms [0.0]
非パラメトリックなパフォーマンス推定器は、自律的な設定において魅力的なソリューションである。
基礎的真理を持つ実験における精度推定器は100分の1よりも優れていることを示す。
本手法の実用性は,オンライン広告キャンペーンによる実世界のデータセットと,一般的な分類ベンチマークのサンプルに示される。
論文 参考訳(メタデータ) (2020-06-15T12:04:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。