Fugu-MT 論文翻訳(概要): AutoML Two-Sample Test

論文の概要: AutoML Two-Sample Test

arxiv url: http://arxiv.org/abs/2206.08843v1
Date: Fri, 17 Jun 2022 15:41:07 GMT
ステータス: 翻訳完了
システム内更新日: 2022-06-20 12:53:43.502343
Title: AutoML Two-Sample Test
Title（参考訳）: AutoMLの2サンプルテスト
Authors: Jonas M. K\"ubler, Vincent Stimper, Simon Buchholz, Krikamol Muandet, Bernhard Sch\"olkopf
Abstract要約: 我々は、目撃者の関数の平均的な相違をテスト統計として捉えた単純なテストを使用し、二乗損失を最小限にすれば、最適なテスト能力を持つ目撃者につながることを証明します。我々はPythonパッケージAutotstでAutoMLの2サンプルテストの実装を提供する。
参考スコア（独自算出の注目度）: 13.468660785510945
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Two-sample tests are important in statistics and machine learning, both as tools for scientific discovery as well as to detect distribution shifts. This led to the development of many sophisticated test procedures going beyond the standard supervised learning frameworks, whose usage can require specialized knowledge about two-sample testing. We use a simple test that takes the mean discrepancy of a witness function as the test statistic and prove that minimizing a squared loss leads to a witness with optimal testing power. This allows us to leverage recent advancements in AutoML. Without any user input about the problems at hand, and using the same method for all our experiments, our AutoML two-sample test achieves competitive performance on a diverse distribution shift benchmark as well as on challenging two-sample testing problems. We provide an implementation of the AutoML two-sample test in the Python package autotst.
Abstract（参考訳）: 2サンプルテストは統計学と機械学習において重要であり、科学的発見と分布シフトの検出のためのツールである。これにより、2サンプルテストに関する専門知識を必要とする標準的な教師付き学習フレームワークを超えて、多くの高度なテスト手順の開発につながった。単純なテストでは、証人関数の平均的不一致をテスト統計として捉え、二乗損失を最小化することで、最適なテスト能力を持つ証人を導くことを証明します。これにより、AutoMLの最近の進歩を活用することができます。ユーザの手元にある問題に対する入力が無く、同じ手法をすべての実験に使わずに、AutoMLの2サンプルテストは、多様な分散シフトベンチマーク上での競合性能と、2サンプルテストの問題に挑戦する。我々はPythonパッケージAutotstでAutoMLの2サンプルテストの実装を提供する。

関連論文リスト

Can We Classify Flaky Tests Using Only Test Code? An LLM-Based Empirical Study [40.93176986225226]
不安定なテストは、同じコード修正で繰り返し実行されるとき、一貫性のない結果をもたらす。以前の研究は、テストコードの識別子に基づいて不安定なテストを分類するために、機械学習モデルを訓練するアプローチを評価した。
論文参考訳（メタデータ） (2026-02-05T09:15:09Z)
Coverage Isn't Enough: SBFL-Driven Insights into Manually Created vs. Automatically Generated Tests [0.49416305961918044]
本研究では、自動生成テストのSBFLスコアとコードカバレッジを、手動で作成したテストと比較する。自動生成テストは手作業で作成したテストよりも高いブランチカバレッジを実現するが,SBFLスコアは低い。
論文参考訳（メタデータ） (2025-12-12T02:07:31Z)
Advanced Tutorial: Label-Efficient Two-Sample Tests [15.574402626262053]
このチュートリアルでは、アナリストが2つのサンプルから多くの機能を持つコンテキストにおける2サンプルテストについて説明する。機械学習では、アクティブラーニングにおいて同様のシナリオが研究されている。このチュートリアルは、アクティブな学習概念を、このテキスト版コスト設定内での2サンプルテストに拡張する。
論文参考訳（メタデータ） (2025-01-07T06:43:18Z)
Revisit Non-parametric Two-sample Testing as a Semi-supervised Learning Problem [37.55998723110691]
非教師付き2サンプルテストのためのSSLベースのTwoSample Test(SSL-C2ST)フレームワークを紹介する。広範な実験と理論解析により、SSL-C2STはラベルのないデータを効果的に活用することで従来のC2STより優れていることが示された。
論文参考訳（メタデータ） (2024-11-30T23:23:52Z)
Context-Aware Testing: A New Paradigm for Model Testing with Large Language Models [49.06068319380296]
我々は,コンテキストを帰納バイアスとして用いて意味のあるモデル障害を探索するコンテキスト認識テスト(CAT)を導入する。最初のCATシステムSMART Testingをインスタンス化し、大きな言語モデルを用いて、関連性があり、起こりうる失敗を仮説化します。
論文参考訳（メタデータ） (2024-10-31T15:06:16Z)
Model Equality Testing: Which Model Is This API Serving? [59.005869726179455]
2サンプルテスト問題であるモデル品質テストのような歪みの検出を形式化する。単純な文字列カーネル上に構築されたテストは、歪みの範囲に対して77.4%の中央値を達成する。次に、このテストを4つのLlamaモデルの商用推論APIに適用し、31のエンドポイントのうち11がMetaがリリースしたリファレンスウェイトとは異なる分布を提供することがわかった。
論文参考訳（メタデータ） (2024-10-26T18:34:53Z)
STAMP: Outlier-Aware Test-Time Adaptation with Stable Memory Replay [76.06127233986663]
テスト時間適応(TTA)は、トレーニングデータとテストデータの間の分散シフトに、未ラベルのデータのみを用いて対処することを目的としている。本稿では,サンプル認識とオフリエ拒絶の両方を行う問題に注意を払っている。本稿では,STAble Memory rePlay (STAMP) と呼ばれる新しい手法を提案する。
論文参考訳（メタデータ） (2024-07-22T16:25:41Z)
Deep anytime-valid hypothesis testing [29.273915933729057]
非パラメトリックなテスト問題に対する強力なシーケンシャルな仮説テストを構築するための一般的なフレームワークを提案する。テスト・バイ・ベッティング・フレームワーク内で、機械学習モデルの表現能力を活用するための原則的なアプローチを開発する。合成および実世界のデータセットに関する実証的な結果は、我々の一般的なフレームワークを用いてインスタンス化されたテストが、特殊なベースラインと競合することを示している。
論文参考訳（メタデータ） (2023-10-30T09:46:19Z)
Active Sequential Two-Sample Testing [18.99517340397671]
サンプル測定が安価に利用できる新しいシナリオでは,この2サンプルテストの問題を考慮する。我々は,emphactiveNIST-sampleテストフレームワークを考案し,逐次クエリだけでなく,emphactivelyクエリも考案した。実際に、我々はフレームワークのインスタンス化を導入し、いくつかの実験を用いて評価する。
論文参考訳（メタデータ） (2023-01-30T02:23:49Z)
E-Valuating Classifier Two-Sample Tests [11.248868528186332]
我々のテストは、既存の作業量分割確率比テストと予測独立性テストのアイデアを組み合わせたものです。得られたE値は、逐次2サンプルテストに適している。
論文参考訳（メタデータ） (2022-10-24T08:18:36Z)
Model-Free Sequential Testing for Conditional Independence via Testing by Betting [8.293345261434943]
提案されたテストでは、任意の依存関係構造を持つ入ってくるi.d.データストリームを分析できる。重要な結果が検出されれば,オンライン上でのデータポイントの処理を可能とし,データ取得を停止する。
論文参考訳（メタデータ） (2022-10-01T20:05:33Z)
Test-Time Training with Masked Autoencoders [54.983147122777574]
テストタイムトレーニングは、セルフスーパービジョンを使用して各テスト入力のモデルを最適化することで、新しいテスト分布をオンザフライに適用する。本稿では,この一サンプル学習問題に対してマスク付きオートエンコーダを用いる。
論文参考訳（メタデータ） (2022-09-15T17:59:34Z)
TTAPS: Test-Time Adaption by Aligning Prototypes using Self-Supervision [70.05605071885914]
本研究では,単体テストサンプルに適用可能な自己教師付きトレーニングアルゴリズムSwaVの新たな改良を提案する。ベンチマークデータセットCIFAR10-Cにおいて,本手法の有効性を示す。
論文参考訳（メタデータ） (2022-05-18T05:43:06Z)
Test-Agnostic Long-Tailed Recognition by Test-Time Aggregating Diverse Experts with Self-Supervision [85.07855130048951]
本研究では,テスト非依存型ロングテール認識(test-agnostic long-tailed recognition)と呼ばれる,より実践的なタスク設定について検討する。本稿では,多種多様な専門家に異なるテスト分布を扱うように訓練するTADE(Test-time Aggregating Diverse Experts)と呼ばれる新しい手法を提案する。理論的には,提案手法は未知のテストクラス分布をシミュレートできることを示す。
論文参考訳（メタデータ） (2021-07-20T04:10:31Z)
TestRank: Bringing Order into Unlabeled Test Instances for Deep Learning Tasks [14.547623982073475]
ディープラーニングシステムはテストやデバッグが難しいことで有名です。テストコスト削減のために、テスト選択を行い、選択した“高品質”バグ修正テストインプットのみをラベル付けすることが不可欠である。本稿では,未ラベルのテストインスタンスに,バグ検出機能,すなわちTestRankに従って順序を付ける新しいテスト優先順位付け手法を提案する。
論文参考訳（メタデータ） (2021-05-21T03:41:10Z)
Two-Sample Testing on Ranked Preference Data and the Role of Modeling Assumptions [57.77347280992548]
本稿では,ペアワイズ比較データとランキングデータのための2サンプル試験を設計する。私たちのテストでは、基本的に分布に関する仮定は必要ありません。実世界のペアワイズ比較データに2サンプルテストを適用することで、人によって提供される評価とランキングは、実際は異なる分散である、と結論付ける。
論文参考訳（メタデータ） (2020-06-21T20:51:09Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。