論文の概要: New bootstrap tests for categorical time series. A comparative study
- arxiv url: http://arxiv.org/abs/2305.00465v1
- Date: Sun, 30 Apr 2023 12:35:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-02 15:07:02.900772
- Title: New bootstrap tests for categorical time series. A comparative study
- Title(参考訳): カテゴリー時系列の新しいブートストラップテスト。
比較研究
- Authors: \'Angel L\'opez-Oriona, Jos\'e Antonio Vilar Fern\'andez and Pierpaolo
D'Urso
- Abstract要約: 分類過程間の相似性尺度に依存する3つの試験を提案する。
差分分布と両プロセスのシリアル依存パターンの相違を評価できる3つの特定の距離を考慮し,実験を行った。
生物学的配列を含む応用は、提案手法の有用性を強調している。
- 参考スコア(独自算出の注目度): 4.869045108760265
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The problem of testing the equality of the generating processes of two
categorical time series is addressed in this work. To this aim, we propose
three tests relying on a dissimilarity measure between categorical processes.
Particular versions of these tests are constructed by considering three
specific distances evaluating discrepancy between the marginal distributions
and the serial dependence patterns of both processes. Proper estimates of these
dissimilarities are an essential element of the constructed tests, which are
based on the bootstrap. Specifically, a parametric bootstrap method assuming
the true generating models and extensions of the moving blocks bootstrap and
the stationary bootstrap are considered. The approaches are assessed in a broad
simulation study including several types of categorical models with different
degrees of complexity. Advantages and disadvantages of each one of the methods
are properly discussed according to their behavior under the null and the
alternative hypothesis. The impact that some important input parameters have on
the results of the tests is also analyzed. An application involving biological
sequences highlights the usefulness of the proposed techniques.
- Abstract(参考訳): 2つのカテゴリの時系列の生成過程の等式をテストする問題は、本研究で取り組まれている。
この目的のために,分類過程間の相似性尺度に依存する3つのテストを提案する。
両プロセスの差分分布と直列依存パターンの相違を3つの特定の距離で評価することにより,これらの試験の特定のバージョンを構築した。
これらの相違点の適切な推定は、ブートストラップに基づいて構築されたテストの重要な要素である。
具体的には、真の生成モデルと移動ブロックブートストラップと静止ブートストラップの拡張を想定したパラメトリックブートストラップ法を考える。
これらのアプローチは、様々な複雑さのカテゴリーモデルを含む広範なシミュレーション研究で評価される。
それぞれの手法の利点と欠点は、ヌルと代替仮説の下での振る舞いに応じて適切に議論される。
重要な入力パラメータがテストの結果に与える影響も分析される。
生物配列を含む応用は,提案手法の有用性を浮き彫りにする。
関連論文リスト
- A Generic Method for Fine-grained Category Discovery in Natural Language Texts [38.297873969795546]
そこで本研究では,新たな目的関数によって導かれる意味的類似テキストの微細なクラスタをうまく検出する手法を提案する。
この方法は対数空間における意味的類似性を利用してユークリッド空間のサンプル分布を導く。
また,リアルタイムアプリケーションをサポートするセントロイド推論機構を提案する。
論文 参考訳(メタデータ) (2024-06-18T23:27:46Z) - Deep anytime-valid hypothesis testing [29.273915933729057]
非パラメトリックなテスト問題に対する強力なシーケンシャルな仮説テストを構築するための一般的なフレームワークを提案する。
テスト・バイ・ベッティング・フレームワーク内で、機械学習モデルの表現能力を活用するための原則的なアプローチを開発する。
合成および実世界のデータセットに関する実証的な結果は、我々の一般的なフレームワークを用いてインスタンス化されたテストが、特殊なベースラインと競合することを示している。
論文 参考訳(メタデータ) (2023-10-30T09:46:19Z) - A framework for paired-sample hypothesis testing for high-dimensional
data [7.400168551191579]
我々は、各一対のインスタンスを接続するラインセグメントの双分割超平面によって定義される決定規則によって、スコアリング関数が生成できるという考えを提唱した。
まず、各一対の双分極超平面とホッジス・リーマン推定器から導出される集約規則を推定する。
論文 参考訳(メタデータ) (2023-09-28T09:17:11Z) - Bootstrapped Edge Count Tests for Nonparametric Two-Sample Inference
Under Heterogeneity [5.8010446129208155]
両試料間の差異を正確に検出する新しい非パラメトリック試験法を開発した。
オンラインゲームにおけるユーザ行動検出のための総合シミュレーション研究と応用により,提案試験の非漸近性能が向上したことを示す。
論文 参考訳(メタデータ) (2023-04-26T22:25:44Z) - Parametric Classification for Generalized Category Discovery: A Baseline
Study [70.73212959385387]
Generalized Category Discovery (GCD)は、ラベル付きサンプルから学習した知識を用いて、ラベルなしデータセットで新しいカテゴリを発見することを目的としている。
パラメトリック分類器の故障を調査し,高品質な監視が可能であった場合の過去の設計選択の有効性を検証し,信頼性の低い疑似ラベルを重要課題として同定する。
エントロピー正規化の利点を生かし、複数のGCDベンチマークにおける最先端性能を実現し、未知のクラス数に対して強いロバスト性を示す、単純で効果的なパラメトリック分類法を提案する。
論文 参考訳(メタデータ) (2022-11-21T18:47:11Z) - A Multiple kernel testing procedure for non-proportional hazards in
factorial designs [4.358626952482687]
本稿では,複数の因子が同時に興味を持つ場合の生存率を推定するマルチカーネルテスト手法を提案する。
我々の手法は複雑なデータを扱うことができ、比例性のような仮定を正当化できない場合、全正規の Cox モデルに代わるものとして見ることができる。
論文 参考訳(メタデータ) (2022-06-15T01:53:49Z) - Nonparametric Conditional Local Independence Testing [69.31200003384122]
条件付き局所独立は、連続的な時間プロセス間の独立関係である。
条件付き地域独立の非パラメトリックテストは行われていない。
二重機械学習に基づく非パラメトリックテストを提案する。
論文 参考訳(メタデータ) (2022-03-25T10:31:02Z) - Cluster-and-Conquer: A Framework For Time-Series Forecasting [94.63501563413725]
本稿では,高次元時系列データを予測するための3段階フレームワークを提案する。
当社のフレームワークは非常に汎用的で,各ステップで時系列予測やクラスタリングが利用可能です。
単純な線形自己回帰モデルでインスタンス化されると、いくつかのベンチマークデータセットで最先端の結果が得られる。
論文 参考訳(メタデータ) (2021-10-26T20:41:19Z) - A Statistical Analysis of Summarization Evaluation Metrics using
Resampling Methods [60.04142561088524]
信頼区間は比較的広く,信頼性の高い自動測定値の信頼性に高い不確実性を示す。
多くのメトリクスはROUGEよりも統計的改善を示していないが、QAEvalとBERTScoreという2つの最近の研究は、いくつかの評価設定で行われている。
論文 参考訳(メタデータ) (2021-03-31T18:28:14Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z) - Marginal likelihood computation for model selection and hypothesis
testing: an extensive review [66.37504201165159]
この記事では、このトピックの最先端に関する総合的な研究について紹介する。
さまざまなテクニックの制限、メリット、コネクション、差異を強調します。
また、不適切な事前利用の問題や解決法についても述べる。
論文 参考訳(メタデータ) (2020-05-17T18:31:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。