論文の概要: Two-sample test based on Self-Organizing Maps
- arxiv url: http://arxiv.org/abs/2212.08960v1
- Date: Sat, 17 Dec 2022 21:35:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-20 14:32:49.440582
- Title: Two-sample test based on Self-Organizing Maps
- Title(参考訳): 自己組織化マップに基づく2サンプルテスト
- Authors: Alejandro \'Alvarez-Ayll\'on, Manuel Palomo-Duarte, Juan-Manuel Dodero
- Abstract要約: 機械学習分類器は2サンプル統計テストとして利用することができる。
自己組織化マップは、当初データ視覚化ツールとして考案された次元削減である。
しかし、本来の目的は視覚化であるため、洞察を与えることもできる。
- 参考スコア(独自算出の注目度): 68.8204255655161
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Machine-learning classifiers can be leveraged as a two-sample statistical
test. Suppose each sample is assigned a different label and that a classifier
can obtain a better-than-chance result discriminating them. In this case, we
can infer that both samples originate from different populations. However, many
types of models, such as neural networks, behave as a black-box for the user:
they can reject that both samples originate from the same population, but they
do not offer insight into how both samples differ. Self-Organizing Maps are a
dimensionality reduction initially devised as a data visualization tool that
displays emergent properties, being also useful for classification tasks. Since
they can be used as classifiers, they can be used also as a two-sample
statistical test. But since their original purpose is visualization, they can
also offer insights.
- Abstract(参考訳): 機械学習分類器は2サンプル統計テストとして利用することができる。
各サンプルが異なるラベルに割り当てられ、分類器がそれらを識別するより優れた結果を得ることができると仮定する。
この場合、両方のサンプルは異なる集団に由来すると推測できる。
しかし、ニューラルネットワークのような多くのタイプのモデルは、ユーザにとってブラックボックスとして振る舞う: 両方のサンプルが同じ集団に由来することを拒否できるが、両方のサンプルがどう異なるかについての洞察を与えない。
自己組織化マップは、当初は創発的特性を表示するデータ可視化ツールとして考案された次元縮小であり、分類タスクにも有用である。
これらは分類器として使用できるので、2つのサンプル統計テストとしても使用できる。
しかし、本来の目的は視覚化であるため、洞察を与えることもできる。
関連論文リスト
- Sample-Specific Debiasing for Better Image-Text Models [6.301766237907306]
画像テキストデータに基づく自己教師付き表現学習は、画像分類、視覚的接地、相互モーダル検索などの重要な医学的応用を促進する。
1つの一般的なアプローチは、意味論的に類似した(肯定的な)および異種(否定的な)データポイントの対を対比することである。
トレーニングデータセットから一様に負のサンプルを描画すると、偽の負、すなわち、異種として扱われるが同一のクラスに属するサンプルが導入される。
医療データでは、基礎となるクラス分布は不均一であり、偽陰性は高い変動率で起こることを意味する。
論文 参考訳(メタデータ) (2023-04-25T22:23:41Z) - Active Sequential Two-Sample Testing [18.99517340397671]
サンプル測定が安価に利用できる新しいシナリオでは,この2サンプルテストの問題を考慮する。
我々は,emphactiveNIST-sampleテストフレームワークを考案し,逐次クエリだけでなく,emphactivelyクエリも考案した。
実際に、我々はフレームワークのインスタンス化を導入し、いくつかの実験を用いて評価する。
論文 参考訳(メタデータ) (2023-01-30T02:23:49Z) - Estimating Structural Disparities for Face Models [54.062512989859265]
機械学習では、異なるサブ人口間でのモデルの性能や結果の差を測定することで、しばしば異質度の測定が定義される。
本研究では、人間の顔に訓練されたコンピュータビジョンモデルや、顔属性予測や影響推定などのタスクについて、そのような分析を行う。
論文 参考訳(メタデータ) (2022-04-13T05:30:53Z) - Understanding, Detecting, and Separating Out-of-Distribution Samples and
Adversarial Samples in Text Classification [80.81532239566992]
本稿では,2種類の異常 (OOD と Adv のサンプル) と,3つの側面の内分布 (ID) を比較した。
OODサンプルは第1層から始まる収差を露呈するが,Advサンプルの異常はモデル深層まで出現しない。
隠れ表現と出力確率を用いて,ID,OOD,Advのサンプルを分離する簡単な手法を提案する。
論文 参考訳(メタデータ) (2022-04-09T12:11:59Z) - Label efficient two-sample test [39.0914588747459]
2サンプル試験は、2つのサンプルが同じ分布(ヌル仮説)または2つの異なる分布(代替仮説)の実現であるかどうかを評価する。
本稿では,古典的な2サンプルテスト問題におけるこの重要な変化を,2サンプルテストの実行に供する少数のサンプルのラベルを取得する問題として考察する。
まず、ラベルの後方確率をモデル化するための一様ラベル付きサンプルを用いて分類器を訓練し、次に、emphbimodal queryと呼ばれる革新的なクエリスキームを用いてラベルを問合せする。
論文 参考訳(メタデータ) (2021-11-17T01:55:01Z) - Sampling from Arbitrary Functions via PSD Models [55.41644538483948]
まず確率分布をモデル化し,そのモデルからサンプリングする。
これらのモデルでは, 少数の評価値を用いて, 高精度に多数の密度を近似することが可能であることが示され, それらのモデルから効果的にサンプルする簡単なアルゴリズムが提示される。
論文 参考訳(メタデータ) (2021-10-20T12:25:22Z) - Does the dataset meet your expectations? Explaining sample
representation in image data [0.0]
ニューラルネットワークモデルは、トレーニングデータの多様性の欠如によって影響を受けます。
このような欠陥を特定し説明する手法を提案する。
次に,幾何学的形状のデータセットを解析するために本手法を適用した。
論文 参考訳(メタデータ) (2020-12-06T18:16:28Z) - Understanding Classifier Mistakes with Generative Models [88.20470690631372]
ディープニューラルネットワークは教師付き学習タスクに有効であるが、脆弱であることが示されている。
本稿では、生成モデルを利用して、分類器が一般化に失敗するインスタンスを特定し、特徴付ける。
我々のアプローチは、トレーニングセットのクラスラベルに依存しないため、半教師付きでトレーニングされたモデルに適用できる。
論文 参考訳(メタデータ) (2020-10-05T22:13:21Z) - Debiased Contrastive Learning [64.98602526764599]
我々は,同ラベルデータポイントのサンプリングを補正する,偏りのあるコントラスト目的の開発を行う。
実証的に、提案する目的は、視覚、言語、強化学習ベンチマークにおける表現学習の最先端を一貫して上回る。
論文 参考訳(メタデータ) (2020-07-01T04:25:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。