論文の概要: Fractionally Supervised Classification with Maxima Nominated Samples
- arxiv url: http://arxiv.org/abs/2604.25145v1
- Date: Tue, 28 Apr 2026 02:48:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-29 16:49:17.678266
- Title: Fractionally Supervised Classification with Maxima Nominated Samples
- Title(参考訳): Maxima Nominateed Samples を用いた分節的教師付き分類
- Authors: Mohammad Jafari Jozani, Jingyu Wang,
- Abstract要約: Fractionally supervised classification (FSC) は、ラベル付きデータとラベルなしデータをモデルベース分類で組み合わせるための柔軟なフレームワークを提供する。
提案手法は, 最大値のクラスメンバシップと, 残りのユニットの潜時構成の両方を考慮に入れた潜時表現を導入することで, 提案した標本に対するFCCを開発する。
得られた手法は、NSデータに対する適切なEMアルゴリズムとコヒーレントな重み付きFSC手順を生成する。
- 参考スコア(独自算出の注目度): 12.307540399602523
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Fractionally supervised classification (FSC) offers a flexible framework for combining labeled and unlabeled data in model-based classification, but existing formulations assume simple random sampling. In many applications, however, the retained observation is an extreme order statistic from a set rather than a randomly selected unit. This is particularly appealing when the target population is rare, since maxima nomination sampling (NS) can enrich the sample with the most informative observations, as in screening, environmental monitoring, repeated testing, and reliability studies. Under such designs, the likelihood function changes fundamentally, and the usual FSC EM construction is no longer valid. We develop FSC for nominated samples by introducing a latent representation that accounts for both the class membership of the observed maximum and the latent composition of the remaining units in the set. The resulting method yields a proper EM algorithm and a coherent weighted-likelihood FSC procedure for NS data. We present the methodology in general form, illustrate it for a rare-event contamination normal mixtures, and show through simulation that it substantially improves on the misspecified alternative by ignoring the extra rank information of such data. A real-data analysis demonstrates its practical value.
- Abstract(参考訳): Fractionally supervised classification (FSC) は、ラベル付きデータとラベルなしデータをモデルベース分類で組み合わせるための柔軟なフレームワークを提供するが、既存の定式化は単純なランダムサンプリングを前提としている。
しかし、多くの応用において、保持された観測は、ランダムに選択された単位ではなく、集合からの極端な順序統計量である。
これは特に、ターゲットの個体数が希少な場合には特に魅力的であり、最大指名サンプリング(NS)は、スクリーニング、環境モニタリング、反復試験、信頼性調査など、最も情報に富む観察でサンプルを豊かにすることができる。
このような設計の下では、可能性関数は基本的に変化し、通常のFCC EMの構成はもはや有効ではない。
提案手法は, 最大値のクラスメンバシップと, 残りのユニットの潜時構成の両方を考慮に入れた潜時表現を導入することで, 提案した標本に対するFCCを開発する。
得られた手法は、NSデータに対する適切なEMアルゴリズムとコヒーレントな重み付きFSC手順を生成する。
本手法を概説し, 希少な汚染常用混合物について説明し, シミュレーションにより, 余分なランク情報を無視することで, 不正な代替案を著しく改善することを示す。
実データ分析はその実用的価値を示している。
関連論文リスト
- Combating Noisy Labels through Fostering Self- and Neighbor-Consistency [120.4394402099635]
ラベルノイズは様々な現実世界のシナリオで広まり、教師付きディープラーニングの課題を提起する。
我々は、Jo-SNC(textbfSelf- と textbfNeighbor-textbfConsistency に基づくサンプル選択とモデル正規化)というノイズロバスト手法を提案する。
我々は、クラスごとの選択閾値を調整するための自己適応型データ駆動しきい値設定方式を設計する。
論文 参考訳(メタデータ) (2026-01-19T07:55:29Z) - Learning Robust Diffusion Models from Imprecise Supervision [75.53546939251146]
DMISは、Imrecise Supervisionから堅牢な条件拡散モデルをトレーニングするための統一されたフレームワークである。
我々のフレームワークは、可能性から派生し、その目的を生成的および分類的構成要素に分解する。
画像生成、弱教師付き学習、データセットの凝縮をカバーし、様々な形の不正確な監視実験を行い、DMISが常に高品質でクラス差別的なサンプルを生成することを示した。
論文 参考訳(メタデータ) (2025-10-03T14:00:32Z) - Class conditional conformal prediction for multiple inputs by p-value aggregation [11.198836025239963]
分類タスクに対する共形予測手法に革新的改良を導入する。
我々のアプローチは、同じ植物や動物の複数の画像が個人によってキャプチャされる市民科学の応用によって動機付けられています。
本手法をシミュレーションおよび実データで評価し,特に著名な市民科学プラットフォームPl@ntNetに着目した。
論文 参考訳(メタデータ) (2025-07-09T09:17:17Z) - Harnessing Mixed Features for Imbalance Data Oversampling: Application to Bank Customers Scoring [5.091061468748012]
MGS-GRFは複合機能用に設計されたオーバーサンプリング戦略である。
その結果,MGS-GRFはコヒーレンス(コヒーレンス),すなわち,原データセットにすでに存在する分類的特徴の組み合わせのみを生成できる能力,すなわち連続的特徴と分類的特徴との依存性を維持できる能力の2つの重要な特性を示すことがわかった。
論文 参考訳(メタデータ) (2025-03-26T08:53:40Z) - Selective Classification Under Distribution Shifts [2.6541808384534478]
選別分類において、分類器は過度なエラーを避けるために誤りとなる可能性のある予測を棄却する。
本稿では,分散シフトを考慮したSCフレームワークを提案する。
提案したスコア関数は、一般化されたSCのための既存のスコア関数よりも効果的で信頼性が高いことを示す。
論文 参考訳(メタデータ) (2024-05-08T15:52:50Z) - Parametric Classification for Generalized Category Discovery: A Baseline
Study [70.73212959385387]
Generalized Category Discovery (GCD)は、ラベル付きサンプルから学習した知識を用いて、ラベルなしデータセットで新しいカテゴリを発見することを目的としている。
パラメトリック分類器の故障を調査し,高品質な監視が可能であった場合の過去の設計選択の有効性を検証し,信頼性の低い疑似ラベルを重要課題として同定する。
エントロピー正規化の利点を生かし、複数のGCDベンチマークにおける最先端性能を実現し、未知のクラス数に対して強いロバスト性を示す、単純で効果的なパラメトリック分類法を提案する。
論文 参考訳(メタデータ) (2022-11-21T18:47:11Z) - Predicting Out-of-Domain Generalization with Neighborhood Invariance [59.05399533508682]
局所変換近傍における分類器の出力不変性の尺度を提案する。
私たちの測度は計算が簡単で、テストポイントの真のラベルに依存しません。
画像分類,感情分析,自然言語推論のベンチマーク実験において,我々の測定値と実際のOOD一般化との間に強い相関関係を示す。
論文 参考訳(メタデータ) (2022-07-05T14:55:16Z) - False membership rate control in mixture models [1.387448620257867]
クラスタリングタスクは、サンプルの要素を均質なグループに分割する。
教師付き設定では、このアプローチはよく知られており、禁忌オプションの分類として言及されている。
本稿では, 教師なし混合モデルフレームワークで再検討し, 偽会員率が予め定義された名目レベルを超えないことを保証する手法を開発することを目的とする。
論文 参考訳(メタデータ) (2022-03-04T22:37:59Z) - When in Doubt: Improving Classification Performance with Alternating
Normalization [57.39356691967766]
分類のための非パラメトリック後処理ステップである交互正規化(CAN)を用いた分類を導入する。
CANは、予測されたクラス確率分布を再調整することで、挑戦的な例の分類精度を向上させる。
多様な分類課題にまたがってその効果を実証的に示す。
論文 参考訳(メタデータ) (2021-09-28T02:55:42Z) - Robust M-Estimation Based Bayesian Cluster Enumeration for Real
Elliptically Symmetric Distributions [5.137336092866906]
データセットにおける最適なクラスタ数のロバストな決定は、広範囲のアプリケーションにおいて必須の要素である。
本稿では任意のReally Symmetric(RES)分散混合モデルで使用できるように一般化する。
サンプルサイズが有限であるデータセットに対して,ロバストな基準を導出するとともに,大規模なサンプルサイズでの計算コスト削減のための近似を提供する。
論文 参考訳(メタデータ) (2020-05-04T11:44:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。