論文の概要: Beyond Distribution Estimation: Simplex Anchored Structural Inference Towards Universal Semi-Supervised Learning
- arxiv url: http://arxiv.org/abs/2605.07557v2
- Date: Mon, 11 May 2026 02:23:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 19:24:01.356321
- Title: Beyond Distribution Estimation: Simplex Anchored Structural Inference Towards Universal Semi-Supervised Learning
- Title(参考訳): 分布推定を超えて:Universal Semi-Supervised Learningに向けたSimplex Anchored構造推論
- Authors: Yaxin Hou, Jun Ma, Hanyang Li, Bo Han, Jie Yu, Yuheng Jia,
- Abstract要約: 我々は、Universal Semi-supervised Learning (UniSSL)として批判的だが未探索のパラダイムを定式化する。
既存の手法は、通常擬似ラベルでラベル付けされていないデータを利用する。
我々は、表現レベルの構造推論からバイパス分布推定へ焦点を移す。
- 参考スコア(独自算出の注目度): 47.92504362652887
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semi-supervised learning faces significant challenges in realistic scenarios where labeled data is scarce and unlabeled data follows unknown, arbitrary distributions. We formalize this critical yet under-explored paradigm as Universal Semi-supervised Learning (UniSSL). Existing methods typically leverage unlabeled data via pseudo-labeling. However, they often rely on the idealized assumption of a uniform unlabeled data distribution or require sufficient labeled data to estimate it. In the UniSSL setting, such dependencies lead to numerous erroneous pseudo-labels, thereby triggering representation confusion. Fortunately, we observe that inter-sample relations captured by representations are more reliable than pseudo-labels. Leveraging this insight, we shift our focus to representation-level structural inference to bypass distribution estimation. Accordingly, we propose Simplex Anchored Graph-state Equipartition (SAGE), which captures high-order inter-sample dependencies to establish structural consensus for guiding representation learning. Meanwhile, to mitigate representation confusion, we employ vectors that satisfy a simplex equiangular tight frame to serve as a coordinate frame for guiding inter-class representation separation. Finally, we introduce a weighting strategy based on distribution-agnostic metrics to prioritize reliable pseudo-labels and an auxiliary branch to isolate potentially erroneous pseudo-labels. Evaluations on five standard benchmarks show that SAGE consistently outperforms state-of-the-art methods, with an average accuracy gain of $\textbf{8.52\%}$.
- Abstract(参考訳): 半教師付き学習は、ラベル付きデータが不足し、ラベルなしデータが未知の任意の分布に従う現実的なシナリオにおいて重大な課題に直面している。
我々はこの批判的かつ未探索のパラダイムをUniSSL(Universal Semi-supervised Learning)として定式化する。
既存の手法は、通常擬似ラベルでラベル付けされていないデータを利用する。
しかし、彼らはしばしば、統一されたラベルのないデータ分布の理想的な仮定に頼るか、それを見積もるために十分なラベル付きデータを必要とする。
UniSSL設定では、そのような依存関係は多くの誤った擬似ラベルをもたらし、表現の混乱を引き起こす。
幸いなことに、表現によってキャプチャされたサンプル間の関係は擬似ラベルよりも信頼性が高い。
この知見を生かして、我々は表現レベルの構造推論からバイパス分布推定へと焦点を移した。
そこで我々は,SAGE (Simplex Anchored Graph-state Equipartition) を提案する。
一方、表現の混乱を軽減するために、クラス間表現分離を導くための座標フレームとして、単純な等角的タイトフレームを満たすベクトルを用いる。
最後に,分布に依存しない指標に基づく重み付け手法を導入し,信頼性の高い擬似ラベルを優先し,誤用する可能性のある擬似ラベルを分離する補助的ブランチを導入する。
5つの標準ベンチマークの評価によると、SAGEは最先端の手法を一貫して上回り、平均精度は$\textbf{8.52\%}$である。
関連論文リスト
- Improving realistic semi-supervised learning with doubly robust estimation [8.828699635463265]
Semi-Supervised Learning (SSL)における大きな課題は、ラベルなしデータのクラス分布に関する制限された情報である。
本稿では,有限次元パラメータである無ラベルなクラス分布を,強い理論的保証を持つ2重頑健な推定器を用いて明示的に推定することを提案する。
この推定値を既存の手法に統合して、トレーニング中のラベルなしデータをより正確に擬似ラベル付けすることができる。
論文 参考訳(メタデータ) (2025-02-01T02:34:12Z) - All Points Matter: Entropy-Regularized Distribution Alignment for
Weakly-supervised 3D Segmentation [67.30502812804271]
擬似ラベルは、弱い教師付き3Dセグメンテーションタスクに広く使われており、学習に使えるのはスパース・グラウンド・トラス・ラベルのみである。
本稿では,生成した擬似ラベルを正規化し,擬似ラベルとモデル予測とのギャップを効果的に狭めるための新しい学習戦略を提案する。
論文 参考訳(メタデータ) (2023-05-25T08:19:31Z) - Dist-PU: Positive-Unlabeled Learning from a Label Distribution
Perspective [89.5370481649529]
本稿では,PU学習のためのラベル分布視点を提案する。
そこで本研究では,予測型と基底型のラベル分布間のラベル分布の整合性を追求する。
提案手法の有効性を3つのベンチマークデータセットで検証した。
論文 参考訳(メタデータ) (2022-12-06T07:38:29Z) - Confident Sinkhorn Allocation for Pseudo-Labeling [40.883130133661304]
半教師付き学習は、ラベル付きデータへの機械学習の依存を減らす重要なツールである。
本稿では,疑似ラベル作成における不確実性の役割を理論的に研究し,CSA(Confident Sinkhorn Allocation)を提案する。
CSAは、信頼度の高いサンプルのみへの最適な輸送を通して、最高の擬似ラベル割り当てを特定する。
論文 参考訳(メタデータ) (2022-06-13T02:16:26Z) - Optimizing Diffusion Rate and Label Reliability in a Graph-Based
Semi-supervised Classifier [2.4366811507669124]
Local and Global Consistency (LGC)アルゴリズムは、グラフベースの半教師付き半教師付き(GSSL)分類器の1つである。
ラベル付きインスタンスの自己影響を取り除くことは、どのように有用か、そして、それがアウト・ワン・アウトエラーにどのように関係するかについて議論する。
本研究では,ラベルの信頼性と拡散率を推定する手法を提案する。
論文 参考訳(メタデータ) (2022-01-10T16:58:52Z) - Distribution-Aware Semantics-Oriented Pseudo-label for Imbalanced
Semi-Supervised Learning [80.05441565830726]
本稿では,疑似ラベルの重み付けがモデル性能に悪影響を及ぼすような,不均衡な半教師付き学習に対処する。
本稿では,この観測の動機となるバイアスに対処する,一般的な擬似ラベルフレームワークを提案する。
不均衡SSLのための新しい擬似ラベルフレームワークを、DASO(Distributed-Aware Semantics-Oriented Pseudo-label)と呼ぶ。
論文 参考訳(メタデータ) (2021-06-10T11:58:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。