論文の概要: PEARL: Prototype-Enhanced Alignment for Label-Efficient Representation Learning with Deployment-Driven Insights from Digital Governance Communication Systems
- arxiv url: http://arxiv.org/abs/2601.17495v1
- Date: Sat, 24 Jan 2026 15:46:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-27 15:23:07.815231
- Title: PEARL: Prototype-Enhanced Alignment for Label-Efficient Representation Learning with Deployment-Driven Insights from Digital Governance Communication Systems
- Title(参考訳): PEARL: デジタルガバナンスコミュニケーションシステムからのデプロイ駆動型インサイトを用いたラベル効率のよい表現学習のためのプロトタイプ強化アライメント
- Authors: Ruiyu Zhang, Lin Nie, Wai-Fung Lam, Qihao Wang, Xin Zhao,
- Abstract要約: PEARL は,クラスプロトタイプへの埋め込みをソフトに整列させるため,限定的な監督を用いたラベル効率のよい手法である。
PEARLを極度のラベル不足から高いラベル設定まで制御されたラベル条件下で評価する。
ラベル・スカース条件下では、PEARLは局所的な品質を大幅に改善し、生の埋め込みよりも25.7%向上し、強い監督されていない後処理と比較して21.1%以上向上する。
- 参考スコア(独自算出の注目度): 7.027521313133687
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In many deployed systems, new text inputs are handled by retrieving similar past cases, for example when routing and responding to citizen messages in digital governance platforms. When these systems fail, the problem is often not the language model itself, but that the nearest neighbors in the embedding space correspond to the wrong cases. Modern machine learning systems increasingly rely on fixed, high-dimensional embeddings produced by large pretrained models and sentence encoders. In real-world deployments, labels are scarce, domains shift over time, and retraining the base encoder is expensive or infeasible. As a result, downstream performance depends heavily on embedding geometry. Yet raw embeddings are often poorly aligned with the local neighborhood structure required by nearest-neighbor retrieval, similarity search, and lightweight classifiers that operate directly on embeddings. We propose PEARL (Prototype-Enhanced Aligned Representation Learning), a label-efficient approach that uses limited supervision to softly align embeddings toward class prototypes. The method reshapes local neighborhood geometry while preserving dimensionality and avoiding aggressive projection or collapse. Its aim is to bridge the gap between purely unsupervised post-processing, which offers limited and inconsistent gains, and fully supervised projections that require substantial labeled data. We evaluate PEARL under controlled label regimes ranging from extreme label scarcity to higher-label settings. In the label-scarce condition, PEARL substantially improves local neighborhood quality, yielding 25.7% gains over raw embeddings and more than 21.1% gains relative to strong unsupervised post-processing, precisely in the regime where similarity-based systems are most brittle.
- Abstract(参考訳): 多くのデプロイシステムにおいて、新しいテキスト入力は、例えばデジタルガバナンスプラットフォームでシチズンメッセージへのルーティングや応答など、同様のケースを検索することで処理される。
これらのシステムが失敗した場合、問題は言語モデルそのものではなく、埋め込み空間の最も近い隣人は間違ったケースに対応する。
現代の機械学習システムは、大きな事前訓練されたモデルと文エンコーダによって生成される固定された高次元埋め込みにますます依存している。
実世界のデプロイメントでは、ラベルは少なく、ドメインは時間とともにシフトし、ベースエンコーダの再トレーニングは高価か不可能である。
その結果、下流の性能は埋め込み幾何学に大きく依存する。
しかし、生の埋め込みは、最も近い隣の検索、類似性探索、埋め込みを直接操作する軽量な分類器によって必要とされる局所的な近傍構造と不整合であることが多い。
PEARL (Prototype-Enhanced Aligned Representation Learning, PEARL) は,クラスプロトタイプに対する埋め込みのソフトアライメントを限定的に行うラベル効率のよい手法である。
この手法は,次元を保ちながら局所的な近傍形状を再現し,攻撃的な投射や崩壊を避ける。
目的は、有限かつ一貫性のないゲインを提供する純粋に教師なしのポストプロセッシングと、実質的なラベル付きデータを必要とする完全に教師付きプロジェクションの間のギャップを埋めることである。
PEARLを極度のラベル不足から高いラベル設定まで制御されたラベル条件下で評価する。
ラベル・スカース状態では、PEARLは局所的な品質を大幅に改善し、生の埋め込みよりも25.7%向上し、厳密な監督されていない後処理と比較して21.1%以上向上する。
関連論文リスト
- ReCCur: A Recursive Corner-Case Curation Framework for Robust Vision-Language Understanding in Open and Edge Scenarios [14.85600144047706]
ノイズの多いWebイメージを監査可能なきめ細かいラベルに変換するフレームワークであるReCCurを提案する。
現実的なコーナーケースのシナリオでは、ReCCurはコンシューマグレードのGPUで動作し、純度と分離性を着実に改善する。
論文 参考訳(メタデータ) (2026-01-06T13:36:43Z) - EReLiFM: Evidential Reliability-Aware Residual Flow Meta-Learning for Open-Set Domain Generalization under Noisy Labels [85.78886153628663]
Open-Set Domain Generalizationは、ディープラーニングモデルが新しいドメインで目に見えないカテゴリを認識できるようにすることを目的としている。
ラベルノイズは、ソースドメインの知識を損なうことによって、オープンセットドメインの一般化を妨げる。
本稿では,ドメインギャップを埋めるために,Evidential Reliability-Aware Residual Flow Meta-Learning (EReLiFM)を提案する。
論文 参考訳(メタデータ) (2025-10-14T16:23:11Z) - Reliable Active Learning from Unreliable Labels via Neural Collapse Geometry [5.1511135538176]
アクティブラーニング(AL)は、情報的なサンプルを優先順位付けすることでアノテーションのコストを削減することを約束するが、ラベルがうるさい場合やデータ分散がシフトした場合、その信頼性は低下する。
本稿では,深層ネットワークの創発的幾何学的規則性を活用し,信頼できない監視に対処するフレームワークである能動学習(NCAL-R)を提案する。
論文 参考訳(メタデータ) (2025-10-10T17:50:31Z) - Robust and Label-Efficient Deep Waste Detection [29.019461511410515]
効率的な廃棄物のソートは持続可能なリサイクルには不可欠だが、この領域でのAI研究は商用システムに遅れを取っている。
本研究では,強力なベースラインを確立し,アンサンブルに基づく半教師付き学習フレームワークを導入することにより,AI駆動型廃棄物検出を推し進める。
論文 参考訳(メタデータ) (2025-08-26T08:34:04Z) - GLiClass: Generalist Lightweight Model for Sequence Classification Tasks [49.2639069781367]
本稿では,シーケンス分類タスクにGLiNERアーキテクチャを適用する新しい手法であるGLiClassを提案する。
提案手法は,ゼロショットおよび少数ショット学習シナリオに必要な柔軟性を維持しつつ,埋め込み方式に匹敵する高い精度と効率を実現する。
論文 参考訳(メタデータ) (2025-08-11T06:22:25Z) - An Embedding is Worth a Thousand Noisy Labels [0.11999555634662634]
本稿では,重み付けされたアダプティブNearest Neighborアプローチを用いてラベルノイズに対処するWANNを提案する。
WANNの参照手法は、様々な大きさの多様なデータセットや、様々なノイズタイプや重大さで優れていることを示す。
私たちのアプローチは、効率性と説明可能性を強調し、ディープニューラルネットワークトレーニングの固有の制限を克服するための、シンプルで堅牢なソリューションとして現れます。
論文 参考訳(メタデータ) (2024-08-26T15:32:31Z) - CLIP-VG: Self-paced Curriculum Adapting of CLIP for Visual Grounding [86.79903269137971]
擬似ラベルを用いて地域を特定するために、教師なしの視覚的接地法が開発された。
CLIP-VG は,CLIP を擬似言語ラベルに適応させる手法である。
提案手法は,RefCOCO/+/gデータセットにおいて,最先端の教師なし手法よりも有意差がある。
論文 参考訳(メタデータ) (2023-05-15T14:42:02Z) - Unsupervised Domain Adaptive Salient Object Detection Through
Uncertainty-Aware Pseudo-Label Learning [104.00026716576546]
そこで本研究では,手動のアノテーションを使わずに,自然に高いピクセルラベル品質を有する合成・クリーンなラベルから,サリエンスを学習することを提案する。
提案手法は,複数のベンチマークデータセット上で,既存の最先端の深層教師なしSOD法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-02-26T16:03:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。