論文の概要: ConstraintMatch for Semi-constrained Clustering
- arxiv url: http://arxiv.org/abs/2311.15395v1
- Date: Sun, 26 Nov 2023 19:31:52 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-28 17:56:34.578110
- Title: ConstraintMatch for Semi-constrained Clustering
- Title(参考訳): 半制約クラスタリングのための制約マッチング
- Authors: Jann Goschenhofer, Bernd Bischl, Zsolt Kira
- Abstract要約: 制約クラスタリングにより、ペアの制約のみを使用して分類モデルのトレーニングが可能になる。
そこで本稿では,制約の少ない制約セットとともに大量のテキスト非制約データを利用できる半教師付きコンテキストを提案し,制約のないデータを活用するためのtextitConstraintMatchを提案する。
- 参考スコア(独自算出の注目度): 32.92933231199262
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Constrained clustering allows the training of classification models using
pairwise constraints only, which are weak and relatively easy to mine, while
still yielding full-supervision-level model performance. While they perform
well even in the absence of the true underlying class labels, constrained
clustering models still require large amounts of binary constraint annotations
for training. In this paper, we propose a semi-supervised context whereby a
large amount of \textit{unconstrained} data is available alongside a smaller
set of constraints, and propose \textit{ConstraintMatch} to leverage such
unconstrained data. While a great deal of progress has been made in
semi-supervised learning using full labels, there are a number of challenges
that prevent a naive application of the resulting methods in the
constraint-based label setting. Therefore, we reason about and analyze these
challenges, specifically 1) proposing a \textit{pseudo-constraining} mechanism
to overcome the confirmation bias, a major weakness of pseudo-labeling, 2)
developing new methods for pseudo-labeling towards the selection of
\textit{informative} unconstrained samples, 3) showing that this also allows
the use of pairwise loss functions for the initial and auxiliary losses which
facilitates semi-constrained model training. In extensive experiments, we
demonstrate the effectiveness of ConstraintMatch over relevant baselines in
both the regular clustering and overclustering scenarios on five challenging
benchmarks and provide analyses of its several components.
- Abstract(参考訳): 制約付きクラスタリングによって、ペアワイズ制約のみを使用した分類モデルのトレーニングが可能になる。
真の基盤となるクラスラベルがなくてもうまく機能するが、制約付きクラスタリングモデルはトレーニングに大量のバイナリ制約アノテーションを必要とする。
本稿では,制約の小さなセットとともに大量の \textit{unconstrained} データを利用できる半教師付きコンテキストを提案し,そのような制約のないデータを活用するために \textit{ConstraintMatch} を提案する。
完全なラベルを用いた半教師付き学習では、多くの進歩がなされているが、制約ベースのラベル設定において、結果のメソッドをナイーブに適用することを妨げる多くの課題がある。
したがって、これらの課題、特にその理由と分析を行う。
1)疑似ラベルの主な弱点である確認バイアスを克服するための \textit{pseudo-constraining} メカニズムの提案
2) \textit{informative} unconstrainedサンプルの選択に向けた擬似ラベル法の開発
3) 半拘束型モデルトレーニングを容易にする初期損失と補助損失に対するペアワイズ損失関数の使用も可能であることを示す。
大規模実験により,5つの難解なベンチマークにおいて,正規クラスタリングとオーバークラスタシナリオの両方において,関連するベースラインに対する制約マッチの有効性を実証し,いくつかのコンポーネントの分析を提供する。
関連論文リスト
- Stable Cluster Discrimination for Deep Clustering [7.175082696240088]
ディープクラスタリングは、インスタンスの表現(つまり、表現学習)を最適化し、固有のデータ分散を探索することができる。
結合された目的は、すべてのインスタンスが一様機能に崩壊する、自明な解決策を意味する。
本研究では,1段階クラスタリングにおいて,教師あり学習における一般的な識別タスクが不安定であることを示す。
新規な安定クラスタ識別(SeCu)タスクを提案し、それに応じて新しいハードネス対応クラスタリング基準を得ることができる。
論文 参考訳(メタデータ) (2023-11-24T06:43:26Z) - Adaptive End-to-End Metric Learning for Zero-Shot Cross-Domain Slot
Filling [2.6056468338837457]
スロットフィリングは、トレーニング中にサンプルを見ることのない新しいドメインを扱う上で重要な課題である。
ほとんどの先行研究は、メートル法学習に基づく2パスパイプライン方式でこの問題に対処している。
そこで本研究では,ゼロショットスロットの補充に挑戦する手法として,適応的なエンドツーエンドの計量学習手法を提案する。
論文 参考訳(メタデータ) (2023-10-23T19:01:16Z) - On Regularization and Inference with Label Constraints [62.60903248392479]
機械学習パイプラインにおけるラベル制約を符号化するための2つの戦略、制約付き正規化、制約付き推論を比較した。
正規化については、制約に不整合なモデルを前置することで一般化ギャップを狭めることを示す。
制約付き推論では、モデルの違反を訂正することで人口リスクを低減し、それによってその違反を有利にすることを示す。
論文 参考訳(メタデータ) (2023-07-08T03:39:22Z) - Semi-Supervised Constrained Clustering: An In-Depth Overview, Ranked
Taxonomy and Future Research Directions [2.5957372084704238]
制約クラスタリングの研究領域は、長年にわたって大きく成長してきた。
利用可能なさまざまなメソッド、制約、ベンチマークを簡単に理解するために、統一された概要は提供されていない。
本研究では,制約クラスタリングの背景を詳細に分析し,制約クラスタリングに使用できる制約の種類を分類する。
論文 参考訳(メタデータ) (2023-02-28T17:46:31Z) - Optimal Decision Trees For Interpretable Clustering with Constraints
(Extended Version) [7.799182201815762]
制約クラスタリング(Constrained clustering)は、制約として定式化された限られた量のラベル付きデータを使用する半教師付きタスクである。
本稿では、クラスタリング制約をサポートする解釈可能なクラスタリングのための新しいSATベースのフレームワークを提案する。
また,ユーザが提供する制約の解釈可能性と満足度とのトレードオフについて,新たな知見を提示する。
論文 参考訳(メタデータ) (2023-01-30T05:34:49Z) - SoftMatch: Addressing the Quantity-Quality Trade-off in Semi-supervised
Learning [101.86916775218403]
本稿では, サンプル重み付けを統一した定式化により, 一般的な擬似ラベル法を再検討する。
トレーニング中の擬似ラベルの量と質を両立させることでトレードオフを克服するSoftMatchを提案する。
実験では、画像、テキスト、不均衡な分類など、さまざまなベンチマークで大幅に改善されている。
論文 参考訳(メタデータ) (2023-01-26T03:53:25Z) - An Embarrassingly Simple Approach to Semi-Supervised Few-Shot Learning [58.59343434538218]
間接学習の観点から、ラベルなしデータの正負の擬似ラベルを正確に予測するための、単純だが非常に効果的な手法を提案する。
私たちのアプローチは、オフザシェルフ操作のみを使用することで、ほんの数行のコードで実装できます。
論文 参考訳(メタデータ) (2022-09-28T02:11:34Z) - Rethinking Clustering-Based Pseudo-Labeling for Unsupervised
Meta-Learning [146.11600461034746]
教師なしメタラーニングのメソッドであるCACTUsは、擬似ラベル付きクラスタリングベースのアプローチである。
このアプローチはモデルに依存しないため、教師付きアルゴリズムと組み合わせてラベルのないデータから学習することができる。
このことの核となる理由は、埋め込み空間においてクラスタリングに優しい性質が欠如していることである。
論文 参考訳(メタデータ) (2022-09-27T19:04:36Z) - Unsupervised Learning of Debiased Representations with Pseudo-Attributes [85.5691102676175]
教師なし方式で,単純かつ効果的な脱バイアス手法を提案する。
特徴埋め込み空間上でクラスタリングを行い、クラスタリング結果を利用して疑似属性を識別する。
次に,非偏り表現を学習するために,クラスタベースの新しい重み付け手法を用いる。
論文 参考訳(メタデータ) (2021-08-06T05:20:46Z) - A Framework for Deep Constrained Clustering [19.07636653413663]
制約付きクラスタリングは、k平均、混合モデル、スペクトルクラスタリングなどの一般的なアルゴリズムには存在するが、いくつかの制限がある。
ここでは、制約クラスタリングのためのディープラーニングフレームワークを探索し、特に制約クラスタリングの分野を拡張する方法について検討します。
我々のフレームワークは、ラベル付き側情報から生成された標準的制約や部分的制約(先に報告した十分な文書化された負の影響を伴わない)を扱えないことを示す。
これら4種類の制約に一般的に適用できる効率的なトレーニングパラダイムを提案します。
論文 参考訳(メタデータ) (2021-01-07T22:49:06Z) - An Integer Linear Programming Framework for Mining Constraints from Data [81.60135973848125]
データから制約をマイニングするための一般的なフレームワークを提案する。
特に、構造化された出力予測の推論を整数線形プログラミング(ILP)問題とみなす。
提案手法は,9×9のスドクパズルの解法を学習し,基礎となるルールを提供することなく,例からツリー問題を最小限に分散させることが可能であることを示す。
論文 参考訳(メタデータ) (2020-06-18T20:09:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。