論文の概要: Semi-Supervised Clustering with Inaccurate Pairwise Annotations
- arxiv url: http://arxiv.org/abs/2104.02146v1
- Date: Mon, 5 Apr 2021 20:37:00 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-07 14:00:35.310749
- Title: Semi-Supervised Clustering with Inaccurate Pairwise Annotations
- Title(参考訳): 不正確なペアワイズアノテーションによる半スーパービジョンクラスタリング
- Authors: Daniel Gribel, Michel Gendreau, Thibaut Vidal
- Abstract要約: 本論文では,マストリンクと非リンク関係という形で,ペアワイズアノテーションを組み込んだクラスタリングモデルを提案する。
また,そのモデルを拡張して,専門家の正確性に関する事前知識を統合し,この知識の利用が有益である状況について議論する。
- 参考スコア(独自算出の注目度): 3.7384509727711923
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Pairwise relational information is a useful way of providing partial
supervision in domains where class labels are difficult to acquire. This work
presents a clustering model that incorporates pairwise annotations in the form
of must-link and cannot-link relations and considers possible annotation
inaccuracies (i.e., a common setting when experts provide pairwise
supervision). We propose a generative model that assumes Gaussian-distributed
data samples along with must-link and cannot-link relations generated by
stochastic block models. We adopt a maximum-likelihood approach and demonstrate
that, even when supervision is weak and inaccurate, accounting for relational
information significantly improves clustering performance. Relational
information also helps to detect meaningful groups in real-world datasets that
do not fit the original data-distribution assumptions. Additionally, we extend
the model to integrate prior knowledge of experts' accuracy and discuss
circumstances in which the use of this knowledge is beneficial.
- Abstract(参考訳): ペアワイズリレーショナル情報は、クラスラベルの取得が困難なドメインにおいて、部分的な監視を提供するための有用な方法である。
本研究は,ペアワイズアノテーションを必須リンクと不可能リンクの関係という形式で組み込んだクラスタリングモデルを示し,可能なアノテーション不正確性(つまり,専門家がペアワイズ監督を行う場合の一般的な設定)を考察する。
本稿では,確率ブロックモデルにより生成される有理リンクおよび無理リンク関係とともに,ガウス分布データサンプルを仮定する生成モデルを提案する。
我々は、最大類似性アプローチを採用し、監督が弱く不正確である場合でも、関係情報の会計がクラスタリング性能を大幅に改善することを示す。
リレーショナル情報は、元のデータ分散仮定に合わない実世界のデータセットで意味のあるグループを検出するのにも役立ちます。
さらに,そのモデルを拡張して,専門家の正確性に関する事前知識を統合し,この知識の利用が有益である状況について議論する。
関連論文リスト
- Out of spuriousity: Improving robustness to spurious correlations without group annotations [2.592470112714595]
本稿では,突発的相関に依存しない完全トレーニングネットワークからサブネットワークを抽出する手法を提案する。
提案手法の最悪のグループ性能の増加は、完全に訓練された高密度ネットワークにサブネットワークが存在するという仮説の強化に寄与する。
論文 参考訳(メタデータ) (2024-07-20T20:24:14Z) - Unsupervised Concept Discovery Mitigates Spurious Correlations [45.48778210340187]
トレーニングデータにおける急激な相関関係のモデルはしばしば脆い予測を発生させ、意図しないバイアスを導入する。
本稿では,教師なし対象中心学習と突発的相関の緩和の新たな関連性を確立する。
コバルト(CoBalT)は、サブグループの人間のラベル付けを必要とせず、効果的に素早い相関を緩和する概念バランス技術である。
論文 参考訳(メタデータ) (2024-02-20T20:48:00Z) - Open Set Relation Extraction via Unknown-Aware Training [72.10462476890784]
負のインスタンスを動的に合成することでモデルを正規化する未知の学習手法を提案する。
テキストの敵対的攻撃に触発されて、我々は適応的に、小さいが重要な摂動を元のトレーニングインスタンスに適用する。
実験結果から, 既知の関係の分類を損なうことなく, 未知の関係検出を行うことができた。
論文 参考訳(メタデータ) (2023-06-08T05:45:25Z) - Improving Adaptive Conformal Prediction Using Self-Supervised Learning [72.2614468437919]
我々は、既存の予測モデルの上に自己教師付きプレテキストタスクを持つ補助モデルを訓練し、自己教師付きエラーを付加的な特徴として用いて、非整合性スコアを推定する。
合成データと実データの両方を用いて、効率(幅)、欠陥、共形予測間隔の超過といった付加情報の利点を実証的に実証する。
論文 参考訳(メタデータ) (2023-02-23T18:57:14Z) - A Relation-Oriented Clustering Method for Open Relation Extraction [18.20811491136624]
関係指向クラスタリングモデルを提案し,それを用いてラベルなしデータの新しい関係を同定する。
我々は、インスタンスを対応する関係セントロイドに向かって集めることで、同じ関係を持つインスタンス間の距離を最小化する。
実験の結果,2つのデータセットに対して誤差率を29.2%,15.7%削減できることがわかった。
論文 参考訳(メタデータ) (2021-09-15T10:46:39Z) - Learning Bias-Invariant Representation by Cross-Sample Mutual
Information Minimization [77.8735802150511]
対象タスクが誤用したバイアス情報を除去するために,クロスサンプル対逆脱バイアス法(CSAD)を提案する。
相関測定は, 対向的偏り評価において重要な役割を担い, クロスサンプル型相互情報推定器によって行われる。
我々は,提案手法の最先端手法に対する利点を検証するために,公開データセットの徹底的な実験を行った。
論文 参考訳(メタデータ) (2021-08-11T21:17:02Z) - Deep Conditional Gaussian Mixture Model for Constrained Clustering [7.070883800886882]
制約付きクラスタリングは、部分的にラベル付けされたデータの増加量に関する事前情報を利用することができる。
本稿では、直感的で解釈可能で、勾配変動推論の枠組みで効率的に訓練できる制約付きクラスタリングのための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-06-11T13:38:09Z) - Learning to Model and Ignore Dataset Bias with Mixed Capacity Ensembles [66.15398165275926]
本稿では,データセット固有のパターンを自動的に検出・無視する手法を提案する。
我々の方法は、より高い容量モデルでアンサンブルで低容量モデルを訓練する。
視覚的質問応答データセットの10ポイントゲインを含む,すべての設定の改善を示す。
論文 参考訳(メタデータ) (2020-11-07T22:20:03Z) - Clustering-based Unsupervised Generative Relation Extraction [3.342376225738321]
クラスタリングに基づく教師なし生成関係抽出フレームワーク(CURE)を提案する。
我々は「エンコーダ・デコーダ」アーキテクチャを用いて自己教師付き学習を行い、エンコーダが関係情報を抽出できるようにする。
我々のモデルは、ニューヨーク・タイムズ(NYT)と国連並列コーパス(UNPC)の標準データセットにおいて、最先端モデルよりも優れている。
論文 参考訳(メタデータ) (2020-09-26T20:36:40Z) - Relation-Guided Representation Learning [53.60351496449232]
本稿では,サンプル関係を明示的にモデル化し,活用する表現学習手法を提案する。
私たちのフレームワークは、サンプル間の関係をよく保存します。
サンプルをサブスペースに埋め込むことにより,本手法が大規模なサンプル外問題に対処可能であることを示す。
論文 参考訳(メタデータ) (2020-07-11T10:57:45Z) - SelfORE: Self-supervised Relational Feature Learning for Open Relation
Extraction [60.08464995629325]
オープンドメイン関係抽出は、自然言語文からオープンドメイン関係事実を抽出するタスクである。
弱い自己教師型信号を利用する自己教師型フレームワークであるSelfOREを提案する。
3つのデータセットの実験結果は、SelfOREの有効性とロバスト性を示している。
論文 参考訳(メタデータ) (2020-04-06T07:23:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。