論文の概要: Semi-Supervised Graph Imbalanced Regression
- arxiv url: http://arxiv.org/abs/2305.12087v1
- Date: Sat, 20 May 2023 04:11:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-24 00:45:09.354608
- Title: Semi-Supervised Graph Imbalanced Regression
- Title(参考訳): 半教師付きグラフ不均衡回帰
- Authors: Gang Liu, Tong Zhao, Eric Inae, Tengfei Luo, Meng Jiang
- Abstract要約: 本稿では,学習データを段階的にバランスさせ,自己学習によるモデルバイアスを低減するための半教師付きフレームワークを提案する。
その結果,提案フレームワークは予測されたグラフ特性の誤差を著しく低減することがわかった。
- 参考スコア(独自算出の注目度): 17.733488328772943
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Data imbalance is easily found in annotated data when the observations of
certain continuous label values are difficult to collect for regression tasks.
When they come to molecule and polymer property predictions, the annotated
graph datasets are often small because labeling them requires expensive
equipment and effort. To address the lack of examples of rare label values in
graph regression tasks, we propose a semi-supervised framework to progressively
balance training data and reduce model bias via self-training. The training
data balance is achieved by (1) pseudo-labeling more graphs for
under-represented labels with a novel regression confidence measurement and (2)
augmenting graph examples in latent space for remaining rare labels after data
balancing with pseudo-labels. The former is to identify quality examples from
unlabeled data whose labels are confidently predicted and sample a subset of
them with a reverse distribution from the imbalanced annotated data. The latter
collaborates with the former to target a perfect balance using a novel
label-anchored mixup algorithm. We perform experiments in seven regression
tasks on graph datasets. Results demonstrate that the proposed framework
significantly reduces the error of predicted graph properties, especially in
under-represented label areas.
- Abstract(参考訳): ある連続ラベル値の観測が回帰タスクの収集が難しい場合、注釈付きデータではデータの不均衡が容易に見つかる。
分子やポリマーの性質を予測する場合、アノテートされたグラフデータセットは高価な機器と労力を必要とするため、しばしば小さい。
グラフ回帰タスクにおけるレアラベル値の例の欠如に対処するため,トレーニングデータの漸進的バランスと自己学習によるモデルバイアス低減のための半教師付きフレームワークを提案する。
トレーニングデータバランスは、(1)新しい回帰信頼度測定による未表示ラベルに対するより多くのグラフの擬似ラベル付け、(2)疑似ラベルによるデータバランス後の希少ラベル残余の潜在空間におけるグラフ例の強化によって達成される。
前者はラベルが自信を持って予測されているラベルのないデータから品質サンプルを特定し、不均衡な注釈データから逆分布でそれらのサブセットをサンプリングする。
後者は前者と協力し、新しいラベルアンコール混合アルゴリズムを用いて完全なバランスを目標とする。
グラフデータセット上で7つの回帰タスクで実験を行う。
その結果,提案手法は予測されたグラフ特性,特にラベル領域の誤差を大幅に低減できることがわかった。
関連論文リスト
- Soft Curriculum for Learning Conditional GANs with Noisy-Labeled and
Uncurated Unlabeled Data [70.25049762295193]
本稿では,トレーニング中にノイズラベル付きおよび未処理データを受け入れる条件付き画像生成フレームワークを提案する。
本稿では,ラベルのないデータに新たなラベルを割り当てながら,逆行訓練にインスタンスワイドを割り当てるソフトカリキュラム学習を提案する。
実験により,本手法は,定量および定性性能の両面において,既存の半教師付き・ラベル付きロバストな手法より優れていることが示された。
論文 参考訳(メタデータ) (2023-07-17T08:31:59Z) - How Does Pseudo-Labeling Affect the Generalization Error of the
Semi-Supervised Gibbs Algorithm? [73.80001705134147]
擬似ラベル付き半教師付き学習(SSL)におけるGibsアルゴリズムによる予測一般化誤差(ゲンエラー)を正確に評価する。
ゲンエラーは、出力仮説、擬ラベルデータセット、ラベル付きデータセットの間の対称性付きKL情報によって表現される。
論文 参考訳(メタデータ) (2022-10-15T04:11:56Z) - Debiased Learning from Naturally Imbalanced Pseudo-Labels for Zero-Shot
and Semi-Supervised Learning [27.770473405635585]
この研究は、疑似ラベルのバイアス問題を研究する。これは、広く起こるが、しばしば先行研究によって見落とされがちな自然現象である。
半教師付き学習モデルであるFixMatchは、ラベルなしデータを計算したとしても、ラベルなし集合上のラベルを予測したとき、重く長い尾の擬似ラベルを観察する。
介入なしに、トレーニングモデルは擬似ラベルからバイアスを継承し、最終的には準最適となる。
論文 参考訳(メタデータ) (2022-01-05T07:40:24Z) - Recovering the Unbiased Scene Graphs from the Biased Ones [99.24441932582195]
ラベルが不足しているため、シーングラフ生成(SGG)は「肯定的・未ラベルデータからの学習」(PU学習)問題とみなすことができる。
本稿では,複数のトレーニングイテレーションにまたがって,トレーニング時のデータ拡張と平均値を活用するために,動的ラベル周波数推定(DLFE)を提案する。
拡張実験の結果,DLFEは従来の推定法よりもラベル周波数の推定に有効であり,DLFEは長い尾を著しく緩和することがわかった。
論文 参考訳(メタデータ) (2021-07-05T16:10:41Z) - Disentangling Sampling and Labeling Bias for Learning in Large-Output
Spaces [64.23172847182109]
異なる負のサンプリングスキームが支配的ラベルと稀なラベルで暗黙的にトレードオフパフォーマンスを示す。
すべてのラベルのサブセットで作業することで生じるサンプリングバイアスと、ラベルの不均衡に起因するデータ固有のラベルバイアスの両方に明示的に対処する統一された手段を提供する。
論文 参考訳(メタデータ) (2021-05-12T15:40:13Z) - A Study on the Autoregressive and non-Autoregressive Multi-label
Learning [77.11075863067131]
本稿では,ラベルとラベルの依存関係を共同で抽出する自己アテンションに基づく変分エンコーダモデルを提案する。
したがって、ラベルラベルとラベル機能の両方の依存関係を保ちながら、すべてのラベルを並列に予測することができる。
論文 参考訳(メタデータ) (2020-12-03T05:41:44Z) - Finding Friends and Flipping Frenemies: Automatic Paraphrase Dataset
Augmentation Using Graph Theory [21.06607915149245]
提案する文ペアラベルからパラフレーズグラフを構築し,推移性特性を用いて原文ペアから直接ラベルを推測することにより,拡張データセットを作成する。
提案手法は,事前学習されたBERTモデルから始まるこれらのデータセットを用いて学習したパラフレーズモデルを用いて評価し,自動強化されたトレーニングセットによりより正確なモデルが得られることを示す。
論文 参考訳(メタデータ) (2020-11-03T17:18:03Z) - Handling Missing Data with Graph Representation Learning [62.59831675688714]
特徴量計算とラベル予測のためのグラフベースのフレームワークであるGRAPEを提案する。
GRAPEでは,特徴計算をエッジレベル予測タスク,ラベル予測をノードレベル予測タスクとして定式化する。
9つのベンチマークデータセットによる実験結果から、GRAPEは計算タスクの平均絶対誤差を20%低く、ラベル予測タスクを10%低くすることがわかった。
論文 参考訳(メタデータ) (2020-10-30T17:59:13Z) - Rethinking the Value of Labels for Improving Class-Imbalanced Learning [20.953282288425118]
クラス不均衡学習は、半教師ありと自己教師ありの両方の方法において有益である。
不均衡なラベルは常に役に立ちません。
この結果から,現実的な長期タスクにおける不均衡ラベルの使用を再考する必要性が浮き彫りとなった。
論文 参考訳(メタデータ) (2020-06-13T01:35:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。