論文の概要: Distribution Matching for Graph Quantification Under Structural Covariate Shift
- arxiv url: http://arxiv.org/abs/2601.00864v1
- Date: Tue, 30 Dec 2025 11:58:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-06 16:25:21.803527
- Title: Distribution Matching for Graph Quantification Under Structural Covariate Shift
- Title(参考訳): 構造共変量シフトによるグラフ量子化のための分布マッチング
- Authors: Clemens Damke, Eyke Hüllermeier,
- Abstract要約: グラフは一般的に、インスタンス間の関係をモデル化するために機械学習で使用される。
グラフ設定では、PSSはトレーニングデータとテストデータのシフトが構造的である場合、一般的には保持しない。
本稿では、一般的な調整数量子化手法の重要サンプリング変種を提案する。
- 参考スコア(独自算出の注目度): 29.303829131008268
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Graphs are commonly used in machine learning to model relationships between instances. Consider the task of predicting the political preferences of users in a social network; to solve this task one should consider, both, the features of each individual user and the relationships between them. However, oftentimes one is not interested in the label of a single instance but rather in the distribution of labels over a set of instances; e.g., when predicting the political preferences of users, the overall prevalence of a given opinion might be of higher interest than the opinion of a specific person. This label prevalence estimation task is commonly referred to as quantification learning (QL). Current QL methods for tabular data are typically based on the so-called prior probability shift (PPS) assumption which states that the label-conditional instance distributions should remain equal across the training and test data. In the graph setting, PPS generally does not hold if the shift between training and test data is structural, i.e., if the training data comes from a different region of the graph than the test data. To address such structural shifts, an importance sampling variant of the popular adjusted count quantification approach has previously been proposed. In this work, we extend the idea of structural importance sampling to the state-of-the-art KDEy quantification approach. We show that our proposed method adapts to structural shifts and outperforms standard quantification approaches.
- Abstract(参考訳): グラフは一般的に、インスタンス間の関係をモデル化するために機械学習で使用される。
ソーシャルネットワークにおけるユーザの政治的嗜好を予測するタスクを考える。このタスクを解くためには、個々のユーザの特徴とそれらの関係の両方を考慮する必要がある。
しかし、多くの場合、単一のインスタンスのラベルには興味がなく、むしろ一連のインスタンス上のラベルの配布に関心がある。例えば、ユーザの政治的嗜好を予測するとき、ある意見の全体的流行は、特定の人の意見よりも高い関心を持つかもしれない。
このラベル精度推定タスクは一般に量子化学習(QL)と呼ばれる。
現在のグラフデータに対するQLメソッドは通常、トレーニングデータとテストデータ間でラベル条件のインスタンス分布が等しくなければならないといういわゆる事前確率シフト(PPS)の仮定に基づいている。
グラフ設定では、PSSは通常、トレーニングデータとテストデータのシフトが構造的である場合、すなわち、トレーニングデータがテストデータとは異なるグラフの領域から来ている場合、保持しない。
このような構造変化に対処するために、一般的な調整数量化手法の重要サンプリング変種が提案されている。
本研究では,構造的重要度サンプリングの考え方を,最先端KDEy量子化アプローチに拡張する。
提案手法は, 構造変化に適応し, 標準量子化手法より優れていることを示す。
関連論文リスト
- Class conditional conformal prediction for multiple inputs by p-value aggregation [11.198836025239963]
分類タスクに対する共形予測手法に革新的改良を導入する。
我々のアプローチは、同じ植物や動物の複数の画像が個人によってキャプチャされる市民科学の応用によって動機付けられています。
本手法をシミュレーションおよび実データで評価し,特に著名な市民科学プラットフォームPl@ntNetに着目した。
論文 参考訳(メタデータ) (2025-07-09T09:17:17Z) - Test-Time Alignment via Hypothesis Reweighting [56.71167047381817]
大規模な事前訓練されたモデルは、しばしば未指定のタスクで苦労する。
テストタイムのユーザ意図にモデルを整合させるという課題に対処する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-12-11T23:02:26Z) - A Simple Baseline for Predicting Events with Auto-Regressive Tabular Transformers [70.20477771578824]
イベント予測への既存のアプローチには、タイムアウェアな位置埋め込み、学習行とフィールドエンコーディング、クラス不均衡に対処するオーバーサンプリング方法などがある。
基本位置埋め込みと因果言語モデリングの目的を持つ標準自己回帰型LPM変換器を用いて,単純だが柔軟なベースラインを提案する。
私たちのベースラインは、一般的なデータセットで既存のアプローチよりも優れており、さまざまなユースケースに使用することができます。
論文 参考訳(メタデータ) (2024-10-14T15:59:16Z) - Downstream-Pretext Domain Knowledge Traceback for Active Learning [138.02530777915362]
本稿では、下流知識と事前学習指導のデータ相互作用をトレースするダウンストリーム・プレテキスト・ドメイン知識トレース(DOKT)手法を提案する。
DOKTは、トレースバックの多様性指標とドメインベースの不確実性推定器から構成される。
10のデータセットで行った実験は、我々のモデルが他の最先端の手法よりも優れていることを示している。
論文 参考訳(メタデータ) (2024-07-20T01:34:13Z) - Leveraging Ensemble Diversity for Robust Self-Training in the Presence of Sample Selection Bias [5.698050337128548]
半教師付き学習において、自己学習はよく知られたアプローチである。モデルが自信を持ってラベル付きデータに擬似ラベルを反復的に割り当て、ラベル付き例として扱う。
ニューラルネットワークの場合、ソフトマックス予測確率はしばしば信頼度尺度として使用されるが、誤った予測であっても過度に信頼されていることが知られている。
本稿では,線形分類器のアンサンブルの予測多様性に基づいて,$mathcalT$-similarityと呼ばれる新しい信頼度尺度を提案する。
論文 参考訳(メタデータ) (2023-10-23T11:30:06Z) - Robust Fairness under Covariate Shift [11.151913007808927]
保護グループメンバーシップに関して公正な予測を行うことは、分類アルゴリズムの重要な要件となっている。
本稿では,ターゲット性能の面で最悪のケースに対して頑健な予測値を求める手法を提案する。
論文 参考訳(メタデータ) (2020-10-11T04:42:01Z) - Pre-training Is (Almost) All You Need: An Application to Commonsense
Reasoning [61.32992639292889]
事前学習されたトランスモデルの微調整は、一般的なNLPタスクを解決するための標準的なアプローチとなっている。
そこで本研究では,可視性ランキングタスクをフルテキスト形式でキャストする新たなスコアリング手法を提案する。
提案手法は, ランダム再起動にまたがって, より安定した学習段階を提供することを示す。
論文 参考訳(メタデータ) (2020-04-29T10:54:40Z) - Characterizing Structural Regularities of Labeled Data in
Overparameterized Models [45.956614301397885]
ディープニューラルネットワークは、共通のパターンや構造を共有するインスタンスをまたいで一般化することができる。
一貫性スコアを用いて、個々のインスタンスがモデルによってどのように扱われるかを分析する。
本稿では,ディープラーニングシステムの解析への潜在的な応用例を示す。
論文 参考訳(メタデータ) (2020-02-08T17:39:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。