論文の概要: Precedence-Constrained Winter Value for Effective Graph Data Valuation
- arxiv url: http://arxiv.org/abs/2402.01943v2
- Date: Fri, 8 Mar 2024 13:34:12 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-11 22:47:14.715884
- Title: Precedence-Constrained Winter Value for Effective Graph Data Valuation
- Title(参考訳): グラフデータバリュエーションの事前制約付き冬値
- Authors: Hongliang Chi, Wei Jin, Charu Aggarwal, Yao Ma
- Abstract要約: グラフデータのバリュエーションは、ノード間の複雑な依存関係と、価値推定コストの指数的な増加から起因した、ユニークな課題を導入します。
複雑なグラフ構造を考慮した先進制約冬(PC-Winter)値(Precedence-Constrained Winter:PC-Winter)を考案した。
さらに、計算課題に対処し、PC-Winterの効率的な近似を可能にするための様々な戦略を開発する。
- 参考スコア(独自算出の注目度): 12.58508859361839
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Data valuation is essential for quantifying data's worth, aiding in assessing
data quality and determining fair compensation. While existing data valuation
methods have proven effective in evaluating the value of Euclidean data, they
face limitations when applied to the increasingly popular graph-structured
data. Particularly, graph data valuation introduces unique challenges,
primarily stemming from the intricate dependencies among nodes and the
exponential growth in value estimation costs. To address the challenging
problem of graph data valuation, we put forth an innovative solution,
Precedence-Constrained Winter (PC-Winter) Value, to account for the complex
graph structure. Furthermore, we develop a variety of strategies to address the
computational challenges and enable efficient approximation of PC-Winter.
Extensive experiments demonstrate the effectiveness of PC-Winter across diverse
datasets and tasks.
- Abstract(参考訳): データバリュエーションは、データの価値を定量化し、データ品質を評価し、公正な報酬を決定するのに不可欠である。
既存のデータ評価手法はユークリッドデータの価値評価に有効であることが証明されているが、人気が高まっているグラフ構造化データに適用すると限界に直面している。
特にグラフデータ評価は、ノード間の複雑な依存関係と、価値推定コストの指数的な増加から起因した、ユニークな課題をもたらす。
グラフデータ評価の課題に対処するため,複雑なグラフ構造を考慮し,PC-Winter(Precedence-Constrained Winter)値というイノベーティブなソリューションを考案した。
さらに,計算課題に対処し,pc-winter の効率的な近似を実現するための様々な戦略を考案する。
大規模な実験は、多様なデータセットやタスクにわたるPC-Winterの有効性を示す。
関連論文リスト
- Erase then Rectify: A Training-Free Parameter Editing Approach for Cost-Effective Graph Unlearning [17.85404473268992]
グラフアンラーニングは、訓練されたグラフニューラルネットワーク(GNN)からノード、エッジ、属性の影響を排除することを目的としている。
既存のグラフアンラーニング技術は、しばしば残りのデータに対する追加のトレーニングを必要とし、かなりの計算コストをもたらす。
本稿では,2段階の学習自由アプローチであるETR(Erase then Rectify)を提案する。
論文 参考訳(メタデータ) (2024-09-25T07:20:59Z) - Disentangled Structural and Featural Representation for Task-Agnostic Graph Valuation [9.633110326799992]
我々は、共有ノード置換を用いて売り手と買い手のグラフを整列させる、ブラインドメッセージパッシングと呼ばれる新しいフレームワークを導入する。
次に、データ評価のための買い手と売り手のグラフの偉業的な側面を検討し、それらの統計的類似点と相違点を捉える。
当社のアプローチは、買い手と売り手がお互いのデータセットに気付かないことを保証するものです。
論文 参考訳(メタデータ) (2024-08-22T18:05:41Z) - HGOE: Hybrid External and Internal Graph Outlier Exposure for Graph Out-of-Distribution Detection [78.47008997035158]
グラフデータはより多様性を示すが、摂動に対する堅牢性は低く、外れ値の統合を複雑にする。
我々は、グラフOOD検出性能を改善するために、textbfHybrid外部および内部の textbfGraph textbfOutlier textbfExposure (HGOE) の導入を提案する。
論文 参考訳(メタデータ) (2024-07-31T16:55:18Z) - Neural Dynamic Data Valuation [4.286118155737111]
ニューラルダイナミックデータ評価(NDDV)という最適制御の観点から,新しいデータ評価手法を提案する。
本手法は,データ最適制御状態の感度を用いて,データ評価を正確に識別する理論的解釈を持つ。
さらに,データポイントのユニークな特徴を捉え,データポイントと平均場状態の相互作用による公平性を確保するために,データ再重み付け戦略を実装した。
論文 参考訳(メタデータ) (2024-04-30T13:39:26Z) - Overcoming Pitfalls in Graph Contrastive Learning Evaluation: Toward
Comprehensive Benchmarks [60.82579717007963]
本稿では,グラフコントラスト学習(GCL)手法の有効性,一貫性,全体的な能力をより正確に評価するために,拡張された評価フレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-24T01:47:56Z) - LAVA: Data Valuation without Pre-Specified Learning Algorithms [20.578106028270607]
我々は、下流学習アルゴリズムに不利な方法でトレーニングデータを評価できる新しいフレームワークを導入する。
本研究では,訓練と検証セット間の非伝統的なクラスワイドワッサースタイン距離に基づいて,トレーニングセットに関連する検証性能のプロキシを開発する。
距離は、特定のリプシッツ条件下での任意のモデルに対する検証性能の上限を特徴付けることを示す。
論文 参考訳(メタデータ) (2023-04-28T19:05:16Z) - A Comprehensive Survey of Dataset Distillation [73.15482472726555]
限られた計算能力で無制限に成長するデータを扱うことは困難になっている。
ディープラーニング技術はこの10年で前例のない発展を遂げた。
本稿では,多面的なデータセット蒸留の総合的な理解を提供する。
論文 参考訳(メタデータ) (2023-01-13T15:11:38Z) - Optimizing Data Collection for Machine Learning [87.37252958806856]
現代のディープラーニングシステムは、素晴らしいパフォーマンスを達成するために巨大なデータセットを必要とします。
過度に収集したデータは不要な現在のコストを発生させる一方、過度に収集したデータは将来のコストと遅延を引き起こす可能性がある。
本稿では,データ収集を形式的最適データ収集問題としてモデル化するための新しいパラダイムを提案する。
論文 参考訳(メタデータ) (2022-10-03T21:19:05Z) - How Much More Data Do I Need? Estimating Requirements for Downstream
Tasks [99.44608160188905]
小さなトレーニングデータセットと学習アルゴリズムがあれば、ターゲットの検証やテストのパフォーマンスに到達するのに、どれくらいのデータが必要か?
データ要求を過大評価または過小評価すると、十分な予算で回避できる相当なコストが発生する。
本ガイドラインを用いることで,機械学習システムのデータ要求を正確に推定し,開発時間とデータ取得コストの双方で節約することができる。
論文 参考訳(メタデータ) (2022-07-04T21:16:05Z) - Improving Causal Effect Estimation of Weighted RegressionBased Estimator
using Neural Networks [2.752817022620644]
観測データから因果効果を推定すると、自律システムにおいてどの要因が重要であるかがわかる。
サンプルの非線形および有限性の場合の解の質を改善するニューラルネットワークに基づく推定器を導入する。
論文 参考訳(メタデータ) (2021-10-28T12:52:33Z) - Confounding-Robust Policy Evaluation in Infinite-Horizon Reinforcement
Learning [70.01650994156797]
教育医療などのバッチ強化学習において、観察データからのシーケンシャルな意思決定方針のオフ・アセスメントが必要である。
我々は、ある政策の境界を推定するアプローチを開発する。
より凝縮したデータを集めることで、シャープな境界への収束を証明します。
論文 参考訳(メタデータ) (2020-02-11T16:18:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。