Fugu-MT 論文翻訳(概要): Precedence-Constrained Winter Value for Effective Graph Data Valuation

論文の概要: Precedence-Constrained Winter Value for Effective Graph Data Valuation

arxiv url: http://arxiv.org/abs/2402.01943v2
Date: Fri, 8 Mar 2024 13:34:12 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-11 22:47:14.715884
Title: Precedence-Constrained Winter Value for Effective Graph Data Valuation
Title（参考訳）: グラフデータバリュエーションの事前制約付き冬値
Authors: Hongliang Chi, Wei Jin, Charu Aggarwal, Yao Ma
Abstract要約: グラフデータのバリュエーションは、ノード間の複雑な依存関係と、価値推定コストの指数的な増加から起因した、ユニークな課題を導入します。複雑なグラフ構造を考慮した先進制約冬(PC-Winter)値(Precedence-Constrained Winter:PC-Winter)を考案した。さらに、計算課題に対処し、PC-Winterの効率的な近似を可能にするための様々な戦略を開発する。
参考スコア（独自算出の注目度）: 12.58508859361839
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Data valuation is essential for quantifying data's worth, aiding in assessing data quality and determining fair compensation. While existing data valuation methods have proven effective in evaluating the value of Euclidean data, they face limitations when applied to the increasingly popular graph-structured data. Particularly, graph data valuation introduces unique challenges, primarily stemming from the intricate dependencies among nodes and the exponential growth in value estimation costs. To address the challenging problem of graph data valuation, we put forth an innovative solution, Precedence-Constrained Winter (PC-Winter) Value, to account for the complex graph structure. Furthermore, we develop a variety of strategies to address the computational challenges and enable efficient approximation of PC-Winter. Extensive experiments demonstrate the effectiveness of PC-Winter across diverse datasets and tasks.
Abstract（参考訳）: データバリュエーションは、データの価値を定量化し、データ品質を評価し、公正な報酬を決定するのに不可欠である。既存のデータ評価手法はユークリッドデータの価値評価に有効であることが証明されているが、人気が高まっているグラフ構造化データに適用すると限界に直面している。特にグラフデータ評価は、ノード間の複雑な依存関係と、価値推定コストの指数的な増加から起因した、ユニークな課題をもたらす。グラフデータ評価の課題に対処するため,複雑なグラフ構造を考慮し,PC-Winter(Precedence-Constrained Winter)値というイノベーティブなソリューションを考案した。さらに,計算課題に対処し,pc-winter の効率的な近似を実現するための様々な戦略を考案する。大規模な実験は、多様なデータセットやタスクにわたるPC-Winterの有効性を示す。

関連論文リスト

Eigen-Value: Efficient Domain-Robust Data Valuation via Eigenvalue-Based Approach [16.949761208449132]
我々は,OODロバストネスのためのプラグアンドプレイデータアセスメントフレームワークであるEmphEigen-Value (EV)を紹介した。 EVは、IDとOODの間の損失のギャップであるドメインの差を新しいスペクトルで近似する。 EVは、計算的に軽量なまま、現実世界のデータセット間でのOOD堅牢性と安定した価値ランキングの改善を実現している。
論文参考訳（メタデータ） (2025-10-27T15:12:49Z)
Losing is for Cherishing: Data Valuation Based on Machine Unlearning and Shapley Value [18.858879113762917]
我々は、機械学習を利用してデータ値を効率的に推定する新しいフレームワークUnlearning Shapleyを提案する。提案手法は,モンテカルロサンプリングによるシェープリー値の計算を行い,再学習を回避し,全データへの依存を排除した。この作業は、データバリュエーション理論と実践的デプロイメントのギャップを埋め、現代のAIエコシステムにスケーラブルでプライバシに準拠したソリューションを提供する。
論文参考訳（メタデータ） (2025-05-22T02:46:03Z)
DUPRE: Data Utility Prediction for Efficient Data Valuation [49.60564885180563]
Data Shapleyのような協調ゲーム理論に基づくデータ評価では、データユーティリティを評価し、複数のデータサブセットに対してMLモデルを再トレーニングする必要がある。我々のフレームワークである textttDUPRE は、モデル再学習による評価ではなく、データユーティリティを予測することによって、サブセット評価当たりのコストを削減できる代替手法を採用しています。具体的には、いくつかのデータサブセットのデータユーティリティを評価すると、textttDUPREは、他のすべてのデータサブセットの有用性を予測するために、emphGaussianプロセス(GP)回帰モデルに適合する。
論文参考訳（メタデータ） (2025-02-22T08:53:39Z)
Capturing the Temporal Dependence of Training Data Influence [100.91355498124527]
我々は、訓練中にデータポイントを除去する影響を定量化する、軌跡特異的な離脱の影響の概念を定式化する。軌道固有LOOの効率的な近似を可能にする新しい手法であるデータ値埋め込みを提案する。データバリューの埋め込みは、トレーニングデータの順序付けをキャプチャするので、モデルトレーニングのダイナミクスに関する貴重な洞察を提供する。
論文参考訳（メタデータ） (2024-12-12T18:28:55Z)
Erase then Rectify: A Training-Free Parameter Editing Approach for Cost-Effective Graph Unlearning [17.85404473268992]
グラフアンラーニングは、訓練されたグラフニューラルネットワーク(GNN)からノード、エッジ、属性の影響を排除することを目的としている。既存のグラフアンラーニング技術は、しばしば残りのデータに対する追加のトレーニングを必要とし、かなりの計算コストをもたらす。本稿では,2段階の学習自由アプローチであるETR(Erase then Rectify)を提案する。
論文参考訳（メタデータ） (2024-09-25T07:20:59Z)
Disentangled Structural and Featural Representation for Task-Agnostic Graph Valuation [9.633110326799992]
我々は、共有ノード置換を用いて売り手と買い手のグラフを整列させる、ブラインドメッセージパッシングと呼ばれる新しいフレームワークを導入する。次に、データ評価のための買い手と売り手のグラフの偉業的な側面を検討し、それらの統計的類似点と相違点を捉える。当社のアプローチは、買い手と売り手がお互いのデータセットに気付かないことを保証するものです。
論文参考訳（メタデータ） (2024-08-22T18:05:41Z)
HGOE: Hybrid External and Internal Graph Outlier Exposure for Graph Out-of-Distribution Detection [78.47008997035158]
グラフデータはより多様性を示すが、摂動に対する堅牢性は低く、外れ値の統合を複雑にする。我々は、グラフOOD検出性能を改善するために、textbfHybrid外部および内部の textbfGraph textbfOutlier textbfExposure (HGOE) の導入を提案する。
論文参考訳（メタデータ） (2024-07-31T16:55:18Z)
Neural Dynamic Data Valuation [4.286118155737111]
ニューラルダイナミックデータ評価(NDDV)という最適制御の観点から,新しいデータ評価手法を提案する。本手法は,データ最適制御状態の感度を用いて,データ評価を正確に識別する理論的解釈を持つ。さらに,データポイントのユニークな特徴を捉え,データポイントと平均場状態の相互作用による公平性を確保するために,データ再重み付け戦略を実装した。
論文参考訳（メタデータ） (2024-04-30T13:39:26Z)
Overcoming Pitfalls in Graph Contrastive Learning Evaluation: Toward Comprehensive Benchmarks [60.82579717007963]
本稿では,グラフコントラスト学習(GCL)手法の有効性,一貫性,全体的な能力をより正確に評価するために,拡張された評価フレームワークを提案する。
論文参考訳（メタデータ） (2024-02-24T01:47:56Z)
LAVA: Data Valuation without Pre-Specified Learning Algorithms [20.578106028270607]
我々は、下流学習アルゴリズムに不利な方法でトレーニングデータを評価できる新しいフレームワークを導入する。本研究では,訓練と検証セット間の非伝統的なクラスワイドワッサースタイン距離に基づいて,トレーニングセットに関連する検証性能のプロキシを開発する。距離は、特定のリプシッツ条件下での任意のモデルに対する検証性能の上限を特徴付けることを示す。
論文参考訳（メタデータ） (2023-04-28T19:05:16Z)
A Comprehensive Survey of Dataset Distillation [73.15482472726555]
限られた計算能力で無制限に成長するデータを扱うことは困難になっている。ディープラーニング技術はこの10年で前例のない発展を遂げた。本稿では,多面的なデータセット蒸留の総合的な理解を提供する。
論文参考訳（メタデータ） (2023-01-13T15:11:38Z)
Optimizing Data Collection for Machine Learning [87.37252958806856]
現代のディープラーニングシステムは、素晴らしいパフォーマンスを達成するために巨大なデータセットを必要とします。過度に収集したデータは不要な現在のコストを発生させる一方、過度に収集したデータは将来のコストと遅延を引き起こす可能性がある。本稿では,データ収集を形式的最適データ収集問題としてモデル化するための新しいパラダイムを提案する。
論文参考訳（メタデータ） (2022-10-03T21:19:05Z)
How Much More Data Do I Need? Estimating Requirements for Downstream Tasks [99.44608160188905]
小さなトレーニングデータセットと学習アルゴリズムがあれば、ターゲットの検証やテストのパフォーマンスに到達するのに、どれくらいのデータが必要か? データ要求を過大評価または過小評価すると、十分な予算で回避できる相当なコストが発生する。本ガイドラインを用いることで,機械学習システムのデータ要求を正確に推定し,開発時間とデータ取得コストの双方で節約することができる。
論文参考訳（メタデータ） (2022-07-04T21:16:05Z)
Improving Causal Effect Estimation of Weighted RegressionBased Estimator using Neural Networks [2.752817022620644]
観測データから因果効果を推定すると、自律システムにおいてどの要因が重要であるかがわかる。サンプルの非線形および有限性の場合の解の質を改善するニューラルネットワークに基づく推定器を導入する。
論文参考訳（メタデータ） (2021-10-28T12:52:33Z)
Confounding-Robust Policy Evaluation in Infinite-Horizon Reinforcement Learning [70.01650994156797]
教育医療などのバッチ強化学習において、観察データからのシーケンシャルな意思決定方針のオフ・アセスメントが必要である。我々は、ある政策の境界を推定するアプローチを開発する。より凝縮したデータを集めることで、シャープな境界への収束を証明します。
論文参考訳（メタデータ） (2020-02-11T16:18:14Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。