論文の概要: Vertical Validation: Evaluating Implicit Generative Models for Graphs on Thin Support Regions
- arxiv url: http://arxiv.org/abs/2411.13358v1
- Date: Wed, 20 Nov 2024 14:29:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-21 16:10:15.045016
- Title: Vertical Validation: Evaluating Implicit Generative Models for Graphs on Thin Support Regions
- Title(参考訳): 鉛直検証:薄型支持領域におけるグラフの暗黙生成モデルの評価
- Authors: Mai Elkady, Thu Bui, Bruno Ribeiro, David I. Inouye,
- Abstract要約: 暗黙のグラフ生成モデルは、医薬品や材料設計のための新しい分子を設計または発見するために用いられる。
暗黙グラフ生成モデルの事前評価手法は、厚い支持から計算された統計の検証に重点を置いている。
Vertical Validation (VV) と呼ばれる新しい評価手法は, 試験分割処理中に薄い支持領域を生成し, 保持試験データと比較できるように, 生成したサンプルを再重み付けする。
- 参考スコア(独自算出の注目度): 13.855320245662194
- License:
- Abstract: There has been a growing excitement that implicit graph generative models could be used to design or discover new molecules for medicine or material design. Because these molecules have not been discovered, they naturally lie in unexplored or scarcely supported regions of the distribution of known molecules. However, prior evaluation methods for implicit graph generative models have focused on validating statistics computed from the thick support (e.g., mean and variance of a graph property). Therefore, there is a mismatch between the goal of generating novel graphs and the evaluation methods. To address this evaluation gap, we design a novel evaluation method called Vertical Validation (VV) that systematically creates thin support regions during the train-test splitting procedure and then reweights generated samples so that they can be compared to the held-out test data. This procedure can be seen as a generalization of the standard train-test procedure except that the splits are dependent on sample features. We demonstrate that our method can be used to perform model selection if performance on thin support regions is the desired goal. As a side benefit, we also show that our approach can better detect overfitting as exemplified by memorization.
- Abstract(参考訳): 暗黙のグラフ生成モデルが、医薬品や材料設計のための新しい分子の設計や発見に利用できるという興奮が高まっている。
これらの分子は発見されていないため、既知の分子の分布の未発見領域やほとんど支持されていない領域に自然に存在する。
しかし, 暗黙グラフ生成モデルの事前評価手法は, グラフ特性の平均値と分散値など) から計算した統計量の検証に重点を置いている。
そのため,新たなグラフ生成の目標と評価方法との間にはミスマッチがある。
この評価ギャップに対処するため,本手法では,列車のスプリッティング手順中に薄型支持領域を体系的に生成し,保持試験データと比較できるように生成したサンプルを再重み付けする,VV (Vertical Validation) と呼ばれる新しい評価手法を設計する。
この手順は、分割がサンプルの特徴に依存することを除いて、標準の列車試験手順の一般化と見なすことができる。
本手法は, 薄型サポート領域の性能が望ましい目標である場合, モデル選択に利用できることを示す。
副次的な利点として,本手法は暗記によって示される過度な適合を検出できることを示す。
関連論文リスト
- A Survey on Deep Learning-based Gaze Direction Regression: Searching for the State-of-the-art [0.0]
本稿では,頭部・眼像からの視線方向ベクトルの回帰に対する深層学習に基づく手法について検討する。
本稿では、入力データ、モデルのアーキテクチャ、モデルの監視に使用される損失関数に焦点をあてた、多数の公開手法について詳述する。
本稿では、視線方向回帰法を訓練し、評価するために使用できるデータセットのリストを示す。
論文 参考訳(メタデータ) (2024-10-22T15:07:07Z) - Optimizing OOD Detection in Molecular Graphs: A Novel Approach with Diffusion Models [71.39421638547164]
本稿では,入力分子と再構成グラフの類似性を比較する補助拡散モデルに基づくフレームワークを用いてOOD分子を検出することを提案する。
IDトレーニングサンプルの再構成に向けた生成バイアスのため、OOD分子の類似度スコアは検出を容易にするためにはるかに低い。
本研究は,PGR-MOOD(PGR-MOOD)とよばれる分子OOD検出のためのプロトタイプグラフ再構成のアプローチを開拓し,3つのイノベーションを生かした。
論文 参考訳(メタデータ) (2024-04-24T03:25:53Z) - False Discovery Rate Control for Gaussian Graphical Models via
Neighborhood Screening [1.7924920920347915]
グラフ学習におけるノードワイズ変数の選択手法を導入し、選択したエッジセットの誤り発見率を自己推定レベルで確実に制御する。
個々の近傍の新たな融合法は、無向グラフ推定を出力する。
論文 参考訳(メタデータ) (2024-01-18T13:46:41Z) - Projection Regret: Reducing Background Bias for Novelty Detection via
Diffusion Models [72.07462371883501]
本研究では,非意味情報のバイアスを緩和する効率的な新規性検出手法であるemphProjection Regret(PR)を提案する。
PRは、テスト画像とその拡散ベースの投影の間の知覚距離を計算し、異常を検出する。
拡張実験により、PRは生成モデルに基づく新規性検出手法の先行技術よりも有意なマージンで優れていることが示された。
論文 参考訳(メタデータ) (2023-12-05T09:44:47Z) - Fake It Till You Make It: Near-Distribution Novelty Detection by
Score-Based Generative Models [54.182955830194445]
既存のモデルは、いわゆる"近く分布"設定で失敗するか、劇的な低下に直面します。
本稿では, スコアに基づく生成モデルを用いて, 合成近分布異常データを生成することを提案する。
本手法は,9つのノベルティ検出ベンチマークにおいて,近分布ノベルティ検出を6%改善し,最先端のノベルティ検出を1%から5%パスする。
論文 参考訳(メタデータ) (2022-05-28T02:02:53Z) - Score-based Generative Modeling of Graphs via the System of Stochastic
Differential Equations [57.15855198512551]
本稿では,連続時間フレームワークを用いたグラフのスコアベース生成モデルを提案する。
本手法は, トレーニング分布に近い分子を生成できるが, 化学価数則に違反しないことを示す。
論文 参考訳(メタデータ) (2022-02-05T08:21:04Z) - Right for the Right Latent Factors: Debiasing Generative Models via
Disentanglement [20.41752850243945]
統計機械学習手法の主要な前提は、テスト時に遭遇したデータの分布から独立したサンプルにアクセスすることである。
特に、機械学習モデルは、Clever-Hansのような振る舞いを示すことが示されている。
本稿では,人的フィードバックによって達成される内部表現を解消し,生成モデルをデバイアス化する手法を提案する。
論文 参考訳(メタデータ) (2022-02-01T13:16:18Z) - Sampling from Arbitrary Functions via PSD Models [55.41644538483948]
まず確率分布をモデル化し,そのモデルからサンプリングする。
これらのモデルでは, 少数の評価値を用いて, 高精度に多数の密度を近似することが可能であることが示され, それらのモデルから効果的にサンプルする簡単なアルゴリズムが提示される。
論文 参考訳(メタデータ) (2021-10-20T12:25:22Z) - Goal-directed Generation of Discrete Structures with Conditional
Generative Models [85.51463588099556]
本稿では,強化学習目標を直接最適化し,期待される報酬を最大化するための新しいアプローチを提案する。
提案手法は、ユーザ定義プロパティを持つ分子の生成と、所定の目標値を評価する短いピソン表現の同定という2つのタスクで検証する。
論文 参考訳(メタデータ) (2020-10-05T20:03:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。