論文の概要: DGPO: RL-Steered Graph Diffusion for Neural Architecture Generation
- arxiv url: http://arxiv.org/abs/2602.19261v1
- Date: Sun, 22 Feb 2026 16:23:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-24 17:42:02.55324
- Title: DGPO: RL-Steered Graph Diffusion for Neural Architecture Generation
- Title(参考訳): DGPO: ニューラルネットワーク生成のためのRL-Steered Graph Diffusion
- Authors: Aleksei Liuliakov, Luca Hermes, Barbara Hammer,
- Abstract要約: グラフ拡散モデルは、エッジ方向が機能意味論を符号化する方向非巡回グラフ(DAG)である。
本稿では、離散グラフ拡散モデルのDAGへの強化学習微調整を拡張したDGPO(Directed Graph Policy Optimization)を提案する。
双方向制御実験は、真に報酬駆動のステアリングを確認し、逆最適化はランダムチャンスに近い精度に達する。
- 参考スコア(独自算出の注目度): 8.06698936038731
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reinforcement learning fine-tuning has proven effective for steering generative diffusion models toward desired properties in image and molecular domains. Graph diffusion models have similarly been applied to combinatorial structure generation, including neural architecture search (NAS). However, neural architectures are directed acyclic graphs (DAGs) where edge direction encodes functional semantics such as data flow-information that existing graph diffusion methods, designed for undirected structures, discard. We propose Directed Graph Policy Optimization (DGPO), which extends reinforcement learning fine-tuning of discrete graph diffusion models to DAGs via topological node ordering and positional encoding. Validated on NAS-Bench-101 and NAS-Bench-201, DGPO matches the benchmark optimum on all three NAS-Bench-201 tasks (91.61%, 73.49%, 46.77%). The central finding is that the model learns transferable structural priors: pretrained on only 7% of the search space, it generates near-oracle architectures after fine-tuning, within 0.32 percentage points of the full-data model and extrapolating 7.3 percentage points beyond its training ceiling. Bidirectional control experiments confirm genuine reward-driven steering, with inverse optimization reaching near random-chance accuracy (9.5%). These results demonstrate that reinforcement learning-steered discrete diffusion, once extended to handle directionality, provides a controllable generative framework for directed combinatorial structures.
- Abstract(参考訳): 強化学習ファインチューニングは、画像および分子領域における所望の特性に対して生成拡散モデルを操る上で有効であることが証明されている。
グラフ拡散モデルは、ニューラルアーキテクチャサーチ(NAS)を含む組合せ構造生成にも適用されている。
しかし、ニューラルネットワークは、エッジ方向が既存のグラフ拡散法が非指向構造のために設計したデータフロー情報などの機能的意味を符号化する非巡回グラフ(DAG)である。
本稿では、離散グラフ拡散モデルの強化学習微調整を、位相ノード順序付けと位置符号化によりDAGに拡張するDGPOを提案する。
NAS-Bench-101とNAS-Bench-201で検証されたDGPOは、NAS-Bench-201の3つのタスク(91.61%、73.49%、46.77%)でベンチマークの最適値と一致する。
サーチスペースの7%しか事前訓練されておらず、微調整後にほぼオーラルなアーキテクチャを生成し、フルデータモデルの0.32ポイント以内で、トレーニング天井を超える7.3ポイントを外挿する。
双方向制御実験では、真に報酬駆動のステアリングが確認され、逆最適化はランダムチャンス精度(9.5%)に近づいた。
これらの結果から, 指向性を扱うために拡張された強化学習による離散拡散は, 有向組合せ構造のための制御可能な生成機構を提供することが示された。
関連論文リスト
- DAFOS: Dynamic Adaptive Fanout Optimization Sampler [3.0232957374216953]
本稿では,モデルの性能に基づいてファンアウトを動的に調整し,トレーニング中に重要なノードを優先する手法を提案する。
3つのベンチマークデータセット(ogbnarxiv、Reddit、ogbn-products)で実施された実験は、我々のアプローチがトレーニングのスピードと精度を大幅に改善することを示した。
論文 参考訳(メタデータ) (2025-07-08T12:25:36Z) - POMONAG: Pareto-Optimal Many-Objective Neural Architecture Generator [4.09225917049674]
Transferable NASが登場し、データセット依存からタスク依存への探索プロセスを一般化した。
本稿では多目的拡散プロセスを通じて拡散NAGを拡張するPOMONAGを紹介する。
結果は、NAS201とMobileNetV3の2つの検索スペースで検証され、15の画像分類データセットで評価された。
論文 参考訳(メタデータ) (2024-09-30T16:05:29Z) - GRASP-GCN: Graph-Shape Prioritization for Neural Architecture Search under Distribution Shifts [39.19675815138566]
本稿では,データ分散シフトに対処する際の予測性能を簡易かつ効率的に向上する手法を提案する。
我々は、ランダムに配線された検索空間上のKronecker-productを利用して、4つの異なるデータセットでトレーニングされたネットワークからなるNASベンチマークを作成する。
一般化能力を向上させるために,ニューラルネットワークの層形状を付加的に入力するグラフ畳み込みネットワークであるGRASP-GCNを提案する。
論文 参考訳(メタデータ) (2024-05-11T12:02:24Z) - FR-NAS: Forward-and-Reverse Graph Predictor for Efficient Neural Architecture Search [10.699485270006601]
ニューラルネットワーク探索のための新しいグラフニューラルネットワーク(GNN)予測器を提案する。
この予測器は、従来のグラフビューと逆グラフビューを組み合わせることで、ニューラルネットワークをベクトル表現に変換する。
実験の結果, 予測精度は3%~16%向上し, 予測精度は有意に向上した。
論文 参考訳(メタデータ) (2024-04-24T03:22:49Z) - Reinforced Genetic Algorithm for Structure-based Drug Design [38.134929249388406]
SBDD(Structure-based drug design)は、疾患関連タンパク質(ターゲット)に結合する分子を見つけることにより、薬物候補を見つけることを目的とした薬物設計である。
本稿では,ニューラルネットワークを用いた遺伝的アルゴリズム(Reinforced Genetic Algorithm, RGA)を提案する。
論文 参考訳(メタデータ) (2022-11-28T22:59:46Z) - EGRC-Net: Embedding-induced Graph Refinement Clustering Network [66.44293190793294]
埋め込みによるグラフリファインメントクラスタリングネットワーク (EGRC-Net) という新しいグラフクラスタリングネットワークを提案する。
EGRC-Netは学習した埋め込みを利用して初期グラフを適応的に洗練し、クラスタリング性能を向上させる。
提案手法はいくつかの最先端手法より一貫して優れている。
論文 参考訳(メタデータ) (2022-11-19T09:08:43Z) - Optimal Propagation for Graph Neural Networks [51.08426265813481]
最適グラフ構造を学習するための二段階最適化手法を提案する。
また、時間的複雑さをさらに軽減するために、低ランク近似モデルについても検討する。
論文 参考訳(メタデータ) (2022-05-06T03:37:00Z) - Robust Optimization as Data Augmentation for Large-scale Graphs [117.2376815614148]
学習中に勾配に基づく逆方向摂動を伴うノード特徴を反復的に拡張するFLAG(Free Large-scale Adversarial Augmentation on Graphs)を提案する。
FLAGはグラフデータに対する汎用的なアプローチであり、ノード分類、リンク予測、グラフ分類タスクで普遍的に機能する。
論文 参考訳(メタデータ) (2020-10-19T21:51:47Z) - Mix Dimension in Poincar\'{e} Geometry for 3D Skeleton-based Action
Recognition [57.98278794950759]
グラフ畳み込みネットワーク(GCN)はすでに、不規則なデータをモデル化する強力な能力を実証している。
本稿では,ポアンカー幾何学を用いて定義した空間時空間GCNアーキテクチャを提案する。
提案手法を,現在最大規模の2つの3次元データセット上で評価する。
論文 参考訳(メタデータ) (2020-07-30T18:23:18Z) - DrNAS: Dirichlet Neural Architecture Search [88.56953713817545]
ディリクレ分布をモデルとした連続緩和型混合重みをランダム変数として扱う。
最近開発されたパスワイズ微分により、ディリクレパラメータは勾配に基づく一般化で容易に最適化できる。
微分可能なNASの大きなメモリ消費を軽減するために, 単純かつ効果的な進行学習方式を提案する。
論文 参考訳(メタデータ) (2020-06-18T08:23:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。