論文の概要: Universal Hypernetworks for Arbitrary Models
- arxiv url: http://arxiv.org/abs/2604.02215v1
- Date: Thu, 02 Apr 2026 16:08:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-03 14:21:10.909639
- Title: Universal Hypernetworks for Arbitrary Models
- Title(参考訳): 任意モデルのためのユニバーサルハイパーネット
- Authors: Xuanfeng Zhou,
- Abstract要約: 本稿では, 決定論的パラメータ, アーキテクチャ, タスク記述子から重みを予測する固定構造生成器であるEmphUniversal Hypernetwork(UHN)を紹介する。
この記述子に基づく定式化は、ジェネレータアーキテクチャをターゲットネットワークパラメータ化から切り離すため、あるジェネレータは異種モデルをインスタンス化することができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Conventional hypernetworks are typically engineered around a specific base-model parameterization, so changing the target architecture often entails redesigning the hypernetwork and retraining it from scratch. We introduce the \emph{Universal Hypernetwork} (UHN), a fixed-architecture generator that predicts weights from deterministic parameter, architecture, and task descriptors. This descriptor-based formulation decouples the generator architecture from target-network parameterization, so one generator can instantiate heterogeneous models across the tested architecture and task families. Our empirical claims are threefold: (1) one fixed UHN remains competitive with direct training across vision, graph, text, and formula-regression benchmarks; (2) the same UHN supports both multi-model generalization within a family and multi-task learning across heterogeneous models; and (3) UHN enables stable recursive generation with up to three intermediate generated UHNs before the final base model. Our code is available at https://github.com/Xuanfeng-Zhou/UHN.
- Abstract(参考訳): 従来のハイパーネットワークは通常、特定のベースモデルパラメータ化を中心に設計されているため、ターゲットアーキテクチャを変更するには、ハイパーネットワークを再設計し、スクラッチから再トレーニングする必要があることが多い。
本稿では, 決定論的パラメータ, アーキテクチャ, タスク記述子から重みを予測する固定構造生成器である \emph{Universal Hypernetwork} (UHN) を紹介する。
この記述子ベースの定式化は、ジェネレータアーキテクチャをターゲットネットワークパラメータ化から切り離し、テストされたアーキテクチャとタスクファミリをまたいだ異種モデルをインスタンス化できる。
1つの固定UHNは、ビジョン、グラフ、テキスト、フォーミュラレグレスベンチマークの直接的なトレーニングと競合し、(2)同じUHNは、家族内のマルチモデル一般化と異種モデル間のマルチタスク学習の両方をサポートし、(3)UHNは、最終ベースモデルの前に最大3つの中間生成されたUHNで安定した再帰生成を可能にする。
私たちのコードはhttps://github.com/Xuanfeng-Zhou/UHN.comで公開されています。
関連論文リスト
- OFA-MAS: One-for-All Multi-Agent System Topology Design based on Mixture-of-Experts Graph Generative Models [57.94189874119267]
マルチエージェントシステム(MAS)は複雑な問題を解決するための強力なパラダイムを提供する。
現在のグラフ学習に基づく設計手法は、しばしば「1対1」のパラダイムに準拠している。
自然言語で記述されたタスクに対して適応的な協調グラフを生成する一対一のフレームワークOFA-TADを提案する。
論文 参考訳(メタデータ) (2026-01-19T12:23:44Z) - UniX: Unifying Autoregression and Diffusion for Chest X-Ray Understanding and Generation [98.93314262366681]
胸部X線理解・生成のための次世代統合医療基盤モデルUniXについて述べる。
UniXは2つのタスクを、理解のための自己回帰分岐と高忠実度生成のための拡散分岐に分離する。
2つの代表的なベンチマークでは、Unixは46.1%の性能向上と24.2%の世代品質向上を実現している。
論文 参考訳(メタデータ) (2026-01-16T18:59:58Z) - Gated Associative Memory: A Parallel O(N) Architecture for Efficient Sequence Modeling [0.0]
Gated Associative Memory (GAM) ネットワークは、シーケンスモデリングのための新しい完全に並列なアーキテクチャである。
我々はGAMをゼロから実装し、標準的なトランスフォーマーモデルと現代的な線形時間ベースラインに対して厳密な比較分析を行う。
我々の実験は、GAMは一貫して高速で、トレーニング速度のベースラインの両方を上回り、全てのデータセットで優れた、または競争力のある最終バリデーションの難しさを達成できることを示した。
論文 参考訳(メタデータ) (2025-08-30T20:59:46Z) - Instruction-Guided Autoregressive Neural Network Parameter Generation [49.800239140036496]
本稿では,多種多様なタスクやアーキテクチャにまたがるパラメータ合成を統一する自動回帰フレームワークIGPGを提案する。
ニューラルネットワーク重みのトークンを自動回帰的に生成することにより、IGPGは層間コヒーレンスを確保し、モデルとデータセット間の効率的な適応を可能にする。
複数のデータセットの実験により、IGPGは様々な事前訓練されたモデルを単一の柔軟な生成フレームワークに統合することを示した。
論文 参考訳(メタデータ) (2025-04-02T05:50:19Z) - HybridNet: Dual-Branch Fusion of Geometrical and Topological Views for
VLSI Congestion Prediction [5.6934255257494]
本稿では,回路のトポロジ的特徴と幾何学的特徴を包含する新しい手法を提案する。
本稿では,各経路に異なるエンコーダ層を配置し,複雑な融合戦略で表現を集約するデュアルブランチネットワークを提案する。
われわれのネットワークであるHybridNetは、セルの幾何学的相互作用を捉えるための単純かつ効果的な方法を提供するだけでなく、ネットリストにおける元のトポロジ的関係も保存する。
論文 参考訳(メタデータ) (2023-05-07T15:02:02Z) - HKNAS: Classification of Hyperspectral Imagery Based on Hyper Kernel
Neural Architecture Search [104.45426861115972]
設計したハイパーカーネルを利用して,構造パラメータを直接生成することを提案する。
我々は1次元または3次元の畳み込みを伴う画素レベルの分類と画像レベルの分類を別々に行う3種類のネットワークを得る。
6つの公開データセットに関する一連の実験は、提案手法が最先端の結果を得ることを示した。
論文 参考訳(メタデータ) (2023-04-23T17:27:40Z) - DepGraph: Towards Any Structural Pruning [68.40343338847664]
我々は、CNN、RNN、GNN、Transformersのような任意のアーキテクチャの一般的な構造解析について研究する。
本稿では,階層間の依存関係を明示的にモデル化し,包括的にグループ化してプルーニングを行う汎用かつ完全自動な手法であるemphDependency Graph(DepGraph)を提案する。
本研究では,画像用ResNe(X)t,DenseNet,MobileNet,Vision Transformer,グラフ用GAT,3Dポイントクラウド用DGCNN,言語用LSTMなど,さまざまなアーキテクチャやタスクに関する手法を広範囲に評価し,言語用LSTMと並行して示す。
論文 参考訳(メタデータ) (2023-01-30T14:02:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。