論文の概要: Venom: A PyTorch Generative Modeling Toolkit
- arxiv url: http://arxiv.org/abs/2605.17605v1
- Date: Sun, 17 May 2026 19:06:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 23:51:08.389243
- Title: Venom: A PyTorch Generative Modeling Toolkit
- Title(参考訳): Venom: PyTorch生成モデリングツールキット
- Authors: Liang Yan,
- Abstract要約: V ENOMは、統一されたMNISTファーストインタフェースの下で、代表的な生成モデリングファミリを実装している。
このパッケージには、拡散とスコアに基づくモデル、フローマッチングとワンステップジェネレータ、変分オートエンコーダ、正規化フロー、生成的敵ネットワーク、エネルギーベースのモデルが含まれている。
- 参考スコア(独自算出の注目度): 1.7248543886678744
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Modern generative modeling has grown into a broad collection of related but often separately implemented paradigms, including denoising diffusion models, score-based stochastic differential equations, flow matching, variational autoencoders, normalizing flows, adversarial models, and energy-based models. For newcomers, this fragmentation makes it difficult to compare training objectives, inference procedures, sampling algorithms, and conditioning mechanisms within a single coherent codebase. We introduce V ENOM, an educational PyTorch toolkit that implements representative generative modeling families under a unified, MNIST-first interface. V ENOM emphasizes breadth, readability, reproducible entry points, and consistent training and sampling APIs rather than large-scale performance engineering. The package currently includes diffusion and score-based models, flow matching and one-step generators, variational autoencoders, normalizing flows, generative adversarial networks, and energy-based models. It provides separate training and sampling scripts, classifier and classifier-free guidance examples, bilingual tutorial notebooks, and a model-family organization that supports teaching, prototyping, and lightweight benchmarking.
- Abstract(参考訳): 現代の生成モデリングは、拡散モデル、スコアベースの確率微分方程式、フローマッチング、変分オートエンコーダ、正規化フロー、敵モデル、エネルギーベースモデルなど、関連するがしばしば個別に実装されるパラダイムの広範なコレクションに成長してきた。
新参者にとって、この断片化は、単一の一貫性のあるコードベース内のトレーニング目標、推論手順、サンプリングアルゴリズム、条件付けメカニズムを比較するのを難しくする。
我々は,MNISTファーストインタフェースで汎用な生成モデリングファミリを実装した教育用PyTorchツールキットであるV ENOMを紹介する。
V ENOMは、大規模パフォーマンスエンジニアリングではなく、広さ、可読性、再現可能なエントリポイント、一貫性のあるトレーニングとサンプリングAPIを強調している。
このパッケージには、拡散とスコアに基づくモデル、フローマッチングとワンステップジェネレータ、変分オートエンコーダ、正規化フロー、生成的敵ネットワーク、エネルギーベースのモデルが含まれている。
個別のトレーニングとサンプリングスクリプト、分類器と分類器なしガイダンスの例、バイリンガルチュートリアルノート、および教育、プロトタイピング、軽量ベンチマークをサポートするモデルファミリー組織を提供する。
関連論文リスト
- SetFlow: Generating Structured Sets of Representations for Multiple Instance Learning [0.0]
表現空間内で直接、複数のインスタンス学習バッグ全体をモデル化する生成アーキテクチャであるSetFlowを紹介します。
最新のMIL-PF分類パイプラインを用いて,大規模なマンモグラフィーベンチマークでSetFlowを評価する。
論文 参考訳(メタデータ) (2026-03-20T13:29:26Z) - Auto-Regressive Masked Diffusion Models [9.239507801466322]
仮面拡散モデル (MDM) は言語モデリングの有望なアプローチとして登場している。
自動回帰モデル(ARM)と比較してパフォーマンスのギャップがあり、より多くのトレーニングイテレーションが必要です。
本稿では,自己回帰型マスケッド拡散モデルを提案する。これは,自己回帰型モデルのトレーニング効率と,拡散型モデルの並列生成能力を統一するものである。
論文 参考訳(メタデータ) (2026-01-23T18:42:30Z) - Latent Thought Models with Variational Bayes Inference-Time Computation [52.63299874322121]
ラテント思考モデル(LTM)は、ラテント空間における明示的な事前モデルに従う明示的なラテント思考ベクトルを包含する。
LTMは自己回帰モデルや離散拡散モデルよりも優れたサンプルおよびパラメータ効率を示す。
論文 参考訳(メタデータ) (2025-02-03T17:50:34Z) - Improving Fine-Grained Control via Aggregation of Multiple Diffusion Models [7.011853084733679]
本稿では,ネットワークアーキテクチャを微粒化するための新しい学習自由度アルゴリズムを提案する。
このアルゴリズムは、複数の拡散モデルの特徴を特定のモデルに統合し、特定の特徴を活性化し、きめ細かい制御を可能にする。
実験結果から,AMDMはトレーニングなしで微粒化制御を著しく改善し,その有効性が検証された。
論文 参考訳(メタデータ) (2024-10-02T06:16:06Z) - Promises and Pitfalls of Generative Masked Language Modeling: Theoretical Framework and Practical Guidelines [74.42485647685272]
GMLM(Generative Masked Language Models)に焦点を当てる。
我々は,マルコフ連鎖の入力として使用されるマスキングにより,データ分布の条件付き確率に適合するモデルを訓練し,モデルからサンプルを抽出する。
我々は,T5モデルを並列デコーディングに適応させ,最小品質の犠牲を伴って機械翻訳における2~3倍の高速化を実現した。
論文 参考訳(メタデータ) (2024-07-22T18:00:00Z) - Guided Flows for Generative Modeling and Decision Making [55.42634941614435]
その結果,ガイドフローは条件付き画像生成やゼロショット音声合成におけるサンプル品質を著しく向上させることがわかった。
特に、我々は、拡散モデルと比較して、オフライン強化学習設定axスピードアップにおいて、まず、計画生成にフローモデルを適用する。
論文 参考訳(メタデータ) (2023-11-22T15:07:59Z) - Hierarchically branched diffusion models leverage dataset structure for
class-conditional generation [0.6800113478497425]
分岐拡散モデルは従来のモデルと同じ拡散過程に依存するが、階層の各分岐について別々に逆拡散を学ぶ。
いくつかのベンチマークと大規模実世界の科学データセットで分岐拡散モデルを広範囲に評価した。
論文 参考訳(メタデータ) (2022-12-21T05:27:23Z) - Improving Non-autoregressive Generation with Mixup Training [51.61038444990301]
本稿では,事前学習したトランスモデルに基づく非自己回帰生成モデルを提案する。
我々はMIxソースと擬似ターゲットという,シンプルで効果的な反復訓練手法を提案する。
質問生成,要約,パラフレーズ生成を含む3つの世代ベンチマーク実験により,提案手法が新たな最先端結果を実現することを示す。
論文 参考訳(メタデータ) (2021-10-21T13:04:21Z) - Deep Generative Modelling: A Comparative Review of VAEs, GANs,
Normalizing Flows, Energy-Based and Autoregressive Models [7.477211792460795]
ディープジェネレーションモデリングは、ディープニューラルネットワークをトレーニングしてトレーニングサンプルの分布をモデル化するテクニックのクラスです。
このコンペンディウムはエネルギーベースのモデル、変分オートエンコーダ、生成的逆ネットワーク、自己回帰モデル、正規化フローをカバーする。
論文 参考訳(メタデータ) (2021-03-08T17:34:03Z) - Improving the Reconstruction of Disentangled Representation Learners via Multi-Stage Modeling [54.94763543386523]
現在の自己エンコーダに基づく非絡み合い表現学習法は、(集合体)後部をペナルティ化し、潜伏因子の統計的独立を促進することで、非絡み合いを実現する。
本稿では,不整合因子をペナルティに基づく不整合表現学習法を用いて学習する,新しい多段階モデリング手法を提案する。
次に、低品質な再構成を、欠落した関連潜伏変数をモデル化するために訓練された別の深層生成モデルで改善する。
論文 参考訳(メタデータ) (2020-10-25T18:51:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。