Fugu-MT 論文翻訳(概要): Argmax Flows and Multinomial Diffusion: Towards Non-Autoregressive Language Models

論文の概要: Argmax Flows and Multinomial Diffusion: Towards Non-Autoregressive Language Models

arxiv url: http://arxiv.org/abs/2102.05379v1
Date: Wed, 10 Feb 2021 11:04:17 GMT
ステータス: 翻訳完了
システム内更新日: 2021-02-11 14:54:29.201236
Title: Argmax Flows and Multinomial Diffusion: Towards Non-Autoregressive Language Models
Title（参考訳）: Argmaxフローと多項拡散:非自己回帰言語モデルに向けて
Authors: Emiel Hoogeboom, Didrik Nielsen, Priyank Jaini, Patrick Forr\'e, Max Welling
Abstract要約: 本稿では,Argmax FlowsとMultinomial Diffusionの2種類の分類モデルを提案する。画像分割マップの言語モデリングとモデリングにおいて,我々のモデルが競合的に機能することを実証する。
参考スコア（独自算出の注目度）: 76.22217735434661
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The field of language modelling has been largely dominated by autoregressive models, for which sampling is inherently difficult to parallelize. This paper introduces two new classes of generative models for categorical data such as language or image segmentation: Argmax Flows and Multinomial Diffusion. Argmax Flows are defined by a composition of a continuous distribution (such as a normalizing flow), and an argmax function. To optimize this model, we learn a probabilistic inverse for the argmax that lifts the categorical data to a continuous space. Multinomial Diffusion gradually adds categorical noise in a diffusion process, for which the generative denoising process is learned. We demonstrate that our models perform competitively on language modelling and modelling of image segmentation maps.
Abstract（参考訳）: 言語モデリングの分野は主に自己回帰モデルによって支配されており、サンプリングは本質的に並列化が難しい。本稿では,Argmax FlowsとMultinomial Diffusionという,言語やイメージセグメンテーションなどのカテゴリデータ生成モデルの2つの新しいクラスを紹介した。 Argmax Flowは(正規化フローのような)連続分布とargmax関数の合成によって定義される。このモデルを最適化するために、分類データを連続空間に持ち上げるargmaxの確率的逆法を学習する。多項拡散は拡散過程においてカテゴリーノイズを徐々に加え、生成的復調過程が学習される。画像セグメンテーションマップの言語モデルとモデル上で,我々のモデルが競争力を発揮できることを実証する。

関連論文リスト

Diffusion models for multivariate subsurface generation and efficient probabilistic inversion [0.0]
拡散モデルは、深い生成モデリングタスクのための安定したトレーニングと最先端のパフォーマンスを提供する。本稿では拡散モデルに固有のノイズ汚染を考慮した近似法を提案する。統計的ロバスト性は有意に向上し, 後部確率密度関数のサンプリングが向上した。
論文参考訳（メタデータ） (2025-07-21T17:10:16Z)
Continuous Diffusion Model for Language Modeling [57.396578974401734]
離散データに対する既存の連続拡散モデルは、離散的アプローチと比較して性能が限られている。本稿では,下層の分類分布の幾何学を組み込んだ言語モデリングのための連続拡散モデルを提案する。
論文参考訳（メタデータ） (2025-02-17T08:54:29Z)
Autoregressive Image Generation without Vector Quantization [31.798754606008067]
従来の知恵では、画像生成のための自己回帰モデルは一般にベクトル量子化トークンを伴っている。本研究では,拡散法を用いて確率分布の確率分布をモデル化し,連続値空間に自己回帰モデルを適用することを提案する。
論文参考訳（メタデータ） (2024-06-17T17:59:58Z)
Glauber Generative Model: Discrete Diffusion Models via Binary Classification [21.816933208895843]
離散拡散モデルの新しいクラスであるグラウバー生成モデル(GGM)を紹介する。 GGMはマルコフ連鎖を展開させ、離散トークンの共分散からサンプルにノイズトークンの列を分解する。言語生成や画像生成において,既存の離散拡散モデルよりも優れていることを示す。
論文参考訳（メタデータ） (2024-05-27T10:42:13Z)
FreeSeg-Diff: Training-Free Open-Vocabulary Segmentation with Diffusion Models [56.71672127740099]
我々は,閉鎖語彙データセットのトレーニングモデルによって伝統的に解決されるイメージセグメンテーションの課題に焦点をあてる。我々は、ゼロショットのオープン語彙セグメンテーションのために、異なる、比較的小さなオープンソース基盤モデルを活用している。当社のアプローチ(別名FreeSeg-Diff)は、トレーニングに依存しないもので、Pascal VOCとCOCOデータセットの両方で多くのトレーニングベースのアプローチより優れています。
論文参考訳（メタデータ） (2024-03-29T10:38:25Z)
Likelihood-Based Diffusion Language Models [13.916640262862215]
自己回帰型言語モデルと拡散型言語モデルとのギャップを埋める第一歩を踏み出す。我々は、アルゴリズムの改善、法則のスケーリング、計算量の増加を通じて、この目標を追求する。我々はGPT-2 124Mをベンチマークデータセットで上回る大きな拡散言語モデルであるPlaid 1Bをリリースする。
論文参考訳（メタデータ） (2023-05-30T16:43:31Z)
Your Diffusion Model is Secretly a Zero-Shot Classifier [90.40799216880342]
大規模テキスト・画像拡散モデルからの密度推定をゼロショット分類に活用できることを示す。分類に対する我々の生成的アプローチは、様々なベンチマークで強い結果が得られる。我々の結果は、下流タスクにおける差別的モデルよりも生成的な利用に向けての一歩である。
論文参考訳（メタデータ） (2023-03-28T17:59:56Z)
Score-based Continuous-time Discrete Diffusion Models [102.65769839899315]
連続時間マルコフ連鎖を介して逆過程が認知されるマルコフジャンププロセスを導入することにより、拡散モデルを離散変数に拡張する。条件境界分布の単純なマッチングにより、偏りのない推定器が得られることを示す。提案手法の有効性を,合成および実世界の音楽と画像のベンチマークで示す。
論文参考訳（メタデータ） (2022-11-30T05:33:29Z)
OCD: Learning to Overfit with Conditional Diffusion Models [95.1828574518325]
入力サンプルxに重みを条件付けした動的モデルを提案する。基本モデルを x とそのラベル y 上で微調整することで得られる重みに一致することを学習する。
論文参考訳（メタデータ） (2022-10-02T09:42:47Z)
Cold Diffusion: Inverting Arbitrary Image Transforms Without Noise [52.59444045853966]
画像劣化の選択を変更すれば,生成モデル全体のファミリを構築することができることを示す。完全な決定論的モデルの成功は、拡散モデルに対するコミュニティの理解に疑問を投げかける。
論文参考訳（メタデータ） (2022-08-19T15:18:39Z)
Structured Denoising Diffusion Models in Discrete State-Spaces [15.488176444698404]
本稿では離散化拡散確率モデル(D3PM)を離散データに適用する。遷移行列の選択は、画像およびテキスト領域における結果の改善につながる重要な設計決定である。テキストでは、このモデルクラスは、LM1B上の大きな語彙にスケールしながら、文字レベルのテキスト生成に強い結果をもたらす。
論文参考訳（メタデータ） (2021-07-07T04:11:00Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。