論文の概要: RAC: Rectified Flow Auto Coder
- arxiv url: http://arxiv.org/abs/2603.05925v1
- Date: Fri, 06 Mar 2026 05:38:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-09 13:17:45.109779
- Title: RAC: Rectified Flow Auto Coder
- Title(参考訳): RAC:rectified Flow Auto Coder
- Authors: Sen Fang, Yalin Feng, Yanxin Zhang, Dimitris N. Metaxas,
- Abstract要約: Rectified Flow Auto Coder (RAC)は、従来のVAEを置き換えるために、Rectified Flowにインスパイアされたものだ。
RACは、約70%の計算コストで、再構築と生成の両方でSOTA VAEを上回っている。
- 参考スコア(独自算出の注目度): 28.453565970897646
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose a Rectified Flow Auto Coder (RAC) inspired by Rectified Flow to replace the traditional VAE: 1. It achieves multi-step decoding by applying the decoder to flow timesteps. Its decoding path is straight and correctable, enabling step-by-step refinement. 2. The model inherently supports bidirectional inference, where the decoder serves as the encoder through time reversal (hence Coder rather than encoder or decoder), reducing parameter count by nearly 41%. 3. This generative decoding method improves generation quality since the model can correct latent variables along the path, partially addressing the reconstruction--generation gap. Experiments show that RAC surpasses SOTA VAEs in both reconstruction and generation with approximately 70% lower computational cost.
- Abstract(参考訳): 本稿では,従来のVAEを置き換えるために,Rectified Flow Auto Coder (RAC)を提案する。
1. フロータイムステップにデコーダを適用することでマルチステップデコードを実現する。
その復号経路は直線的で修正可能であり、ステップバイステップの洗練を可能にする。
2. このモデルは本質的に双方向推論をサポートしており、デコーダは時間反転(エンコーダやデコーダではなくコーダを使用する)を通じてエンコーダとして機能し、パラメータ数を約41%削減する。
3 この生成復号法は、モデルが経路に沿って潜伏変数を補正し、部分的に再構成世代間隙に対処するため、生成品質を向上させる。
実験の結果,RAC は SOTA VAE を約70% のコストで上回っていることがわかった。
関連論文リスト
- CoVAE: Consistency Training of Variational Autoencoders [9.358185536754537]
本稿では,一貫性モデルからVAEアーキテクチャをトレーニングするための手法を取り入れた,新しい単一ステージ生成自動符号化フレームワークを提案する。
我々は,CoVAEが学習前の知識を使わずに,高品質なサンプルを1段階ないし数段階で生成できることを実証した。
提案手法は,自動エンコーディングと拡散型生成モデルのための統一的なフレームワークを提供し,一段階の高速自動エンコーディングのための実行可能な経路を提供する。
論文 参考訳(メタデータ) (2025-07-12T01:32:08Z) - Threshold Selection for Iterative Decoding of $(v,w)$-regular Binary Codes [84.0257274213152]
繰り返しビットフリップデコーダは、sparse $(v,w)$-regular符号の効率的な選択である。
閉形式モデルに基づくしきい値決定のための具体的な基準を提案する。
論文 参考訳(メタデータ) (2025-01-23T17:38:22Z) - Epsilon-VAE: Denoising as Visual Decoding [61.29255979767292]
復号化は1段階の再構成から反復的改良へと移行する。
具体的には、デコーダを拡散処理に置き換え、ノイズを反復的に改善して元の画像を復元する。
拡散による反復的再構成により, 自己エンコーダであるEpsilon-VAEは高い再構成品質を実現する。
論文 参考訳(メタデータ) (2024-10-05T08:27:53Z) - Efficient Encoder-Decoder Transformer Decoding for Decomposable Tasks [53.550782959908524]
エンコーダ・デコーダモデルのための新しい構成を導入し、構造化された出力と分解可能なタスクの効率を改善する。
提案手法は,インプットを一度エンコードして並列にデコードすることで,トレーニングと推論の効率を向上する。
論文 参考訳(メタデータ) (2024-03-19T19:27:23Z) - ASR Error Correction with Constrained Decoding on Operation Prediction [8.701142327932484]
本稿では,修正操作の予測を利用したASR誤り訂正手法を提案する。
3つの公開データセットの実験では、デコードプロセスの遅延を低減するための提案手法の有効性が示されている。
論文 参考訳(メタデータ) (2022-08-09T09:59:30Z) - On Sparsifying Encoder Outputs in Sequence-to-Sequence Models [90.58793284654692]
我々はTransformerをテストベッドとして、エンコーダとデコーダの間にあるゲートの層を導入します。
ゲートは、パリシティ誘導L0ペナルティの期待値を用いて正規化される。
このスペーサー化が2つの機械翻訳と2つの要約タスクに与える影響について検討する。
論文 参考訳(メタデータ) (2020-04-24T16:57:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。