論文の概要: Sequential Data Generation with Groupwise Diffusion Process
- arxiv url: http://arxiv.org/abs/2310.01400v1
- Date: Mon, 2 Oct 2023 17:58:47 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-04 20:19:14.141196
- Title: Sequential Data Generation with Groupwise Diffusion Process
- Title(参考訳): グループ拡散プロセスを用いた逐次データ生成
- Authors: Sangyun Lee, Gayoung Lee, Hyunsu Kim, Junho Kim, Youngjung Uh
- Abstract要約: グループワイド拡散モデル(GDM)は、1つのグループから1つの時間間隔で順次データを生成する。
拡散モデルの拡張として、GDMはある種の自己回帰モデルとカスケード拡散モデルを一般化する。
- 参考スコア(独自算出の注目度): 24.664800903343462
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We present the Groupwise Diffusion Model (GDM), which divides data into
multiple groups and diffuses one group at one time interval in the forward
diffusion process. GDM generates data sequentially from one group at one time
interval, leading to several interesting properties. First, as an extension of
diffusion models, GDM generalizes certain forms of autoregressive models and
cascaded diffusion models. As a unified framework, GDM allows us to investigate
design choices that have been overlooked in previous works, such as
data-grouping strategy and order of generation. Furthermore, since one group of
the initial noise affects only a certain group of the generated data, latent
space now possesses group-wise interpretable meaning. We can further extend GDM
to the frequency domain where the forward process sequentially diffuses each
group of frequency components. Dividing the frequency bands of the data as
groups allows the latent variables to become a hierarchical representation
where individual groups encode data at different levels of abstraction. We
demonstrate several applications of such representation including
disentanglement of semantic attributes, image editing, and generating
variations.
- Abstract(参考訳): 本稿では,データを複数のグループに分け,1つのグループを1つの時間間隔で拡散する群分割拡散モデル(gdm)を提案する。
GDMは1つのグループから1つの間隔で連続的にデータを生成し、いくつかの興味深い特性をもたらす。
まず、拡散モデルの拡張として、GDMはある種の自己回帰モデルとカスケード拡散モデルを一般化する。
統一されたフレームワークとして、GDMは、データグループ化戦略や生成順序など、これまで見過ごされてきた設計選択を調査できる。
さらに、初期雑音の一群が生成されたデータのあるグループのみに影響を与えるため、潜在空間はグループごとに解釈可能な意味を持っている。
さらに、前処理が各周波数成分群を逐次拡散させる周波数領域にGDMを拡張できる。
データの周波数帯域をグループとして分割することで、潜在変数は階層的な表現となり、個々のグループが異なる抽象レベルでデータをエンコードする。
意味属性の絡み合い,画像編集,バリエーション生成など,このような表現の応用例をいくつか紹介する。
関連論文リスト
- The Research of Group Re-identification from Multiple Cameras [0.4955551943523977]
グループ再識別は、従来の再識別タスクにおいて、視点や人間のポーズのバリエーションによって妨げられているだけでなく、非常に難しい。
本稿では,グループ内の多粒度情報を活用してグループ再同定を容易にする手法を提案する。
論文 参考訳(メタデータ) (2024-07-19T18:28:13Z) - DGCformer: Deep Graph Clustering Transformer for Multivariate Time Series Forecasting [16.081071155397186]
本稿では,多変量時系列予測のためのDeep Graph Clustering Transformer (DGCformer)を提案する。
まず、これらの関連する変数をオートエンコーダと統合されたグラフ畳み込みネットワークでグループ化し、その後、以前のラスタマスクによる自己保持機構を検討する。
論文 参考訳(メタデータ) (2024-05-14T09:01:33Z) - Redefining Event Types and Group Evolution in Temporal Data [0.16385815610837165]
時間的データにおいて、集団進化を特徴づける主要なアプローチは、出来事の特定を通じてである」。
我々は事象をアーチェタイプとして考える」とは、我々がファセット・エクセレミティ(facet extremities)と呼ぶ定量的次元のユニークな組み合わせによって特徴づけられる。
本フレームワークは,複数の対面インタラクションデータセットからグループを進化させ,よりリッチで信頼性の高いグループダイナミクスのキャラクタリゼーションを可能にする。
論文 参考訳(メタデータ) (2024-03-11T14:39:24Z) - DGInStyle: Domain-Generalizable Semantic Segmentation with Image Diffusion Models and Stylized Semantic Control [68.14798033899955]
大規模で事前訓練された潜伏拡散モデル(LDM)は、創造的コンテンツを生成できる異常な能力を示した。
しかし、それらは例えば、セマンティックセグメンテーションのような知覚スタックのタスクを改善するために、大規模なデータジェネレータとして使用できますか?
自律運転の文脈でこの疑問を考察し、「はい」という言い換えで答える。
論文 参考訳(メタデータ) (2023-12-05T18:34:12Z) - Unified and Dynamic Graph for Temporal Character Grouping in Long Videos [31.192044026127032]
ビデオ時間的キャラクタグループ化は、ビデオ内の主要なキャラクタの出現モーメントを、そのアイデンティティに応じて特定する。
最近の研究は、教師なしクラスタリングからグラフベースのクラスタリングへと進化してきた。
時間的文字グループ化のための統一動的グラフ(UniDG)フレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-27T13:22:55Z) - GADformer: A Transparent Transformer Model for Group Anomaly Detection on Trajectories [0.9971221656644376]
グループ異常検出(GAD)は、個々のメンバーが異常ではない場合の異常なパターンを特定する。
本稿では,非教師付きおよび半教師付き設定におけるトラジェクトリ上での注意駆動型GADモデルであるGADformerを紹介する。
また,Block-Attention-anomaly-Score (BAS)を導入し,注意パターンを評価することでモデルの透明性を高める。
論文 参考訳(メタデータ) (2023-03-17T08:49:09Z) - Consistency and Diversity induced Human Motion Segmentation [231.36289425663702]
本稿では,CDMS(Consistency and Diversity induced Human Motion)アルゴリズムを提案する。
我々のモデルは、ソースとターゲットデータを異なる多層特徴空間に分解する。
ソースとターゲットデータ間の領域ギャップを低減するために、マルチミューチュアル学習戦略を実行する。
論文 参考訳(メタデータ) (2022-02-10T06:23:56Z) - Learning Multi-Attention Context Graph for Group-Based Re-Identification [214.84551361855443]
オーバーラップしていないカメラシステムを介して人々のグループを再識別または取得することを学ぶことは、ビデオ監視において重要なアプリケーションです。
本研究では,グループre-idというグループを識別するためのコンテキスト情報の利用を検討する。
本研究では,グループベースリドタスクを同時に処理するグラフニューラルネットワークに基づく新しい統合フレームワークを提案する。
論文 参考訳(メタデータ) (2021-04-29T09:57:47Z) - Graph Gamma Process Generalized Linear Dynamical Systems [60.467040479276704]
実マルチ変数時系列をモデル化するために,グラフガンマ過程(GGP)線形力学系を導入する。
時間的パターン発見のために、モデルの下での潜在表現は、時系列を多変量部分列の同相集合に分解するために使用される。
非零次ノード数が有限であるランダムグラフを用いて、潜時状態遷移行列の空間パターンと次元の両方を定義する。
論文 参考訳(メタデータ) (2020-07-25T04:16:34Z) - Ensemble Model with Batch Spectral Regularization and Data Blending for
Cross-Domain Few-Shot Learning with Unlabeled Data [75.94147344921355]
多様な特徴変換行列を用いてマルチブランチアンサンブルフレームワークを構築する。
本研究では,未ラベルデータを利用したデータブレンディング手法を提案し,対象領域におけるスパースサポートを増強する。
論文 参考訳(メタデータ) (2020-06-08T02:27:34Z) - Semantically Multi-modal Image Synthesis [58.87967932525891]
セマンティックなマルチモーダル画像合成(SMIS)タスク、すなわちセマンティックレベルでのマルチモーダル画像の生成に焦点を当てる。
本稿では,ジェネレータ内のグループ畳み込みを利用して,デコーダ内のグループ畳み込み数を徐々に減少させるグループ除算ネットワーク(GroupDNet)を提案する。
GroupDNetは、セマンティックラベルを自然なイメージに翻訳する上で、はるかに制御性が高く、多くのクラスを持つデータセットに対して、高い品質の収量を持つ。
論文 参考訳(メタデータ) (2020-03-28T04:03:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。