論文の概要: Positional Diffusion: Ordering Unordered Sets with Diffusion
Probabilistic Models
- arxiv url: http://arxiv.org/abs/2303.11120v1
- Date: Mon, 20 Mar 2023 14:01:01 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-21 15:18:39.836604
- Title: Positional Diffusion: Ordering Unordered Sets with Diffusion
Probabilistic Models
- Title(参考訳): 位置拡散:拡散確率モデルによる非順序集合の順序付け
- Authors: Francesco Giuliari, Gianluca Scarpellini, Stuart James, Yiming Wang,
Alessio Del Bue
- Abstract要約: 拡散確率モデルを用いたプラグ・アンド・プレイグラフの定式化を行う。
前方プロセスを用いて、集合内の要素の位置を連続空間内のランダムな位置にマッピングする。
位置拡散は、ノイズ発生過程を逆転させ、アテンションベースのグラフニューラルネットワークを通じて元の位置を復元する。
- 参考スコア(独自算出の注目度): 32.63654140960086
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Positional reasoning is the process of ordering unsorted parts contained in a
set into a consistent structure. We present Positional Diffusion, a
plug-and-play graph formulation with Diffusion Probabilistic Models to address
positional reasoning. We use the forward process to map elements' positions in
a set to random positions in a continuous space. Positional Diffusion learns to
reverse the noising process and recover the original positions through an
Attention-based Graph Neural Network. We conduct extensive experiments with
benchmark datasets including two puzzle datasets, three sentence ordering
datasets, and one visual storytelling dataset, demonstrating that our method
outperforms long-lasting research on puzzle solving with up to +18% compared to
the second-best deep learning method, and performs on par against the
state-of-the-art methods on sentence ordering and visual storytelling. Our work
highlights the suitability of diffusion models for ordering problems and
proposes a novel formulation and method for solving various ordering tasks.
Project website at https://iit-pavis.github.io/Positional_Diffusion/
- Abstract(参考訳): 位置推論は、集合に含まれる非ソート部品を一貫した構造に並べる過程である。
そこで我々はDiffusion Probabilistic Models を用いたプラグアンドプレイグラフの定式化である positional Diffusion を提案する。
我々は、要素の位置を連続空間内のランダムな位置にマッピングするためにフォワードプロセスを使用する。
位置拡散は、ノイズ発生過程を逆転させ、アテンションベースのグラフニューラルネットワークを通じて元の位置を復元する。
2つのパズルデータセット、3つの文順序データセット、1つのビジュアルストーリーテリングデータセットを含むベンチマークデータセットを用いて広範な実験を行い、我々の手法が2番目に高い深層学習法に比べて最大18%のパズル解の長期的研究を上回り、文順序付けとビジュアルストーリーテリングの最先端手法と同等に実行することを示した。
本研究は, 注文問題に対する拡散モデルの適用性を強調し, 様々な順序課題を解くための新しい定式化と方法を提案する。
Project website at https://iit-pavis.github.io/Positional_Diffusion/
関連論文リスト
- TabDiff: a Mixed-type Diffusion Model for Tabular Data Generation [91.50296404732902]
グラフデータの混合型分布を1つのモデルでモデル化する共同拡散フレームワークであるTabDiffを紹介する。
我々の重要な革新は、数値データと分類データのための連立連続時間拡散プロセスの開発である。
TabDiffは、既存の競合ベースラインよりも優れた平均性能を実現し、ペアワイドカラム相関推定における最先端モデルよりも最大で22.5%改善されている。
論文 参考訳(メタデータ) (2024-10-27T22:58:47Z) - Modeling Layout Reading Order as Ordering Relations for Visually-rich Document Understanding [33.96748793247162]
本稿では,レイアウト要素の集合上の順序関係としてレイアウト読み込み順序をモデル化する。
レイアウト読み出し順序の改善型の導入による実用的利点を強調するため, 読み出し順序対応型パイプラインを提案する。
論文 参考訳(メタデータ) (2024-09-29T12:00:57Z) - PoseDiffusion: Solving Pose Estimation via Diffusion-aided Bundle
Adjustment [21.98302129015761]
本稿では,確率的拡散フレームワーク内での運動構造(SfM)問題を定式化することを提案する。
本稿では,従来のSfMパイプラインよりもPoseDiffusionが大幅に改善されていることを示す。
本手法は,さらなるトレーニングを行なわずにデータセットをまたいで一般化できることが観察された。
論文 参考訳(メタデータ) (2023-06-27T17:59:07Z) - ReorientDiff: Diffusion Model based Reorientation for Object
Manipulation [18.95498618397922]
望ましい設定でオブジェクトを操作できることは、ロボットが様々な実践的な応用を完了するための基本的な要件である。
本稿では,拡散モデルに基づく手法を用いたリオリエンテーション計画手法であるReorientDiffを提案する。
提案手法は,YCBオブジェクトの集合と吸引グリップを用いて評価し,95.2%のシミュレーション成功率を示す。
論文 参考訳(メタデータ) (2023-02-28T00:08:38Z) - PuzzleFusion: Unleashing the Power of Diffusion Models for Spatial
Puzzle Solving [17.781484376483707]
本稿では,空間パズル解決のための拡散モデルに基づくエンドツーエンドのニューラルネットワークアーキテクチャを提案する。
驚くべき発見は、拡散モデルを用いることで、条件生成プロセスとしてこれらの困難な空間パズルタスクを効果的に解決できるということである。
エンド・ツー・エンドのニューラル・システムの学習を可能にするため,本論文では,地軸配置による新しいデータセットを提案する。
論文 参考訳(メタデータ) (2022-11-24T20:06:11Z) - Reinforcement Learning Based Query Vertex Ordering Model for Subgraph
Matching [58.39970828272366]
グラフマッチングアルゴリズムは、クエリグラフの埋め込みをデータグラフGに列挙する。
マッチング順序は、これらのバックトラックに基づくサブグラフマッチングアルゴリズムの時間効率において重要な役割を果たす。
本稿では,Reinforcement Learning (RL) と Graph Neural Networks (GNN) 技術を適用して,グラフマッチングアルゴリズムの高品質なマッチング順序を生成する。
論文 参考訳(メタデータ) (2022-01-25T00:10:03Z) - Auto-weighted Multi-view Feature Selection with Graph Optimization [90.26124046530319]
グラフ学習に基づく新しい教師なしマルチビュー特徴選択モデルを提案する。
1) 特徴選択過程において, 異なる視点で共有されたコンセンサス類似度グラフが学習される。
各種データセットを用いた実験により,提案手法が最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-04-11T03:25:25Z) - Rethinking Positional Encoding in Language Pre-training [111.2320727291926]
絶対的な位置符号化では、位置埋め込みと単語埋め込みに適用される付加操作が混合相関をもたらすことを示す。
我々はtextbfUntied textPositional textbfEncoding (T) を用いた textbfTransformer という新しい位置符号化手法を提案する。
論文 参考訳(メタデータ) (2020-06-28T13:11:02Z) - Learn to Predict Sets Using Feed-Forward Neural Networks [63.91494644881925]
本稿では、ディープフィードフォワードニューラルネットワークを用いた設定予測の課題に対処する。
未知の置換と基数を持つ集合を予測するための新しい手法を提案する。
関連視覚問題に対する集合定式化の有効性を実証する。
論文 参考訳(メタデータ) (2020-01-30T01:52:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。