論文の概要: GANzzle: Reframing jigsaw puzzle solving as a retrieval task using a
generative mental image
- arxiv url: http://arxiv.org/abs/2207.05634v1
- Date: Tue, 12 Jul 2022 16:02:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-13 14:30:34.859175
- Title: GANzzle: Reframing jigsaw puzzle solving as a retrieval task using a
generative mental image
- Title(参考訳): GANzzle: 生成精神画像を用いた検索課題としてのジグソーパズルの解法
- Authors: Davide Talon, Alessio Del Bue, Stuart James
- Abstract要約: すべての部品からメンタルなイメージを推測し、その部品を爆発を避けるためにマッチさせることができる。
本研究では,未整列片の集合が与えられた画像の再構成方法を学び,各部品の符号化を発電機の収穫層に整合させる共同埋め込み空間を学習する。
このような場合、我々のモデルはパズルのサイズに依存しないが、従来の1つの大きさの深層学習法とは対照的である。
- 参考スコア(独自算出の注目度): 15.132848477903314
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Puzzle solving is a combinatorial challenge due to the difficulty of matching
adjacent pieces. Instead, we infer a mental image from all pieces, which a
given piece can then be matched against avoiding the combinatorial explosion.
Exploiting advancements in Generative Adversarial methods, we learn how to
reconstruct the image given a set of unordered pieces, allowing the model to
learn a joint embedding space to match an encoding of each piece to the cropped
layer of the generator. Therefore we frame the problem as a R@1 retrieval task,
and then solve the linear assignment using differentiable Hungarian attention,
making the process end-to-end. In doing so our model is puzzle size agnostic,
in contrast to prior deep learning methods which are single size. We evaluate
on two new large-scale datasets, where our model is on par with deep learning
methods, while generalizing to multiple puzzle sizes.
- Abstract(参考訳): パズル解決は、隣り合うピースのマッチングが難しいため、組合せ問題である。
その代わり、すべてのピースからメンタルイメージを推測し、そのピースを組み合わせの爆発を避けるためにマッチさせることができる。
生成的逆境手法の進歩を生かして,無秩序な部品のセットを与えられた画像の再構成法を学習し,各部品のエンコードとジェネレータのクロッピング層とを一致させるジョイント埋め込み空間を学習する。
したがって、この問題をr@1検索タスクとしてフレーム化し、ハンガリーの注意を区別可能な方法で線形割り当てを解決し、処理をエンドツーエンドにします。
そうすることで、単一サイズの事前ディープラーニングメソッドとは対照的に、モデルはパズルサイズ非依存になります。
モデルがディープラーニング法に匹敵する2つの新しい大規模データセットを評価し,複数のパズルサイズに一般化した。
関連論文リスト
- Solving Masked Jigsaw Puzzles with Diffusion Vision Transformers [5.374411622670979]
画像とビデオのジグソーパズルは、意味のある画像やビデオのシーケンスを復元するために、順序のないシーケンスから画像の断片やビデオフレームを並べ替える難しい作業である。
既存のアプローチはしばしば、パズル要素の絶対的な位置または元のデータに適用される置換動作の予測を行う識別モデルにヒンジする。
本稿では,この課題に対処するために拡散変圧器を利用する革新的な手法であるJPDVTを提案する。
論文 参考訳(メタデータ) (2024-04-10T18:40:23Z) - DiffAssemble: A Unified Graph-Diffusion Model for 2D and 3D Reassembly [21.497180110855975]
グラフニューラルネットワーク(GNN)ベースのアーキテクチャであるDiffAssembleを導入する。
本手法は,空間グラフのノードとして,2次元パッチや3次元オブジェクトフラグメントなどの集合の要素を扱う。
我々は、最も高速な最適化に基づくパズル解法よりも11倍高速に実行された、実行時間の大幅な削減を強調した。
論文 参考訳(メタデータ) (2024-02-29T16:09:12Z) - Multi-Phase Relaxation Labeling for Square Jigsaw Puzzle Solving [73.58829980121767]
本稿では,大域最適化に基づく二乗ジグソーパズルの解法を提案する。
この手法は完全に自動化されており、事前情報を前提とせず、未知または未知のピースオリエンテーションでパズルを扱うことができる。
論文 参考訳(メタデータ) (2023-03-26T18:53:51Z) - PuzzleFusion: Unleashing the Power of Diffusion Models for Spatial
Puzzle Solving [17.781484376483707]
本稿では,空間パズル解決のための拡散モデルに基づくエンドツーエンドのニューラルネットワークアーキテクチャを提案する。
驚くべき発見は、拡散モデルを用いることで、条件生成プロセスとしてこれらの困難な空間パズルタスクを効果的に解決できるということである。
エンド・ツー・エンドのニューラル・システムの学習を可能にするため,本論文では,地軸配置による新しいデータセットを提案する。
論文 参考訳(メタデータ) (2022-11-24T20:06:11Z) - A Generalist Framework for Panoptic Segmentation of Images and Videos [61.61453194912186]
我々は,タスクの帰納バイアスに頼ることなく,離散的なデータ生成問題としてパノプティクスセグメンテーションを定式化する。
単純な構造と一般的な損失関数を持つパノスコープマスクをモデル化するための拡散モデルを提案する。
本手法は,動画を(ストリーミング環境で)モデル化し,オブジェクトのインスタンスを自動的に追跡することを学ぶ。
論文 参考訳(メタデータ) (2022-10-12T16:18:25Z) - Video Anomaly Detection by Solving Decoupled Spatio-Temporal Jigsaw
Puzzles [67.39567701983357]
ビデオ異常検出(VAD)はコンピュータビジョンにおいて重要なトピックである。
近年の自己教師型学習の進歩に触発された本論文は,直感的かつ難解なプレテキストタスクを解くことによって,VADに対処する。
提案手法は3つの公開ベンチマークにおいて最先端のベンチマークよりも優れている。
論文 参考訳(メタデータ) (2022-07-20T19:49:32Z) - Brick-by-Brick: Combinatorial Construction with Deep Reinforcement
Learning [52.85981207514049]
我々は,ユニットプリミティブを逐次組み立てるビルディングエージェントを必要とする,新しい定式化,複雑な構成を導入する。
対象物を構築するために,エージェントに対して正確な情報や明示的な情報ではなく,所望の目標(すなわち2次元画像)に関する不完全な知識を提供する。
提案手法は,対象オブジェクトの1つの画像や複数ビューに条件付けされた未確認オブジェクトの構築に成功していることを示す。
論文 参考訳(メタデータ) (2021-10-29T01:09:51Z) - InfinityGAN: Towards Infinite-Resolution Image Synthesis [92.40782797030977]
任意の解像度画像を生成するinfinityganを提案する。
少ない計算資源でパッチバイパッチをシームレスに訓練し、推論する方法を示す。
論文 参考訳(メタデータ) (2021-04-08T17:59:30Z) - JigsawGAN: Self-supervised Learning for Solving Jigsaw Puzzles with
Generative Adversarial Networks [31.190344964881625]
本稿では,ジグソーパズルを解くためのGAN(Generative Adversarial Network)に基づく解を提案する。
提案手法は,セマンティクス情報とエッジ情報を同時に利用することにより,ジグソーパズルをより効率的に解くことができる。
論文 参考訳(メタデータ) (2021-01-19T10:40:38Z) - Non-Rigid Puzzles [50.213265511586535]
非剛性多部形状マッチングアルゴリズムを提案する。
非剛性変形中の参照形状とその複数の部品が与えられると仮定する。
合成法と実走査法の実験結果から,本手法の有効性が示された。
論文 参考訳(メタデータ) (2020-11-26T00:32:30Z) - Pictorial and apictorial polygonal jigsaw puzzles: The lazy caterer
model, properties, and solvers [14.08706290287121]
任意の直線切断数で大域多角形/像を切断して生成した一般凸多角形であるジグソーパズルを定式化する。
このようなパズルの理論的性質を解析し、ピースが幾何的ノイズで汚染されたときの解法に固有の課題を含む。
論文 参考訳(メタデータ) (2020-08-17T22:07:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。