論文の概要: Deepzzle: Solving Visual Jigsaw Puzzles with Deep Learning andShortest
Path Optimization
- arxiv url: http://arxiv.org/abs/2005.12548v1
- Date: Tue, 26 May 2020 07:19:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-29 00:24:13.945180
- Title: Deepzzle: Solving Visual Jigsaw Puzzles with Deep Learning andShortest
Path Optimization
- Title(参考訳): Deepzzle: ディープラーニングとShortestパス最適化によるビジュアルJigsawパズルの解決
- Authors: Marie-Morgane Paumard, David Picard, Hedi Tabia
- Abstract要約: フラグメント間の広い空間で画像再構成問題に取り組む。
フラグメントは、フラグメントの内容から学習するために、アルゴリズムを強制するために境界を二乗します。
再集合グラフにおける分岐切断の効果について検討する。
- 参考スコア(独自算出の注目度): 30.43614740245788
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We tackle the image reassembly problem with wide space between the fragments,
in such a way that the patterns and colors continuity is mostly unusable. The
spacing emulates the erosion of which the archaeological fragments suffer. We
crop-square the fragments borders to compel our algorithm to learn from the
content of the fragments. We also complicate the image reassembly by removing
fragments and adding pieces from other sources. We use a two-step method to
obtain the reassemblies: 1) a neural network predicts the positions of the
fragments despite the gaps between them; 2) a graph that leads to the best
reassemblies is made from these predictions. In this paper, we notably
investigate the effect of branch-cut in the graph of reassemblies. We also
provide a comparison with the literature, solve complex images reassemblies,
explore at length the dataset, and propose a new metric that suits its
specificities.
Keywords: image reassembly, jigsaw puzzle, deep learning, graph, branch-cut,
cultural heritage
- Abstract(参考訳): 我々は,フラグメント間の広い空間で画像再構成の問題に取り組み,パターンや色彩の連続性をほとんど利用できないようにした。
この間隔は、考古学的断片が苦しむ浸食を反映している。
フラグメントの境界を2乗にすることで、フラグメントの内容からアルゴリズムを学ばせます。
また、断片を取り除き、他のソースから断片を追加することで、画像の再組み立てを複雑にします。
2段階の手法を用いて再組立を行う。
1) ニューラルネットワークは,フラグメント間のギャップにもかかわらず,フラグメントの位置を予測する。
2) 最適な再組み立てにつながるグラフは、これらの予測から作成される。
本稿では,再集合のグラフにおける分岐切断の効果について特に検討する。
また、文献との比較、複雑な画像の再集合の解消、データセットの長さの探索、そしてその特異性に適合する新しい測定基準を提案する。
キーワード:画像再構成、ジグソーパズル、ディープラーニング、グラフ、ブランチカット、文化遺産
関連論文リスト
- Re-assembling the past: The RePAIR dataset and benchmark for real world 2D and 3D puzzle solving [46.073519734119266]
我々のデータセットには、現在の2Dおよび3Dパズル解決のベンチマークに共通するユニークな特性がある。
破片と骨折は、第二次世界大戦中にポンペイ考古学公園で爆破されたフレスコの崩壊によって引き起こされた現実的なものである。
データセットは、特徴的な画像要素を持つ高解像度画像を提供するマルチモーダルである。
論文 参考訳(メタデータ) (2024-10-31T15:10:38Z) - MULAN: A Multi Layer Annotated Dataset for Controllable Text-to-Image Generation [54.64194935409982]
44K MUlti-Layer-wise RGBA 分解からなる新しいデータセット MuLAn を紹介する。
MuLAnは、高品質な画像のインスタンス分解と空間情報を提供する最初のフォトリアリスティックなリソースである。
我々は,新しい生成・編集技術,特にレイヤワイドソリューションの開発を促進することを目的としている。
論文 参考訳(メタデータ) (2024-04-03T14:58:00Z) - Block and Detail: Scaffolding Sketch-to-Image Generation [65.56590359051634]
アーティストの反復的な洗練プロセスと整合する新しいスケッチ・ツー・イメージ・ツールを提案する。
私たちのツールは、ブロックされたストロークをスケッチして、オブジェクトの配置や形を粗く表現し、詳細なストロークを表現して、形やシルエットを洗練します。
反復過程の任意の点において、そのようなスケッチから高忠実度画像を生成するための2パスアルゴリズムを開発した。
論文 参考訳(メタデータ) (2024-02-28T07:09:31Z) - GANzzle: Reframing jigsaw puzzle solving as a retrieval task using a
generative mental image [15.132848477903314]
すべての部品からメンタルなイメージを推測し、その部品を爆発を避けるためにマッチさせることができる。
本研究では,未整列片の集合が与えられた画像の再構成方法を学び,各部品の符号化を発電機の収穫層に整合させる共同埋め込み空間を学習する。
このような場合、我々のモデルはパズルのサイズに依存しないが、従来の1つの大きさの深層学習法とは対照的である。
論文 参考訳(メタデータ) (2022-07-12T16:02:00Z) - Deep Spectral Methods: A Surprisingly Strong Baseline for Unsupervised
Semantic Segmentation and Localization [98.46318529630109]
画像分解をグラフ分割問題として再フレーミングすることで,従来のスペクトル分割法から着想を得た。
これらの固有ベクトルはすでにイメージを意味のあるセグメントに分解しており、シーン内のオブジェクトのローカライズに容易に利用できる。
データセットにまたがるこれらのセグメントに関連する機能をクラスタ化することで、明確に定義された、名前付き可能なリージョンを得ることができる。
論文 参考訳(メタデータ) (2022-05-16T17:47:44Z) - Relaxation Labeling Meets GANs: Solving Jigsaw Puzzles with Missing
Borders [13.98838872235379]
我々は, Jigsaw パズルを浸食あるいは欠落した境界で解くための GAN ベースの手法である JiGAN を提案する。
提案手法は,小さなパズルの大規模なデータセットと3つの一般的なベンチマークデータセットを用いて,提案手法の有効性を実証する。
論文 参考訳(メタデータ) (2022-03-28T00:38:17Z) - Unsupervised Part Discovery from Contrastive Reconstruction [90.88501867321573]
自己監督型視覚表現学習の目標は、強く伝達可能な画像表現を学習することである。
対象部分の発見とセグメンテーションに対する教師なしアプローチを提案する。
本手法は, 細粒度, 視覚的に異なるカテゴリ間でセマンティックな部分を生成する。
論文 参考訳(メタデータ) (2021-11-11T17:59:42Z) - Non-Rigid Puzzles [50.213265511586535]
非剛性多部形状マッチングアルゴリズムを提案する。
非剛性変形中の参照形状とその複数の部品が与えられると仮定する。
合成法と実走査法の実験結果から,本手法の有効性が示された。
論文 参考訳(メタデータ) (2020-11-26T00:32:30Z) - Using Graph Neural Networks to Reconstruct Ancient Documents [2.4366811507669124]
グラフニューラルネットワークをベースとした一対のパッチ情報を用いてラベルをエッジに割り当てる手法を提案する。
このネットワークは、ソースとターゲットパッチの関係を、アップ、ダウン、左、右、ノーンの1つに分類する。
このモデルでは,エッジレベルでの正確な分類だけでなく,パッチの集合から部分的あるいは完全な再構成グラフを生成することが可能である。
論文 参考訳(メタデータ) (2020-11-13T18:36:36Z) - PuzzleNet: Scene Text Detection by Segment Context Graph Learning [9.701699882807251]
そこで本研究では,Puzzle Networks (PuzzleNets) と呼ばれる新しい分解手法を提案する。
セグメントをコンテキストグラフとして構築することで、MSGCNはセグメントの組み合わせを予測するためにセグメントコンテキストを効果的に利用する。
提案手法は,セグメントコンテキストグラフの活用により,現在の最先端技術よりも優れた,あるいは同等の性能を実現することができる。
論文 参考訳(メタデータ) (2020-02-26T09:21:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。