論文の概要: Deepzzle: Solving Visual Jigsaw Puzzles with Deep Learning andShortest
Path Optimization
- arxiv url: http://arxiv.org/abs/2005.12548v1
- Date: Tue, 26 May 2020 07:19:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-29 00:24:13.945180
- Title: Deepzzle: Solving Visual Jigsaw Puzzles with Deep Learning andShortest
Path Optimization
- Title(参考訳): Deepzzle: ディープラーニングとShortestパス最適化によるビジュアルJigsawパズルの解決
- Authors: Marie-Morgane Paumard, David Picard, Hedi Tabia
- Abstract要約: フラグメント間の広い空間で画像再構成問題に取り組む。
フラグメントは、フラグメントの内容から学習するために、アルゴリズムを強制するために境界を二乗します。
再集合グラフにおける分岐切断の効果について検討する。
- 参考スコア(独自算出の注目度): 30.43614740245788
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We tackle the image reassembly problem with wide space between the fragments,
in such a way that the patterns and colors continuity is mostly unusable. The
spacing emulates the erosion of which the archaeological fragments suffer. We
crop-square the fragments borders to compel our algorithm to learn from the
content of the fragments. We also complicate the image reassembly by removing
fragments and adding pieces from other sources. We use a two-step method to
obtain the reassemblies: 1) a neural network predicts the positions of the
fragments despite the gaps between them; 2) a graph that leads to the best
reassemblies is made from these predictions. In this paper, we notably
investigate the effect of branch-cut in the graph of reassemblies. We also
provide a comparison with the literature, solve complex images reassemblies,
explore at length the dataset, and propose a new metric that suits its
specificities.
Keywords: image reassembly, jigsaw puzzle, deep learning, graph, branch-cut,
cultural heritage
- Abstract(参考訳): 我々は,フラグメント間の広い空間で画像再構成の問題に取り組み,パターンや色彩の連続性をほとんど利用できないようにした。
この間隔は、考古学的断片が苦しむ浸食を反映している。
フラグメントの境界を2乗にすることで、フラグメントの内容からアルゴリズムを学ばせます。
また、断片を取り除き、他のソースから断片を追加することで、画像の再組み立てを複雑にします。
2段階の手法を用いて再組立を行う。
1) ニューラルネットワークは,フラグメント間のギャップにもかかわらず,フラグメントの位置を予測する。
2) 最適な再組み立てにつながるグラフは、これらの予測から作成される。
本稿では,再集合のグラフにおける分岐切断の効果について特に検討する。
また、文献との比較、複雑な画像の再集合の解消、データセットの長さの探索、そしてその特異性に適合する新しい測定基準を提案する。
キーワード:画像再構成、ジグソーパズル、ディープラーニング、グラフ、ブランチカット、文化遺産
関連論文リスト
- Batch-based Model Registration for Fast 3D Sherd Reconstruction [74.55975819488404]
3次元復元技術は、考古学的断片のデジタル文書化に広く用いられている。
考古学遺跡から出土した断片の効率的なデジタル化のための携帯型,高スループット,高精度な復元システムを開発することを目的としている。
フラグメントの前後をペアリングするバッチベースの新しいマッチングアルゴリズムと,非常に狭い重複領域を共有する部分スキャンを登録できるバイラテラル境界ICPアルゴリズムを開発した。
論文 参考訳(メタデータ) (2022-11-13T13:08:59Z) - GANzzle: Reframing jigsaw puzzle solving as a retrieval task using a
generative mental image [15.132848477903314]
すべての部品からメンタルなイメージを推測し、その部品を爆発を避けるためにマッチさせることができる。
本研究では,未整列片の集合が与えられた画像の再構成方法を学び,各部品の符号化を発電機の収穫層に整合させる共同埋め込み空間を学習する。
このような場合、我々のモデルはパズルのサイズに依存しないが、従来の1つの大きさの深層学習法とは対照的である。
論文 参考訳(メタデータ) (2022-07-12T16:02:00Z) - Deep Spectral Methods: A Surprisingly Strong Baseline for Unsupervised
Semantic Segmentation and Localization [98.46318529630109]
画像分解をグラフ分割問題として再フレーミングすることで,従来のスペクトル分割法から着想を得た。
これらの固有ベクトルはすでにイメージを意味のあるセグメントに分解しており、シーン内のオブジェクトのローカライズに容易に利用できる。
データセットにまたがるこれらのセグメントに関連する機能をクラスタ化することで、明確に定義された、名前付き可能なリージョンを得ることができる。
論文 参考訳(メタデータ) (2022-05-16T17:47:44Z) - Relaxation Labeling Meets GANs: Solving Jigsaw Puzzles with Missing
Borders [13.98838872235379]
我々は, Jigsaw パズルを浸食あるいは欠落した境界で解くための GAN ベースの手法である JiGAN を提案する。
提案手法は,小さなパズルの大規模なデータセットと3つの一般的なベンチマークデータセットを用いて,提案手法の有効性を実証する。
論文 参考訳(メタデータ) (2022-03-28T00:38:17Z) - Unsupervised Part Discovery from Contrastive Reconstruction [90.88501867321573]
自己監督型視覚表現学習の目標は、強く伝達可能な画像表現を学習することである。
対象部分の発見とセグメンテーションに対する教師なしアプローチを提案する。
本手法は, 細粒度, 視覚的に異なるカテゴリ間でセマンティックな部分を生成する。
論文 参考訳(メタデータ) (2021-11-11T17:59:42Z) - Learning Co-segmentation by Segment Swapping for Retrieval and Discovery [67.6609943904996]
この研究の目的は、一対のイメージから視覚的に類似したパターンを効率的に識別することである。
画像中のオブジェクトセグメントを選択し、それを別の画像にコピーペーストすることで、合成トレーニングペアを生成する。
提案手法は,Brueghelデータセット上でのアートワークの詳細検索に対して,明確な改善をもたらすことを示す。
論文 参考訳(メタデータ) (2021-10-29T16:51:16Z) - The Spatially-Correlative Loss for Various Image Translation Tasks [69.62228639870114]
シーン構造の一貫性を保つために、シンプルで効率的かつ効果的な新しい空間相関損失を提案します。
以前の方法は、ピクセルレベルのサイクル一貫性または特徴レベルのマッチング損失を使用してこれを試みます。
I2I翻訳の3つのモードすべてにおいて,ベースラインモデルに対して,単一モーダル,マルチモーダル,さらには単一イメージ翻訳において,明確な改善が見られた。
論文 参考訳(メタデータ) (2021-04-02T02:13:30Z) - Non-Rigid Puzzles [50.213265511586535]
非剛性多部形状マッチングアルゴリズムを提案する。
非剛性変形中の参照形状とその複数の部品が与えられると仮定する。
合成法と実走査法の実験結果から,本手法の有効性が示された。
論文 参考訳(メタデータ) (2020-11-26T00:32:30Z) - Using Graph Neural Networks to Reconstruct Ancient Documents [2.4366811507669124]
グラフニューラルネットワークをベースとした一対のパッチ情報を用いてラベルをエッジに割り当てる手法を提案する。
このネットワークは、ソースとターゲットパッチの関係を、アップ、ダウン、左、右、ノーンの1つに分類する。
このモデルでは,エッジレベルでの正確な分類だけでなく,パッチの集合から部分的あるいは完全な再構成グラフを生成することが可能である。
論文 参考訳(メタデータ) (2020-11-13T18:36:36Z) - Pictorial and apictorial polygonal jigsaw puzzles: The lazy caterer
model, properties, and solvers [14.08706290287121]
任意の直線切断数で大域多角形/像を切断して生成した一般凸多角形であるジグソーパズルを定式化する。
このようなパズルの理論的性質を解析し、ピースが幾何的ノイズで汚染されたときの解法に固有の課題を含む。
論文 参考訳(メタデータ) (2020-08-17T22:07:40Z) - PuzzleNet: Scene Text Detection by Segment Context Graph Learning [9.701699882807251]
そこで本研究では,Puzzle Networks (PuzzleNets) と呼ばれる新しい分解手法を提案する。
セグメントをコンテキストグラフとして構築することで、MSGCNはセグメントの組み合わせを予測するためにセグメントコンテキストを効果的に利用する。
提案手法は,セグメントコンテキストグラフの活用により,現在の最先端技術よりも優れた,あるいは同等の性能を実現することができる。
論文 参考訳(メタデータ) (2020-02-26T09:21:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。