論文の概要: Nash Meets Wertheimer: Using Good Continuation in Jigsaw Puzzles
- arxiv url: http://arxiv.org/abs/2410.16857v1
- Date: Tue, 22 Oct 2024 09:46:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-23 14:27:39.558600
- Title: Nash Meets Wertheimer: Using Good Continuation in Jigsaw Puzzles
- Title(参考訳): NashがWertheimerと出会い - Jigsawのパズルで継続性を改善する
- Authors: Marina Khoroshiltseva, Luca Palmieri, Sinem Aslan, Sebastiano Vascon, Marcello Pelillo,
- Abstract要約: Jigsawパズルの解法は、高レベルの空間的および意味的推論を必要とするため、コンピュータビジョンにとって難しい課題である。
本稿では,従来の色や形状を意図的に無視するパズル解法を,新たな課題として導入する。
我々は、合成データと実世界のデータの両方に対するアプローチを評価し、最先端のアルゴリズムと比較する。
- 参考スコア(独自算出の注目度): 7.716132543734369
- License:
- Abstract: Jigsaw puzzle solving is a challenging task for computer vision since it requires high-level spatial and semantic reasoning. To solve the problem, existing approaches invariably use color and/or shape information but in many real-world scenarios, such as in archaeological fresco reconstruction, this kind of clues is often unreliable due to severe physical and pictorial deterioration of the individual fragments. This makes state-of-the-art approaches entirely unusable in practice. On the other hand, in such cases, simple geometrical patterns such as lines or curves offer a powerful yet unexplored clue. In an attempt to fill in this gap, in this paper we introduce a new challenging version of the puzzle solving problem in which one deliberately ignores conventional color and shape features and relies solely on the presence of linear geometrical patterns. The reconstruction process is then only driven by one of the most fundamental principles of Gestalt perceptual organization, namely Wertheimer's {\em law of good continuation}. In order to tackle this problem, we formulate the puzzle solving problem as the problem of finding a Nash equilibrium of a (noncooperative) multiplayer game and use classical multi-population replicator dynamics to solve it. The proposed approach is general and allows us to deal with pieces of arbitrary shape, size and orientation. We evaluate our approach on both synthetic and real-world data and compare it with state-of-the-art algorithms. The results show the intrinsic complexity of our purely line-based puzzle problem as well as the relative effectiveness of our game-theoretic formulation.
- Abstract(参考訳): Jigsawパズルの解法は、高レベルの空間的および意味的推論を必要とするため、コンピュータビジョンにとって難しい課題である。
この問題を解決するために、既存のアプローチでは色や形状の情報を多用しているが、考古学的フレスコの復元など現実のシナリオでは、個々の断片の物理的・画像的劣化が激しいため、この種の手がかりは信頼できないことが多い。
これにより、最先端のアプローチが実際にまったく使用不可能になります。
一方、そのような場合、線や曲線のような単純な幾何学的パターンは、強力だが未解明の手がかりとなる。
このギャップを埋めるために,本論文では,従来の色や形状の特徴を意図的に無視し,線形幾何学的パターンの存在にのみ依存する,パズル解決問題の挑戦版を紹介する。
再建過程は、ゲシュタルト知覚組織の最も基本的な原理の1つ、すなわちヴェルトハイマーのよい継続の法則によってのみ推進される。
この問題に対処するために,(非協調的な)マルチプレイヤーゲームのナッシュ平衡を求める問題としてパズル解問題を定式化し,古典的なマルチポピュレーションレプリケータダイナミクスを用いて解決する。
提案手法は汎用的であり,任意の形状,大きさ,配向を扱える。
我々は、合成データと実世界のデータの両方に対するアプローチを評価し、最先端のアルゴリズムと比較する。
その結果、純粋に行ベースのパズル問題の本質的な複雑さと、ゲーム理論の相対的有効性を示した。
関連論文リスト
- Disentangled Representation Learning with the Gromov-Monge Gap [65.73194652234848]
乱れのないデータから歪んだ表現を学習することは、機械学習における根本的な課題である。
本稿では,2次最適輸送に基づく非交叉表現学習手法を提案する。
提案手法の有効性を4つの標準ベンチマークで示す。
論文 参考訳(メタデータ) (2024-07-10T16:51:32Z) - Multi-Phase Relaxation Labeling for Square Jigsaw Puzzle Solving [73.58829980121767]
本稿では,大域最適化に基づく二乗ジグソーパズルの解法を提案する。
この手法は完全に自動化されており、事前情報を前提とせず、未知または未知のピースオリエンテーションでパズルを扱うことができる。
論文 参考訳(メタデータ) (2023-03-26T18:53:51Z) - Automated Graph Genetic Algorithm based Puzzle Validation for Faster
Game Desig [69.02688684221265]
本稿では,コンピュータゲームにおける論理パズルを効率的に解くための進化的アルゴリズムを提案する。
制約満足度問題に対するハイブリッド遺伝的アプローチの様々なバリエーションについて論じる。
論文 参考訳(メタデータ) (2023-02-17T18:15:33Z) - A Data-dependent Approach for High Dimensional (Robust) Wasserstein
Alignment [10.374243304018794]
本稿では,高次元幾何学的パターンを圧縮する効果的な枠組みを提案する。
我々の考えは、高次元データはしばしば本質的な次元が低いという観察にインスパイアされている。
我々のフレームワークは、入力データの本質的な次元に依存する複雑さを持つデータ依存のアプローチである。
論文 参考訳(メタデータ) (2022-09-07T03:29:26Z) - Video Anomaly Detection by Solving Decoupled Spatio-Temporal Jigsaw
Puzzles [67.39567701983357]
ビデオ異常検出(VAD)はコンピュータビジョンにおいて重要なトピックである。
近年の自己教師型学習の進歩に触発された本論文は,直感的かつ難解なプレテキストタスクを解くことによって,VADに対処する。
提案手法は3つの公開ベンチマークにおいて最先端のベンチマークよりも優れている。
論文 参考訳(メタデータ) (2022-07-20T19:49:32Z) - GANzzle: Reframing jigsaw puzzle solving as a retrieval task using a
generative mental image [15.132848477903314]
すべての部品からメンタルなイメージを推測し、その部品を爆発を避けるためにマッチさせることができる。
本研究では,未整列片の集合が与えられた画像の再構成方法を学び,各部品の符号化を発電機の収穫層に整合させる共同埋め込み空間を学習する。
このような場合、我々のモデルはパズルのサイズに依存しないが、従来の1つの大きさの深層学習法とは対照的である。
論文 参考訳(メタデータ) (2022-07-12T16:02:00Z) - Relaxation Labeling Meets GANs: Solving Jigsaw Puzzles with Missing
Borders [13.98838872235379]
我々は, Jigsaw パズルを浸食あるいは欠落した境界で解くための GAN ベースの手法である JiGAN を提案する。
提案手法は,小さなパズルの大規模なデータセットと3つの一般的なベンチマークデータセットを用いて,提案手法の有効性を実証する。
論文 参考訳(メタデータ) (2022-03-28T00:38:17Z) - Multi-view 3D Reconstruction of a Texture-less Smooth Surface of Unknown
Generic Reflectance [86.05191217004415]
表面反射率の不明なテクスチャレス物体の多視点再構成は難しい課題である。
本稿では,コライトスキャナーをベースとした,この問題に対するシンプルで堅牢な解法を提案する。
論文 参考訳(メタデータ) (2021-05-25T01:28:54Z) - Non-Rigid Puzzles [50.213265511586535]
非剛性多部形状マッチングアルゴリズムを提案する。
非剛性変形中の参照形状とその複数の部品が与えられると仮定する。
合成法と実走査法の実験結果から,本手法の有効性が示された。
論文 参考訳(メタデータ) (2020-11-26T00:32:30Z) - Pictorial and apictorial polygonal jigsaw puzzles: The lazy caterer
model, properties, and solvers [14.08706290287121]
任意の直線切断数で大域多角形/像を切断して生成した一般凸多角形であるジグソーパズルを定式化する。
このようなパズルの理論的性質を解析し、ピースが幾何的ノイズで汚染されたときの解法に固有の課題を含む。
論文 参考訳(メタデータ) (2020-08-17T22:07:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。