論文の概要: Solving Jigsaw Puzzles in the Wild: Human-Guided Reconstruction of Cultural Heritage Fragments
- arxiv url: http://arxiv.org/abs/2603.06389v1
- Date: Fri, 06 Mar 2026 15:37:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-09 13:17:46.091071
- Title: Solving Jigsaw Puzzles in the Wild: Human-Guided Reconstruction of Cultural Heritage Fragments
- Title(参考訳): 野生におけるJigsawの謎の解決:文化遺産の人手による復元
- Authors: Omidreza Safaei, Sinem Aslan, Sebastiano Vascon, Luca Palmieri, Marina Khoroshiltseva, Marcello Pelillo,
- Abstract要約: 本稿では,現実の文化的遺産復元の複雑さと規模に対処する,HIL(Human-in-the-loop)パズル解決フレームワークを提案する。
提案手法では, 自動緩和ラベル解法と対話型人間誘導を統合し, 検証済みの配置を反復的にロックし, 誤りを訂正し, 意味的, 幾何学的コヒーレントな集合へ誘導する。
- 参考スコア(独自算出の注目度): 4.9193756988932416
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reassembling real-world archaeological artifacts from fragmented pieces poses significant challenges due to erosion, missing regions, irregular shapes, and large-scale ambiguity. Traditional jigsaw puzzle solvers, often designed for clean synthetic scenarios, struggle under these conditions, especially when the number of fragments grows into the thousands, as in the RePAIR benchmark. In this paper, we propose a human-in-the-loop (HIL) puzzle solving framework designed to address the complexity and scale of real-world cultural heritage reconstruction. Our approach integrates an automatic relaxation-labeling solver with interactive human guidance, allowing users to iteratively lock verified placements, correct errors, and guide the system toward semantically and geometrically coherent assemblies. We introduce two complementary interaction strategies, Iterative Anchoring and Continuous Interactive Refinement, which support scalable reconstruction across varying levels of ambiguity and puzzle size. Experiments on several RePAIR groups demonstrate that our hybrid approach substantially outperforms both fully automatic and manual baselines in accuracy and efficiency, offering a practical solution for large-scale expert-in-the-loop artifact reassembly.
- Abstract(参考訳): 破片から現実世界の考古学的遺物を再組み立てすることは、浸食、欠落した地域、不規則な形、そして大規模な曖昧さによって大きな課題を生んでいる。
伝統的なジグソーパズルソルバは、しばしばクリーンな合成シナリオのために設計され、特にRePAIRベンチマークのように、フラグメントの数が数千に増加すると、これらの条件下で苦労する。
本稿では,現実の文化的遺産復元の複雑さと規模に対処するために,HIL(Human-in-the-loop)パズル解決フレームワークを提案する。
提案手法では, 自動緩和ラベル解法と対話型人間誘導を統合し, 検証済みの配置を反復的にロックし, 誤りを訂正し, 意味的, 幾何学的コヒーレントな集合へ誘導する。
多様なあいまいさとパズルサイズにまたがるスケーラブルな再構築をサポートする,反復的アンコリングと連続的インタラクティブリファインメントの2つの補完的インタラクション戦略を導入する。
いくつかのRePAIRグループでの実験では、我々のハイブリッドアプローチが完全自動ベースラインと手動ベースラインの両方を精度と効率で大幅に上回り、大規模なエキスパート・イン・ザ・ループアーティファクトの再組み立てのための実用的なソリューションを提供する。
関連論文リスト
- TangramPuzzle: Evaluating Multimodal Large Language Models with Compositional Spatial Reasoning [104.66714520975837]
古典的タングラムゲームのレンズを通して構成空間推論を評価するために,幾何グラウンドのベンチマークを導入する。
本稿では,タングラム集合を正確に機械で検証可能な座標仕様でグルーピングする記号幾何学的枠組みであるタングラム構成式(TCE)を提案する。
MLLMは、幾何学的制約を無視しながら、ターゲットのシルエットとのマッチングを優先する傾向がある。
論文 参考訳(メタデータ) (2026-01-23T07:35:05Z) - Iterative Structured Pruning for Large Language Models with Multi-Domain Calibration [73.40887151631088]
大規模言語モデル(LLM)は、自然言語処理タスクの幅広い範囲で顕著な成功を収めている。
その拡大を続けるスケールは、かなりの計算オーバーヘッド、メモリフットプリント、推論レイテンシなど、現実世界のデプロイメントに重大な障壁をもたらす。
本研究では,アーキテクチャコンポーネント全体を排除し,標準ハードウェアアクセラレーションとの互換性を維持する構造的プルーニングについて検討する。
論文 参考訳(メタデータ) (2026-01-06T03:09:31Z) - Mixture of Ranks with Degradation-Aware Routing for One-Step Real-World Image Super-Resolution [76.66229730098759]
実世界の画像超解像(Real-ISR)では、既存のアプローチは主に微調整された事前学習拡散モデルに依存している。
単一ステップ画像超解像のためのMixture-of-Ranks (MoR)アーキテクチャを提案する。
LoRAの各ランクを独立した専門家として扱う、きめ細かい専門家分割戦略を導入する。
論文 参考訳(メタデータ) (2025-11-20T04:11:44Z) - Benchmarking Content-Based Puzzle Solvers on Corrupted Jigsaw Puzzles [2.06242362470764]
そこで我々は,3種類のジグソーパズル汚職に対して,コンテンツに基づくパズル解法の評価を行った。
ディープラーニングモデルは、拡張データによる微調整によって、その堅牢性を大幅に改善することができる。
我々は,現実の人工物の自動復元を向上するための有望な研究方針を強調した。
論文 参考訳(メタデータ) (2025-07-10T15:01:23Z) - ReassembleNet: Learnable Keypoints and Diffusion for 2D Fresco Reconstruction [20.327632780374497]
我々は、最先端のDeep Learningメソッドにおいて、再アセンブリのための重要な制限に対処する。
本稿では,各入力片を輪郭キーポイントの集合として表現することで,複雑性を低減する手法であるReassembleNetを提案する。
次に拡散に基づくポーズ推定を適用し,元の構造を復元する。
論文 参考訳(メタデータ) (2025-05-27T12:38:06Z) - ERL-MPP: Evolutionary Reinforcement Learning with Multi-head Puzzle Perception for Solving Large-scale Jigsaw Puzzles of Eroded Gaps [28.009783235854584]
マルチヘッド・プッフル・パーセプションを用いた進化的強化学習の枠組みを提案する。
提案したERL-MPPは、大きなギャップを持つJPLEG-5データセットと大規模なパズルを持つMITデータセットで評価される。
両方のデータセットのすべての最先端モデルよりも大幅に優れています。
論文 参考訳(メタデータ) (2025-04-13T14:56:41Z) - ArtGS: Building Interactable Replicas of Complex Articulated Objects via Gaussian Splatting [66.29782808719301]
コンピュータビジョンにおいて、音声で表現されたオブジェクトを構築することが重要な課題である。
既存のメソッドは、しばしば異なるオブジェクト状態間で効果的に情報を統合できない。
3次元ガウスを柔軟かつ効率的な表現として活用する新しいアプローチであるArtGSを紹介する。
論文 参考訳(メタデータ) (2025-02-26T10:25:32Z) - A Generic Hybrid Framework for 2D Visual Reconstruction [39.58317527488534]
本稿では,2次元実世界の再現タスクを,正方形の非重複部分を持つジグソーパズル問題 (JPP) として定式化するための多目的ハイブリッドフレームワークを提案する。
提案手法は,一対のパズル片を論理的に評価する深層学習(DL)ベースの互換性尺度(CM)モデルを統合する。
我々の独自のハイブリッド手法は、ポルトガルのタイルパネルと大きな劣化パズルを浸食境界で再構築することで、最先端のSOTA(State-of-the-art)を実現する。
論文 参考訳(メタデータ) (2025-01-31T17:21:29Z) - UniUIR: Considering Underwater Image Restoration as An All-in-One Learner [62.65503609562905]
我々はUniUIRと呼ばれるユニバーサル水中画像復元手法を提案する。
劣化固有の問題を分離し、UIRタスクにおける様々な劣化の相関関係を探るため、我々はMamba Mixture-of-Expertsモジュールを設計した。
このモジュールは、空間領域と周波数領域の両方において劣化前の情報を抽出し、最適なタスク固有のプロンプトを適応的に選択する。
論文 参考訳(メタデータ) (2025-01-22T16:10:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。