Fugu-MT 論文翻訳(概要): ERL-MPP: Evolutionary Reinforcement Learning with Multi-head Puzzle Perception for Solving Large-scale Jigsaw Puzzles of Eroded Gaps

論文の概要: ERL-MPP: Evolutionary Reinforcement Learning with Multi-head Puzzle Perception for Solving Large-scale Jigsaw Puzzles of Eroded Gaps

arxiv url: http://arxiv.org/abs/2504.09608v1
Date: Sun, 13 Apr 2025 14:56:41 GMT
ステータス: 翻訳完了
システム内更新日: 2025-04-23 03:51:26.443369
Title: ERL-MPP: Evolutionary Reinforcement Learning with Multi-head Puzzle Perception for Solving Large-scale Jigsaw Puzzles of Eroded Gaps
Title（参考訳）: ERL-MPP:エロッドギャップの大規模Jigsawプッズ解決のためのマルチヘッドノズル知覚による進化的強化学習
Authors: Xingke Song, Xiaoying Yang, Chenglin Yao, Jianfeng Ren, Ruibin Bai, Xin Chen, Xudong Jiang,
Abstract要約: マルチヘッド・プッフル・パーセプションを用いた進化的強化学習の枠組みを提案する。提案したERL-MPPは、大きなギャップを持つJPLEG-5データセットと大規模なパズルを持つMITデータセットで評価される。両方のデータセットのすべての最先端モデルよりも大幅に優れています。
参考スコア（独自算出の注目度）: 28.009783235854584
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Solving jigsaw puzzles has been extensively studied. While most existing models focus on solving either small-scale puzzles or puzzles with no gap between fragments, solving large-scale puzzles with gaps presents distinctive challenges in both image understanding and combinatorial optimization. To tackle these challenges, we propose a framework of Evolutionary Reinforcement Learning with Multi-head Puzzle Perception (ERL-MPP) to derive a better set of swapping actions for solving the puzzles. Specifically, to tackle the challenges of perceiving the puzzle with gaps, a Multi-head Puzzle Perception Network (MPPN) with a shared encoder is designed, where multiple puzzlet heads comprehensively perceive the local assembly status, and a discriminator head provides a global assessment of the puzzle. To explore the large swapping action space efficiently, an Evolutionary Reinforcement Learning (EvoRL) agent is designed, where an actor recommends a set of suitable swapping actions from a large action space based on the perceived puzzle status, a critic updates the actor using the estimated rewards and the puzzle status, and an evaluator coupled with evolutionary strategies evolves the actions aligning with the historical assembly experience. The proposed ERL-MPP is comprehensively evaluated on the JPLEG-5 dataset with large gaps and the MIT dataset with large-scale puzzles. It significantly outperforms all state-of-the-art models on both datasets.
Abstract（参考訳）: ジグソーパズルの解法は広く研究されている。既存のほとんどのモデルは、断片間のギャップのない小さなパズルやパズルの解決に重点を置いているが、ギャップのある大規模なパズルの解決は、画像理解と組合せ最適化の両方において顕著な課題を示している。これらの課題に対処するために,多頭部ノズル知覚を用いた進化強化学習(ERL-MPP)の枠組みを提案する。具体的には,共有エンコーダを用いたマルチヘッドパズル知覚ネットワーク(MPPN)を設計し,複数のパズルヘッドが局所的な組立状態を包括的に知覚し,識別器ヘッドがパズルのグローバルな評価を行う。大規模なスワッピング動作空間を効率的に探索するために、進化強化学習(EvoRL)エージェントを設計し、認識されたパズル状態に基づいて、アクターが大きなアクション空間から適切なスワップ動作のセットを推奨し、批評家が推定された報酬とパズル状態を用いてアクターを更新し、進化戦略と結合した評価器が歴史的アセンブリ体験と整合したアクションを進化させる。提案したERL-MPPは、大きなギャップを持つJPLEG-5データセットと大規模なパズルを持つMITデータセットで包括的に評価される。両方のデータセットのすべての最先端モデルよりも大幅に優れています。

関連論文リスト

Solving Convex Partition Visual Jigsaw Puzzles [3.0427549266235125]
Jigsawパズルの解決には、一貫性のある全体を再構築するために、順序のないピースを元のポーズに再構成する必要がある。文献の多くは正方形のジグソーパズルの解法の開発に重点を置いており、その実用性は著しく制限されている。本研究では,コンベックス分割(Convex Partitions)と呼ばれる問題に焦点をあて,計算的に処理されるパズルの種類を大幅に拡大する。
論文参考訳（メタデータ） (2025-11-06T15:22:46Z)
PuzzlePlex: Benchmarking Foundation Models on Reasoning and Planning with Puzzles [53.47227295854126]
本研究では,基礎モデルの推論と計画能力と,複雑な動的環境におけるスケーラビリティについて検討する。 PuzzlePlexは、様々なパズルによってこれらの能力を評価するために設計されたベンチマークである。
論文参考訳（メタデータ） (2025-10-07T21:24:29Z)
PuzzleWorld: A Benchmark for Multimodal, Open-Ended Reasoning in Puzzlehunts [47.92619068073141]
我々は、ステップバイステップ、オープンエンド、クリエイティブマルチモーダル推論を評価するために設計された667のパズルハントスタイルの大規模ベンチマークであるPuzzleWorldを紹介した。ほとんどの最先端モデルでは最終解の精度は1-2%に過ぎず、最高のモデルではパズルの14%しか解けず、ステップワイズ精度は40%に達する。誤り解析により,現在のモデルは筋力的推論を示し,言語に基づく推論の限界に悩まされ,視覚的および空間的推論に不可欠なスケッチ能力が欠如していることが判明した。
論文参考訳（メタデータ） (2025-06-06T16:17:09Z)
Jigsaw-R1: A Study of Rule-based Visual Reinforcement Learning with Jigsaw Puzzles [22.005722971314707]
本稿では、ジグソーパズルを構造化実験フレームワークとして用いて、ルールベースの視覚的RLについて包括的に研究する。 Jigsawのパズルは、固有の真実、調整可能な困難、複雑な意思決定を要求する。 MLLMは、最初は最も単純なジグソーパズルのランダムな推測に近づき、ほぼ完璧な精度を達成し、微調整によって複雑で目に見えない構成に一般化する。
論文参考訳（メタデータ） (2025-05-29T16:01:22Z)
PuzzleBench: A Fully Dynamic Evaluation Framework for Large Multimodal Models on Puzzle Solving [50.50405233978406]
我々は、OVPG(Open-ended Visual Puzzle Generation)という、完全に動的なマルチモーダル評価フレームワークを提案する。 OVPGは、パズル解決タスクにおいて、新しく、多様性があり、検証可能な評価データを自動的に生成することを目的としている。 OVPG上に構築されたPuzzleBenchは11,840のVQAサンプルからなる動的でスケーラブルなベンチマークである。
論文参考訳（メタデータ） (2025-04-15T05:29:31Z)
GenVP: Generating Visual Puzzles with Contrastive Hierarchical VAEs [15.118234858274679]
本稿では,RPM生成プロセス全体をモデル化するための生成的ビジュアルパズル (GenVP) を提案する。私たちのモデルの能力は、1つの特定の問題に対して複数のソリューションを生成することから、望ましいルールセットから完全な新しいパズルを生成することまで、多岐にわたっています。
論文参考訳（メタデータ） (2025-03-30T21:35:26Z)
CrossWordBench: Evaluating the Reasoning Capabilities of LLMs and LVLMs with Controllable Puzzle Generation [53.452699232071495]
CrossWordBenchは、大きな言語モデル(LLM)とLVLM(Large Vision-Language Models)の推論能力を評価するために設計されたベンチマークである。評価の結果,LLMの推論は,クロスレター制約を効果的に活用することにより,非推論モデルよりも大幅に優れていることがわかった。本研究は,現在のLLMとLVLMの推論能力の限界について考察し,今後の評価のために,マルチモーダル制約タスクを作成するための効果的なアプローチを提供する。
論文参考訳（メタデータ） (2025-03-30T20:03:36Z)
VGRP-Bench: Visual Grid Reasoning Puzzle Benchmark for Large Vision-Language Models [31.645103181716678]
LVLM(Large Vision-Language Models)は、正確な認識、ルール理解、論理的推論を必要とするパズルと競合する。 VGRP-Benchは、20種類のパズルを特徴とするVisual Grid Reasoning Puzzle Benchmarkである。以上の結果から,現在最先端のLVLMでさえこれらのパズルに苦戦していることが明らかとなり,パズル解法の基本的限界が浮き彫りになった。
論文参考訳（メタデータ） (2025-03-29T12:50:38Z)
A Generic Hybrid Framework for 2D Visual Reconstruction [39.58317527488534]
本稿では,2次元実世界の再現タスクを,正方形の非重複部分を持つジグソーパズル問題 (JPP) として定式化するための多目的ハイブリッドフレームワークを提案する。提案手法は,一対のパズル片を論理的に評価する深層学習(DL)ベースの互換性尺度(CM)モデルを統合する。我々の独自のハイブリッド手法は、ポルトガルのタイルパネルと大きな劣化パズルを浸食境界で再構築することで、最先端のSOTA(State-of-the-art)を実現する。
論文参考訳（メタデータ） (2025-01-31T17:21:29Z)
Solving Zebra Puzzles Using Constraint-Guided Multi-Agent Systems [25.0042181817455]
本稿では,大言語モデルとオフ・ザ・シェルフ定理証明器を統合したマルチエージェントシステムZPSを紹介する。このシステムは、問題をより小さく管理可能な部分に分割することで、複雑なパズル解決作業に取り組む。また,問題解の正当性を評価するための自動グリッドパズルグレーダを導入し,ユーザスタディで評価することで,自動グレーダが信頼性が高いことを示す。
論文参考訳（メタデータ） (2024-07-04T14:22:25Z)
Accelerating exploration and representation learning with offline pre-training [52.6912479800592]
1つのオフラインデータセットから2つの異なるモデルを別々に学習することで、探索と表現の学習を改善することができることを示す。ノイズコントラスト推定と補助報酬モデルを用いて状態表現を学習することで、挑戦的なNetHackベンチマークのサンプル効率を大幅に向上できることを示す。
論文参考訳（メタデータ） (2023-03-31T18:03:30Z)
Multi-Phase Relaxation Labeling for Square Jigsaw Puzzle Solving [73.58829980121767]
本稿では,大域最適化に基づく二乗ジグソーパズルの解法を提案する。この手法は完全に自動化されており、事前情報を前提とせず、未知または未知のピースオリエンテーションでパズルを扱うことができる。
論文参考訳（メタデータ） (2023-03-26T18:53:51Z)
Automated Graph Genetic Algorithm based Puzzle Validation for Faster Game Desig [69.02688684221265]
本稿では,コンピュータゲームにおける論理パズルを効率的に解くための進化的アルゴリズムを提案する。制約満足度問題に対するハイブリッド遺伝的アプローチの様々なバリエーションについて論じる。
論文参考訳（メタデータ） (2023-02-17T18:15:33Z)
Video Anomaly Detection by Solving Decoupled Spatio-Temporal Jigsaw Puzzles [67.39567701983357]
ビデオ異常検出(VAD)はコンピュータビジョンにおいて重要なトピックである。近年の自己教師型学習の進歩に触発された本論文は,直感的かつ難解なプレテキストタスクを解くことによって,VADに対処する。提案手法は3つの公開ベンチマークにおいて最先端のベンチマークよりも優れている。
論文参考訳（メタデータ） (2022-07-20T19:49:32Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。