論文の概要: Multi-Agent Image Restoration
- arxiv url: http://arxiv.org/abs/2503.09403v2
- Date: Mon, 17 Mar 2025 07:34:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-18 12:36:46.655347
- Title: Multi-Agent Image Restoration
- Title(参考訳): マルチエージェント画像復元
- Authors: Xu Jiang, Gehui Li, Bin Chen, Jian Zhang,
- Abstract要約: 複雑な赤外線問題に対する新しいマルチエージェントアプローチであるMAIRを提案する。
3段階の復元フレームワーク上に構築されたMAIRは、協力的な人間専門家のチームをエミュレートする。
MAIRは、以前のエージェントIRシステムよりも競争性能が向上し、効率が向上する。
- 参考スコア(独自算出の注目度): 9.614197636859435
- License:
- Abstract: Image restoration (IR) is challenging due to the complexity of real-world degradations. While many specialized and all-in-one IR models have been developed, they fail to effectively handle complex, mixed degradations. Recent agentic methods RestoreAgent and AgenticIR leverage intelligent, autonomous workflows to alleviate this issue, yet they suffer from suboptimal results and inefficiency due to their resource-intensive finetunings, and ineffective searches and tool execution trials for satisfactory outputs. In this paper, we propose MAIR, a novel Multi-Agent approach for complex IR problems. We introduce a real-world degradation prior, categorizing degradations into three types: (1) scene, (2) imaging, and (3) compression, which are observed to occur sequentially in real world, and reverse them in the opposite order. Built upon this three-stage restoration framework, MAIR emulates a team of collaborative human specialists, including a "scheduler" for overall planning and multiple "experts" dedicated to specific degradations. This design minimizes search space and trial efforts, improving image quality while reducing inference costs. In addition, a registry mechanism is introduced to enable easy integration of new tools. Experiments on both synthetic and real-world datasets show that proposed MAIR achieves competitive performance and improved efficiency over the previous agentic IR system. Code and models will be made available.
- Abstract(参考訳): 実世界の劣化の複雑さのため、画像復元(IR)は困難である。
多くの特殊でオールインワンのIRモデルが開発されているが、複雑な複合劣化を効果的に扱えない。
最近のエージェント手法であるRestoreAgentとAgenticIRは、インテリジェントで自律的なワークフローを利用してこの問題を緩和するが、リソース集約的な微調整による最適でない結果と非効率に苦しむ。
本稿では,複雑な赤外線問題に対する新しいマルチエージェント手法であるMAIRを提案する。
本研究では,(1)シーン,(2)画像,(3)圧縮の3つのタイプに分解を分類し,実世界で連続的に発生することが観察され,逆順に逆転する実世界の劣化を事前に導入する。
この3段階の復元フレームワークに基づいて構築されたMAIRは、全体計画のための"スケジュール"や、特定の劣化に特化した複数の"専門家"を含む、協力的な人間のスペシャリストのチームをエミュレートする。
この設計は、検索スペースと試行作業を最小化し、推論コストを削減しつつ画質を向上させる。
さらに、新しいツールを簡単に統合できるようにレジストリメカニズムが導入されている。
合成と実世界の両方のデータセットの実験により、提案されたMAIRは、以前のエージェントIRシステムよりも競争性能が向上し、効率が向上することが示された。
コードとモデルは利用可能になる。
関連論文リスト
- UniRestore: Unified Perceptual and Task-Oriented Image Restoration Model Using Diffusion Prior [56.35236964617809]
画像復元は、悪天候、ぼやけ、騒音などの様々な要因によって劣化した入力からコンテンツを回復することを目的としている。
本稿では,PIRとTIRのギャップを埋める統一画像復元モデルUniRestoreを紹介する。
本稿では,分解エンコーダの特徴を再構築するための補足的特徴回復モジュール (CFRM) と,デコーダの適応的特徴融合を容易にするタスク特徴適応モジュール (TFA) を提案する。
論文 参考訳(メタデータ) (2025-01-22T08:06:48Z) - Mixed Degradation Image Restoration via Local Dynamic Optimization and Conditional Embedding [67.57487747508179]
マルチインワン画像復元 (IR) は, 一つのモデルで全ての種類の劣化画像復元を処理し, 大幅な進歩を遂げている。
本稿では,単一と混合の分解で画像を効果的に復元できる新しいマルチインワンIRモデルを提案する。
論文 参考訳(メタデータ) (2024-11-25T09:26:34Z) - An Intelligent Agentic System for Complex Image Restoration Problems [39.93819777300997]
AgenticIRは、イメージ処理に対する人間のアプローチを、知覚、スケジューリング、実行、反射、再スケジューリングの5つの重要な段階に従って模倣する。
我々は、テキスト生成を介して対話する大規模言語モデル(LLM)と視覚言語モデル(VLM)を用いて、IRモデルのツールボックスを操作する。
実験では、複雑なIRタスクを扱うAgenicIRの可能性を実証し、視覚処理における汎用知性を達成するための有望な道を示す。
論文 参考訳(メタデータ) (2024-10-23T12:11:26Z) - LoRA-IR: Taming Low-Rank Experts for Efficient All-in-One Image Restoration [62.3751291442432]
高速なオールインワン画像復元を実現するために,コンパクトな低ランクの専門家を動的に活用する,フレキシブルなフレームワークであるLoRA-IRを提案する。
LoRA-IRは、劣化誘導前訓練とパラメータ効率の良い微調整の2つの訓練段階で構成されている。
実験により、LoRA-IRは計算効率を維持しつつ、14のIRタスクと29のベンチマークでSOTA性能を達成することが示された。
論文 参考訳(メタデータ) (2024-10-20T13:00:24Z) - MENTOR: Mixture-of-Experts Network with Task-Oriented Perturbation for Visual Reinforcement Learning [17.437573206368494]
視覚深部強化学習(RL)は、ロボットが非構造化タスクの視覚入力からスキルを習得することを可能にする。
現在のアルゴリズムはサンプル効率が低く、実用性が制限されている。
本稿では,RLエージェントのアーキテクチャと最適化の両方を改善する手法であるMENTORを提案する。
論文 参考訳(メタデータ) (2024-10-19T04:31:54Z) - Chain-of-Restoration: Multi-Task Image Restoration Models are Zero-Shot Step-by-Step Universal Image Restorers [53.298698981438]
本稿では,UIR(Universal Image Restoration)という新たなタスク設定を提案する。
UIRは、すべての劣化組み合わせのトレーニングを必要とせず、一連の劣化基だけに限って、これらの基がゼロショットで構成できる可能性のある劣化を取り除く。
本稿では,未知の複合劣化を段階的に除去するモデルをモデルに指示する,CoR(Chain-of-Restoration)機構を提案する。
論文 参考訳(メタデータ) (2024-10-11T10:21:42Z) - RestoreAgent: Autonomous Image Restoration Agent via Multimodal Large Language Models [45.88103575837924]
マルチモーダルな大言語モデルを活用したインテリジェントな画像復元システムであるRestoreAgentを紹介する。
RestoreAgentは、入力画像の劣化の種類と程度を自律的に評価し、(1)適切な復元タスクを決定すること、(2)タスクシーケンスを最適化すること、(3)最も適切なモデルを選択すること、(4)復元を実行することを通じて復元を行う。
実験結果は,RestoreAgentの複雑な劣化処理における優れた性能を示し,人間の専門家を上回った。
論文 参考訳(メタデータ) (2024-07-25T13:29:37Z) - Efficient Degradation-aware Any Image Restoration [83.92870105933679]
我々は,低ランク体制下での学習者(DaLe)を用いた効率的なオールインワン画像復元システムである textitDaAIR を提案する。
モデルキャパシティを入力劣化に動的に割り当てることにより、総合学習と特定の学習を統合した効率的な復調器を実現する。
論文 参考訳(メタデータ) (2024-05-24T11:53:27Z) - Forgetful Experience Replay in Hierarchical Reinforcement Learning from
Demonstrations [55.41644538483948]
本稿では,複雑な視覚環境において,エージェントが低品質な実演を行えるようにするためのアプローチの組み合わせを提案する。
提案した目標指向のリプレイバッファ構築により,エージェントはデモにおいて複雑な階層的タスクを解くためのサブゴールを自動的に強調することができる。
私たちのアルゴリズムに基づくこのソリューションは、有名なMineRLコンペティションのすべてのソリューションを破り、エージェントがMinecraft環境でダイヤモンドをマイニングすることを可能にする。
論文 参考訳(メタデータ) (2020-06-17T15:38:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。