Fugu-MT 論文翻訳(概要): LossAgent: Towards Any Optimization Objectives for Image Processing with LLM Agents

論文の概要: LossAgent: Towards Any Optimization Objectives for Image Processing with LLM Agents

arxiv url: http://arxiv.org/abs/2412.04090v1
Date: Thu, 05 Dec 2024 11:52:20 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-06 20:43:02.032452
Title: LossAgent: Towards Any Optimization Objectives for Image Processing with LLM Agents
Title（参考訳）: LossAgent: LLMエージェントによる画像処理のための最適化対象を目指して
Authors: Bingchen Li, Xin Li, Yiting Lu, Zhibo Chen,
Abstract要約: LossAgentは、低レベル画像処理の最適化目的を、異なる実用アプリケーションで実現することを目的としている。本稿では,損失エージェントとして強力な大規模言語モデル (LLM) を導入する。特に,低レベル画像処理におけるエンドツーエンドの最適化をサポートする既存のロス関数を組み込むことで,ロスレポジトリを確立する。
参考スコア（独自算出の注目度）: 16.534263448775103
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We present the first loss agent, dubbed LossAgent, for low-level image processing tasks, e.g., image super-resolution and restoration, intending to achieve any customized optimization objectives of low-level image processing in different practical applications. Notably, not all optimization objectives, such as complex hand-crafted perceptual metrics, text description, and intricate human feedback, can be instantiated with existing low-level losses, e.g., MSE loss. which presents a crucial challenge in optimizing image processing networks in an end-to-end manner. To eliminate this, our LossAgent introduces the powerful large language model (LLM) as the loss agent, where the rich textual understanding of prior knowledge empowers the loss agent with the potential to understand complex optimization objectives, trajectory, and state feedback from external environments in the optimization process of the low-level image processing networks. In particular, we establish the loss repository by incorporating existing loss functions that support the end-to-end optimization for low-level image processing. Then, we design the optimization-oriented prompt engineering for the loss agent to actively and intelligently decide the compositional weights for each loss in the repository at each optimization interaction, thereby achieving the required optimization trajectory for any customized optimization objectives. Extensive experiments on three typical low-level image processing tasks and multiple optimization objectives have shown the effectiveness and applicability of our proposed LossAgent. Code and pre-trained models will be available at https://github.com/lbc12345/LossAgent.
Abstract（参考訳）: 我々は,低レベル画像処理タスク,例えば画像超解像と復元のためのロスエージェント(LosAgent)を提案する。特に、複雑な手作りの知覚メトリクス、テキスト記述、複雑な人間のフィードバックなど、すべての最適化目標が、既存の低レベルな損失(例えば、MSE損失)でインスタンス化できるわけではない。これは、画像処理ネットワークをエンドツーエンドで最適化する上で重要な課題である。これを排除するため、ロスアジェントは、ロスエージェントとして強力な大規模言語モデル(LLM)を導入し、低レベル画像処理ネットワークの最適化プロセスにおいて、複雑な最適化目標、軌道、状態フィードバックを理解する可能性を持つ、事前知識の豊富なテキスト的理解により、損失エージェントに権限を与える。特に,低レベル画像処理におけるエンドツーエンドの最適化をサポートする既存のロス関数を組み込むことで,ロスレポジトリを確立する。そこで,各最適化操作において,各リポジトリの損失に対する構成重み付けを能動的かつインテリジェントに決定し,任意の最適化目的に対して必要な最適化軌跡を実現するために,ロスエージェントのための最適化指向のプロンプトエンジニアリングを設計する。提案したLossAgentの有効性と適用性を示した。コードおよび事前トレーニングされたモデルは、https://github.com/lbc12345/LossAgent.comで入手できる。

関連論文リスト

Preference Optimization for Combinatorial Optimization Problems [54.87466279363487]
強化学習(Reinforcement Learning, RL)は、ニューラルネットワーク最適化のための強力なツールとして登場した。大幅な進歩にもかかわらず、既存のRLアプローチは報酬信号の減少や大規模な行動空間における非効率な探索といった課題に直面している。統計的比較モデルを用いて定量的報酬信号を定性的選好信号に変換する新しい手法であるPreference Optimizationを提案する。
論文参考訳（メタデータ） (2025-05-13T16:47:00Z)
Optimal Transport Adapter Tuning for Bridging Modality Gaps in Few-Shot Remote Sensing Scene Classification [80.83325513157637]
Few-Shot Remote Sensing Scene Classification (FS-RSSC)は,限られたラベル付きサンプルを用いたリモートセンシング画像の分類の課題を示す。理想的なプラトン表現空間を構築することを目的とした,OTAT(Optimal Transport Adapter Tuning)フレームワークを提案する。
論文参考訳（メタデータ） (2025-03-19T07:04:24Z)
A Survey on the Optimization of Large Language Model-based Agents [16.733092886211097]
大規模言語モデル(LLM)は様々な分野で広く採用されており、自律的な意思決定や対話的なタスクに欠かせないものとなっている。しかしながら、現在の作業は通常、バニラLLMに適用された迅速な設計や微調整戦略に依存している。 LLMに基づくエージェント最適化手法の総合的なレビューを行い、パラメータ駆動型およびパラメータフリーな手法に分類する。
論文参考訳（メタデータ） (2025-03-16T10:09:10Z)
Continual Optimization with Symmetry Teleportation for Multi-Task Learning [73.28772872740744]
マルチタスク学習(MTL)は、1つのモデルを用いて複数のタスクの同時学習を可能にする。シンメトリ・テレポーテーション(COST)を用いた連続最適化に基づく新しい手法を提案する。 COSTは、競合の勾配を減らすために、損失ランドスケープに別の損失等価点を求める。
論文参考訳（メタデータ） (2025-03-06T02:58:09Z)
Towards more Contextual Agents: An extractor-Generator Optimization Framework [0.0]
LLM(Large Language Model)ベースのエージェントは、幅広い汎用アプリケーションにわたる複雑なタスクの解決に顕著な成功を収めている。しかしながら、それらのパフォーマンスは、専門産業や研究領域のようなコンテキスト固有のシナリオで劣化することが多い。この課題に対処するため,本研究では,LLMエージェントの文脈適応性を高めるための体系的アプローチを提案する。
論文参考訳（メタデータ） (2025-02-18T15:07:06Z)
Explicit and Implicit Graduated Optimization in Deep Neural Networks [0.6906005491572401]
本稿では,最適雑音スケジューリングを用いた明示的な累積最適化アルゴリズムの性能を実験的に評価する。さらに、ResNetアーキテクチャを用いた画像分類タスクの実験を通じて、その効果を実証する。
論文参考訳（メタデータ） (2024-12-16T07:23:22Z)
Perceptual-Distortion Balanced Image Super-Resolution is a Multi-Objective Optimization Problem [23.833099288826045]
画素ベースの回帰損失を用いた単一画像超解法(SISR)モデルのトレーニングは、高い歪みメトリクススコアを得ることができる。しかし、高周波の詳細の回復が不十分なため、しばしばぼやけた画像が生じる。本稿では,Multi-Objective Optimization(MOO)をSISRモデルのトレーニングプロセスに組み込んで,知覚品質と歪みのバランスをとる手法を提案する。
論文参考訳（メタデータ） (2024-09-05T02:14:04Z)
Discovering Preference Optimization Algorithms with and for Large Language Models [50.843710797024805]
オフライン優先最適化は、LLM(Large Language Model)出力の品質を向上・制御するための重要な手法である。我々は、人間の介入なしに、新しい最先端の選好最適化アルゴリズムを自動で発見する客観的発見を行う。実験は、ロジスティックと指数的損失を適応的にブレンドする新しいアルゴリズムであるDiscoPOPの最先端性能を示す。
論文参考訳（メタデータ） (2024-06-12T16:58:41Z)
Perception-Distortion Balanced Super-Resolution: A Multi-Objective Optimization Perspective [16.762410459930006]
超解像(SR)のような画像復元作業における高知覚品質と低歪み度は重要な目標である現在の勾配に基づく手法は、矛盾する損失の逆勾配方向のため、これらの目的のバランスをとるのが難しい。本稿では、多目的最適化問題としてSRの知覚歪トレードオフを定式化し、勾配自由進化アルゴリズム(EA)と勾配ベースAdamを統合することにより、新しいアルゴリズムを開発する。
論文参考訳（メタデータ） (2023-12-24T04:59:30Z)
Gradient constrained sharpness-aware prompt learning for vision-language models [99.74832984957025]
本稿では,視覚言語モデル(VLM)の一般化可能な即時学習における新たなトレードオフ問題を提案する。最先端手法のロスランドスケープとSAMに基づくバニラシャープネス認識最小化法を解析することにより、トレードオフ性能は損失値と損失シャープネスの両方に相関していると結論付けた。本稿では,GCSCoOp (Gradient Constrained Sharpness-Aware Context Optimization) と表記される,素早い学習のためのSAMベースの新しい手法を提案する。
論文参考訳（メタデータ） (2023-09-14T17:13:54Z)
Latent-Optimized Adversarial Neural Transfer for Sarcasm Detection [50.29565896287595]
サーカズム検出のための共通データセットを活用するために,転送学習を適用する。異なる損失が互いに対応できる汎用的な潜時最適化戦略を提案します。特に、isarcasmデータセットの以前の状態よりも10.02%の絶対性能向上を達成している。
論文参考訳（メタデータ） (2021-04-19T13:07:52Z)
Optimization-Inspired Learning with Architecture Augmentations and Control Mechanisms for Low-Level Vision [74.9260745577362]
本稿では,GDC(Generative, Discriminative, and Corrective)の原則を集約する,最適化に着想を得た統合学習フレームワークを提案する。フレキシブルな組み合わせで最適化モデルを効果的に解くために,3つのプロパゲーティブモジュールを構築した。低レベル視覚タスクにおける実験は、GDCの有効性と適応性を検証する。
論文参考訳（メタデータ） (2020-12-10T03:24:53Z)
Automatically Learning Compact Quality-aware Surrogates for Optimization Problems [55.94450542785096]
未知パラメータで最適化問題を解くには、未知パラメータの値を予測し、これらの値を用いて問題を解くための予測モデルを学ぶ必要がある。最近の研究によると、複雑なトレーニングモデルパイプラインのレイヤーとして最適化の問題を含めると、観測されていない意思決定の繰り返しを予測することになる。我々は,大規模最適化問題の低次元サロゲートモデルを学習することにより,解の質を向上させることができることを示す。
論文参考訳（メタデータ） (2020-06-18T19:11:54Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。