Fugu-MT 論文翻訳(概要): Controllable Prompt Tuning For Balancing Group Distributional Robustness

論文の概要: Controllable Prompt Tuning For Balancing Group Distributional Robustness

arxiv url: http://arxiv.org/abs/2403.02695v2
Date: Tue, 4 Jun 2024 21:25:20 GMT
ステータス: 翻訳完了
システム内更新日: 2024-06-07 00:51:07.586245
Title: Controllable Prompt Tuning For Balancing Group Distributional Robustness
Title（参考訳）: 分散ロバスト性バランスのための制御可能なプロンプトチューニング
Authors: Hoang Phan, Andrew Gordon Wilson, Qi Lei,
Abstract要約: グループ間で優れたパフォーマンスを実現するための最適化スキームを導入し、それらの性能を著しく犠牲にすることなく、全員に良い解決策を見出す。本稿では,制御可能なプロンプトチューニング(CPT)を提案する。突発的相関ベンチマークでは, 変換器と非変換器の両アーキテクチャ, および非モーダルおよびマルチモーダルデータにまたがって, 最先端の結果が得られた。
参考スコア（独自算出の注目度）: 53.336515056479705
License: http://creativecommons.org/publicdomain/zero/1.0/
Abstract: Models trained on data composed of different groups or domains can suffer from severe performance degradation under distribution shifts. While recent methods have largely focused on optimizing the worst-group objective, this often comes at the expense of good performance on other groups. To address this problem, we introduce an optimization scheme to achieve good performance across groups and find a good solution for all without severely sacrificing performance on any of them. However, directly applying such optimization involves updating the parameters of the entire network, making it both computationally expensive and challenging. Thus, we introduce Controllable Prompt Tuning (CPT), which couples our approach with prompt-tuning techniques. On spurious correlation benchmarks, our procedures achieve state-of-the-art results across both transformer and non-transformer architectures, as well as unimodal and multimodal data, while requiring only 0.4% tunable parameters.
Abstract（参考訳）: 異なるグループやドメインで構成されたデータに基づいてトレーニングされたモデルは、分散シフト時に深刻なパフォーマンス劣化に悩まされる可能性がある。最近の手法は、最悪のグループ目標の最適化に重点を置いているが、これはしばしば、他のグループに対する良いパフォーマンスを犠牲にしている。この問題に対処するために,グループ間での優れた性能を実現する最適化手法を導入し,それらの性能を著しく犠牲にすることなく,優れた解を求める。しかし、そのような最適化を直接適用するには、ネットワーク全体のパラメータを更新する必要がある。そこで,制御可能なプロンプトチューニング(CPT)を導入する。突発的な相関ベンチマークでは、変換器と非変換器の両アーキテクチャ、および非モーダルおよびマルチモーダルのデータに対して、調整可能なパラメータは0.4%しか必要とせず、最先端の結果が得られる。

関連論文リスト

VAGPO: Vision-augmented Asymmetric Group Preference Optimization for the Routing Problems [2.150410718150006]
ルーティング問題の解法として,視覚拡張型非対称グループ優先最適化(VAGPO)を提案する。 ResNetベースのビジュアルエンコーディングとTransformerベースのシーケンシャルモデリングを活用することで、VAGPOは空間構造と時間的依存関係の両方をキャプチャする。実験結果から,提案したVAGPOは競争力の高いソリューション品質を実現するだけでなく,再学習なしに大規模インスタンスに強力な一般化を示すことがわかった。
論文参考訳（メタデータ） (2025-08-03T14:19:12Z)
Model Performance-Guided Evaluation Data Selection for Effective Prompt Optimization [12.683042228674694]
IPOMPは、セマンティッククラスタリングとバウンダリ分析を使用して、代表的で多様なサンプルを選択する2段階のアプローチである。我々は、IPOMPがSOTAベースラインと比較して、効率を1.6%から5.3%改善し、安定性を少なくとも57%向上させることを示した。
論文参考訳（メタデータ） (2025-05-15T22:41:30Z)
GroupTuner: Efficient Group-Aware Compiler Auto-Tuning [14.545919877837436]
GroupTunerは、歴史的に最高のパフォーマンスの組み合わせに基づいて、コヒーレントオプショングループに局所突然変異を適用するグループ認識自動チューニング技術である。実験によると、GroupTunerは競争力のあるオプションの組み合わせを効率的に発見でき、平均性能は-O3よりも12.39%向上している。
論文参考訳（メタデータ） (2025-05-13T14:13:38Z)
Performance-driven Constrained Optimal Auto-Tuner for MPC [36.143463447995536]
MPCのための制約付き最適オートチューニングであるCOAT-MPCを提案する。 COAT-MPCは、パフォーマンスデータを収集し、その後続の信念を更新することによって学習する。理論的にはCOAT-MPCを解析し,性能制約を任意に高い確率で満たすことを示した。
論文参考訳（メタデータ） (2025-03-10T09:56:08Z)
Dynamic Noise Preference Optimization for LLM Self-Improvement via Synthetic Data [51.62162460809116]
我々は、イテレーション間で一貫した改善を保証するために、動的ノイズ優先最適化(DNPO)を導入します。 Zephyr-7Bでの実験では、DNPOは既存の手法を一貫して上回り、平均性能は2.6%向上した。 DNPOは、GPT-4評価のベースラインに比べて29.4%のウィンロス率差で、モデル生成データの品質が大幅に向上したことを示している。
論文参考訳（メタデータ） (2025-02-08T01:20:09Z)
Parameter Tracking in Federated Learning with Adaptive Optimization [14.111863825607001]
フェデレートラーニング(FL)では、モデルトレーニングのパフォーマンスはクライアント間のデータ不均一性に強く影響されます。 GT(Gradient Tracking)は、最近、局所モデル更新に修正項を導入することでこの問題を軽減するソリューションとして登場した。現在まで、GTはグラディエント(SGD)ベースのDescentトレーニングしか考慮されていないが、現代のFLフレームワークは収束を改善するために適応性を採用する傾向にある。
論文参考訳（メタデータ） (2025-02-04T21:21:30Z)
Transformer-based Model Predictive Control: Trajectory Optimization via Sequence Modeling [16.112708478263745]
本稿では,最適化に基づく学習手法の主な強みを組み合わせた統合フレームワークを提案する。我々のアプローチでは、最適化プロセス内に高容量、トランスフォーマーベースのニューラルネットワークモデルを組み込む必要がある。純粋に最適化に基づくアプローチと比較すると,提案手法では最大75%の性能向上が期待できる。
論文参考訳（メタデータ） (2024-10-31T13:23:10Z)
Federated Learning of Large Language Models with Parameter-Efficient Prompt Tuning and Adaptive Optimization [71.87335804334616]
フェデレートラーニング(FL)は、分散データとの協調モデルトレーニングを可能にする、有望なパラダイムである。 LLM(Large Language Models)のトレーニングプロセスは一般的に重要なパラメータの更新を引き起こす。本稿では,性能と効率を同時に向上する効率的な部分的プロンプトチューニング手法を提案する。
論文参考訳（メタデータ） (2023-10-23T16:37:59Z)
Towards General and Efficient Online Tuning for Spark [55.30868031221838]
本稿では,3つの問題を同時に処理できる汎用的で効率的なSparkチューニングフレームワークを提案する。我々は、このフレームワークを独立したクラウドサービスとして実装し、Tencentのデータプラットフォームに適用しました。
論文参考訳（メタデータ） (2023-09-05T02:16:45Z)
Bidirectional Looking with A Novel Double Exponential Moving Average to Adaptive and Non-adaptive Momentum Optimizers [109.52244418498974]
我々は,新しいtextscAdmeta(textbfADouble指数textbfMov averagtextbfE textbfAdaptiveおよび非適応運動量)フレームワークを提案する。我々は、textscAdmetaR と textscAdmetaS の2つの実装を提供し、前者は RAdam を、後者は SGDM をベースとしています。
論文参考訳（メタデータ） (2023-07-02T18:16:06Z)
Robust Prompt Optimization for Large Language Models Against Distribution Shifts [80.6757997074956]
大規模言語モデル(LLM)は、様々な自然言語処理タスクにおいて重要な能力を示している。本稿では,LLMの分散シフトに対するロバストな最適化法を提案する。この問題は、ラベル付けされたソースグループに最適化されたプロンプトを同時にラベル付けされていないターゲットグループに一般化する必要がある。
論文参考訳（メタデータ） (2023-05-23T11:30:43Z)
Parameter-efficient Tuning of Large-scale Multimodal Foundation Model [68.24510810095802]
我々はこれらの課題を克服するために、クロスモーダル転送(Aurora)のための優雅なプロンプトフレームワークを提案する。既存のアーキテクチャの冗長性を考慮すると、まずモード近似を用いて0.1Mのトレーニング可能なパラメータを生成し、マルチモーダルプロンプトチューニングを実装する。 6つのクロスモーダルベンチマークの徹底的な評価は、最先端のベンチマークを上回るだけでなく、完全な微調整アプローチよりも優れていることを示している。
論文参考訳（メタデータ） (2023-05-15T06:40:56Z)
Backpropagation of Unrolled Solvers with Folded Optimization [55.04219793298687]
ディープネットワークにおけるコンポーネントとしての制約付き最適化モデルの統合は、多くの専門的な学習タスクに有望な進歩をもたらした。 1つの典型的な戦略はアルゴリズムのアンローリングであり、これは反復解法の操作による自動微分に依存している。本稿では,非ロール最適化の後方通過に関する理論的知見を提供し,効率よく解けるバックプロパゲーション解析モデルを生成するシステムに繋がる。
論文参考訳（メタデータ） (2023-01-28T01:50:42Z)
Consolidated learning -- a domain-specific model-free optimization strategy with examples for XGBoost and MIMIC-IV [4.370097023410272]
本稿では,統合学習と呼ばれるチューニング問題の新たな定式化を提案する。このような設定では、単一のタスクをチューニングするよりも、全体の最適化時間に関心があります。我々は,XGBoostアルゴリズムの実証研究とMIMIC-IV医療データベースから抽出した予測タスクの収集を通じて,このアプローチの有効性を実証する。
論文参考訳（メタデータ） (2022-01-27T21:38:53Z)
Multi-Objectivizing Software Configuration Tuning (for a single performance concern) [7.285442358509729]
補助的な性能目標を考慮したメタ目的化モデル(MMO)を提案する。我々のモデルは,局所最適性を克服する上で,最先端の単目的モデルよりも統計的に有効である。
論文参考訳（メタデータ） (2021-05-31T03:03:53Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。