論文の概要: One Search Fits All: Pareto-Optimal Eco-Friendly Model Selection
- arxiv url: http://arxiv.org/abs/2505.01468v1
- Date: Fri, 02 May 2025 05:59:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-06 18:49:35.135171
- Title: One Search Fits All: Pareto-Optimal Eco-Friendly Model Selection
- Title(参考訳): 1つの検索がすべて:Pareto-Optimal Eco-Friendly Model選択
- Authors: Filippo Betello, Antonio Purificato, Vittoria Vineis, Gabriele Tolomei, Fabrizio Silvestri,
- Abstract要約: GREEN(Guided Recommendations of Energy-Efficient Networks)は,モデル構成を推奨する新しい推論時間アプローチである。
提案手法は,現在のエコ効率なニューラルアーキテクチャ探索手法の限界に直接対処する。
提案手法は,競争性能を確保しつつ,エネルギー効率の高い構成の同定に成功していることを示す。
- 参考スコア(独自算出の注目度): 5.8822780483882315
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The environmental impact of Artificial Intelligence (AI) is emerging as a significant global concern, particularly regarding model training. In this paper, we introduce GREEN (Guided Recommendations of Energy-Efficient Networks), a novel, inference-time approach for recommending Pareto-optimal AI model configurations that optimize validation performance and energy consumption across diverse AI domains and tasks. Our approach directly addresses the limitations of current eco-efficient neural architecture search methods, which are often restricted to specific architectures or tasks. Central to this work is EcoTaskSet, a dataset comprising training dynamics from over 1767 experiments across computer vision, natural language processing, and recommendation systems using both widely used and cutting-edge architectures. Leveraging this dataset and a prediction model, our approach demonstrates effectiveness in selecting the best model configuration based on user preferences. Experimental results show that our method successfully identifies energy-efficient configurations while ensuring competitive performance.
- Abstract(参考訳): 人工知能(AI)の環境影響は、特にモデルトレーニングに関する重要な国際的関心事として浮上している。
本稿では,多様なAIドメインやタスクにまたがる検証性能とエネルギー消費を最適化するパレート最適AIモデル構成を推奨する,新しい推論時間アプローチであるGREENを紹介する。
我々のアプローチは、しばしば特定のアーキテクチャやタスクに制限される、現在のエコ効率なニューラルアーキテクチャ探索手法の限界に直接対処する。
この研究の中心はEcoTaskSetであり、コンピュータビジョン、自然言語処理、そして広く使われているアーキテクチャと最先端のアーキテクチャの両方を使用したレコメンデーションシステムを含む1767以上の実験のトレーニングダイナミクスを含むデータセットである。
このデータセットと予測モデルを利用して、ユーザの好みに基づいて最適なモデル構成を選択することの有効性を示す。
実験の結果,提案手法は競争性能を確保しつつ,エネルギー効率の高い構成の同定に成功していることがわかった。
関連論文リスト
- Energy Considerations of Large Language Model Inference and Efficiency Optimizations [28.55549828393871]
大規模言語モデル(LLM)の規模と採用が拡大するにつれて、その計算と環境コストは上昇し続けている。
多様なNLPおよびAIワークロードにまたがる共通推論効率最適化のエネルギー含意を系統的に分析する。
本研究により, 推定効率最適化の適切な適用により, 最適化されていないベースラインから最大73%のエネルギー使用量を削減できることが判明した。
論文 参考訳(メタデータ) (2025-04-24T15:45:05Z) - Fine-tune Smarter, Not Harder: Parameter-Efficient Fine-Tuning for Geospatial Foundation Models [16.522696273752835]
地球観測は、環境変化の監視、災害への対応、天然資源の管理に不可欠である。
基礎モデルにより、リモートセンシング画像解析により、関係する地理情報を正確かつ効率的に取得することができる。
これらのモデルのサイズが大きくなるにつれて、関連する計算資源とコストのために微調整がますます困難になる。
論文 参考訳(メタデータ) (2025-04-24T09:37:02Z) - A Survey on Inference Optimization Techniques for Mixture of Experts Models [50.40325411764262]
大規模Mixture of Experts(MoE)モデルは、条件計算によるモデル容量と計算効率の向上を提供する。
これらのモデル上で推論をデプロイし実行することは、計算資源、レイテンシ、エネルギー効率において大きな課題を示す。
本調査では,システムスタック全体にわたるMoEモデルの最適化手法について分析する。
論文 参考訳(メタデータ) (2024-12-18T14:11:15Z) - A Bayesian Approach to Robust Inverse Reinforcement Learning [54.24816623644148]
我々は、オフラインモデルに基づく逆強化学習(IRL)に対するベイズ的アプローチを考える。
提案フレームワークは,専門家の報酬関数と環境力学の主観的モデルとを同時推定することにより,既存のオフラインモデルベースIRLアプローチとは異なる。
本分析は, 専門家が環境の高精度なモデルを持つと考えられる場合, 評価政策が堅牢な性能を示すという新たな知見を提示する。
論文 参考訳(メタデータ) (2023-09-15T17:37:09Z) - Learning to Continuously Optimize Wireless Resource in a Dynamic
Environment: A Bilevel Optimization Perspective [52.497514255040514]
この研究は、データ駆動メソッドが動的環境でリソース割り当て戦略を継続的に学び、最適化することを可能にする新しいアプローチを開発しています。
学習モデルが新たなエピソードに段階的に適応できるように、連続学習の概念を無線システム設計に組み込むことを提案する。
我々の設計は、異なるデータサンプルにまたがる公平性を保証する、新しい二段階最適化定式化に基づいている。
論文 参考訳(メタデータ) (2021-05-03T07:23:39Z) - Learning to Continuously Optimize Wireless Resource In Episodically
Dynamic Environment [55.91291559442884]
この研究は、データ駆動型手法が動的環境で継続的に学習し、最適化できる方法論を開発する。
本稿では,無線システム学習のモデリングプロセスに連続学習の概念を構築することを提案する。
我々の設計は、異なるデータサンプル間で「一定の公正性を保証する」新しいmin-maxの定式化に基づいている。
論文 参考訳(メタデータ) (2020-11-16T08:24:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。