論文の概要: You Only Look Once at Anytime (AnytimeYOLO): Analysis and Optimization of Early-Exits for Object-Detection
- arxiv url: http://arxiv.org/abs/2503.17497v1
- Date: Fri, 21 Mar 2025 19:16:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-25 14:37:54.093885
- Title: You Only Look Once at Anytime (AnytimeYOLO): Analysis and Optimization of Early-Exits for Object-Detection
- Title(参考訳): 一度だけ見る(AnytimeYOLO):オブジェクト検出の初期段階の分析と最適化
- Authors: Daniel Kuhse, Harun Teper, Sebastian Buschjäger, Chien-Yao Wang, Jian-Jia Chen,
- Abstract要約: 我々は、任意のオブジェクト検出を可能にするYOLOアーキテクチャの亜種であるAnytimeYOLOを紹介する。
私たちのAnytimeYOLOネットワークは、割り込み可能な推論を可能にする。すなわち、安全クリティカルなリアルタイムアプリケーションに望ましい特性である任意の時点の予測を提供する。
- 参考スコア(独自算出の注目度): 7.980812989961303
- License:
- Abstract: We introduce AnytimeYOLO, a family of variants of the YOLO architecture that enables anytime object detection. Our AnytimeYOLO networks allow for interruptible inference, i.e., they provide a prediction at any point in time, a property desirable for safety-critical real-time applications. We present structured explorations to modify the YOLO architecture, enabling early termination to obtain intermediate results. We focus on providing fine-grained control through high granularity of available termination points. First, we formalize Anytime Models as a special class of prediction models that offer anytime predictions. Then, we discuss a novel transposed variant of the YOLO architecture, that changes the architecture to enable better early predictions and greater freedom for the order of processing stages. Finally, we propose two optimization algorithms that, given an anytime model, can be used to determine the optimal exit execution order and the optimal subset of early-exits to select for deployment in low-resource environments. We evaluate the anytime performance and trade-offs of design choices, proposing a new anytime quality metric for this purpose. In particular, we also discuss key challenges for anytime inference that currently make its deployment costly.
- Abstract(参考訳): 我々は、任意のオブジェクト検出を可能にするYOLOアーキテクチャの亜種であるAnytimeYOLOを紹介する。
私たちのAnytimeYOLOネットワークは、割り込み可能な推論を可能にする。すなわち、安全クリティカルなリアルタイムアプリケーションに望ましい特性である任意の時点の予測を提供する。
我々は、YOLOアーキテクチャを変更するための構造化探索を行い、早期終了により中間結果が得られるようにした。
我々は、利用可能な終点の粒度を高くすることで、きめ細かい制御を提供することに重点を置いている。
まず、任意の予測を提供する予測モデルの特別なクラスとして、Anytime Modelsを定式化する。
そこで我々は,より早い段階での予測と処理の順序に対する自由度を高めるため,アーキテクチャを改良したYOLOアーキテクチャの新たな変種について論じる。
最後に、任意の時間モデルが与えられた場合、最適な出口実行順序と、低リソース環境における配置を選択するための早期出力の最適サブセットを決定するために使用できる2つの最適化アルゴリズムを提案する。
我々は、設計選択のいつでものパフォーマンスとトレードオフを評価し、この目的のために新しい常に品質基準を提案します。
特に、現在デプロイにコストがかかる、あらゆる時間的推論に関する重要な課題についても議論しています。
関連論文リスト
- Automatic selection of the best neural architecture for time series forecasting via multi-objective optimization and Pareto optimality conditions [1.4843690728082002]
時系列予測は、天気予報、医療、構造的健康モニタリング、予測保守、エネルギーシステム、金融市場など、幅広い分野で重要な役割を果たしている。
LSTM、GRU、Transformers、State-Space Models (SSM) などのモデルがこの領域の標準ツールとなっているが、最適なアーキテクチャを選択することは依然として課題である。
本稿では,LSTM,GRU,マルチヘッドアテンション,SSMブロックを統合した時系列予測のためのフレキシブルな自動フレームワークを提案する。
論文 参考訳(メタデータ) (2025-01-21T15:33:55Z) - Revisiting SMoE Language Models by Evaluating Inefficiencies with Task Specific Expert Pruning [78.72226641279863]
SMOE(Sparse Mixture of Expert)モデルは、言語モデリングにおける高密度モデルに代わるスケーラブルな代替品として登場した。
本研究は,SMoEアーキテクチャの設計に関する意思決定を行うために,タスク固有のモデルプルーニングについて検討する。
適応型タスク対応プルーニング手法 UNCURL を導入し,MoE 層当たりの専門家数をオフラインで学習する手法を提案する。
論文 参考訳(メタデータ) (2024-09-02T22:35:03Z) - UniST: A Prompt-Empowered Universal Model for Urban Spatio-Temporal Prediction [26.69233687863233]
都市時間予測は、交通管理、資源最適化、出現応答などの情報的意思決定に不可欠である。
大規模言語モデルによる広範囲のシナリオにまたがる一般都市時間予測のためのユニバーサルモデルUniSTを紹介する。
論文 参考訳(メタデータ) (2024-02-19T05:04:11Z) - Embedded feature selection in LSTM networks with multi-objective
evolutionary ensemble learning for time series forecasting [49.1574468325115]
本稿では,Long Short-Term Memory Networkに埋め込まれた特徴選択手法を提案する。
本手法はLSTMの重みと偏りを分割的に最適化する。
イタリアとスペイン南東部の大気質時系列データの実験的評価により,従来のLSTMの能力一般化が著しく向上することが確認された。
論文 参考訳(メタデータ) (2023-12-29T08:42:10Z) - An Adaptive Framework for Generalizing Network Traffic Prediction
towards Uncertain Environments [51.99765487172328]
我々は,モバイルネットワークトラフィック予測モデルを動的に割り当てるための時系列解析を用いた新しいフレームワークを開発した。
我々のフレームワークは学習した振る舞いを採用しており、現在の研究と比較して50%以上の改善が得られ、どのモデルよりも優れています。
論文 参考訳(メタデータ) (2023-11-30T18:58:38Z) - Lag-Llama: Towards Foundation Models for Probabilistic Time Series
Forecasting [54.04430089029033]
本稿では,デコーダのみの変換器アーキテクチャに基づく時系列予測のための汎用基礎モデルであるLag-Llamaを提案する。
Lag-Llamaは、複数のドメインからの多様な時系列データの大規模なコーパスで事前訓練され、強力なゼロショット一般化能力を示す。
このような未確認データセットの比較的小さな部分で微調整を行うと、Lag-Llamaは最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2023-10-12T12:29:32Z) - Towards Anytime Classification in Early-Exit Architectures by Enforcing
Conditional Monotonicity [5.425028186820756]
任意のアルゴリズムは、計算予算が動的である環境に適しています。
現在のアーリーエグジットネットワークは、任意の設定に直接適用できないことを示す。
本稿では,製品・オブ・エグゼクティブ(Product-of-Experts)に基づくエレガントなポストホック修正を提案する。
論文 参考訳(メタデータ) (2023-06-05T07:38:13Z) - A Novel Long-term Iterative Mining Scheme for Video Salient Object
Detection [54.53335983750033]
短期的方法論は視覚システムの実際のメカニズムと矛盾する。
そこで本研究では,VSOD を長期にわたって実施する新しい VSOD アプローチを提案する。
提案手法は、広く使用されている5つのベンチマークデータセットにおいて、ほぼ全てのSOTAモデルより優れている。
論文 参考訳(メタデータ) (2022-06-20T04:27:47Z) - Multi-objective Asynchronous Successive Halving [10.632606255280649]
本稿では,非同期半減期 (ASHA) を多目的 (MO) 設定に拡張するアルゴリズムを提案する。
実験分析の結果,MO ASHAはMO HPOを大規模に実行可能であることがわかった。
我々のアルゴリズムは、この地域における将来の研究の新たなベースラインを確立する。
論文 参考訳(メタデータ) (2021-06-23T19:39:31Z) - The Perils of Learning Before Optimizing [16.97597806975415]
本稿では,最適化タスクを通じて予測モデルを識別することで,エンドツーエンドで予測モデルを学習する方法を示す。
2段階のアプローチとエンドツーエンドのアプローチのパフォーマンスギャップは、最適化における相関の概念の強調と密接に関係していることが示される。
論文 参考訳(メタデータ) (2021-06-18T20:43:47Z) - Long-Horizon Visual Planning with Goal-Conditioned Hierarchical
Predictors [124.30562402952319]
未来に予測し、計画する能力は、世界で行動するエージェントにとって基本である。
視覚的予測と計画のための現在の学習手法は、長期的タスクでは失敗する。
本稿では,これらの制約を克服可能な視覚的予測と計画のためのフレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-23T17:58:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。