Fugu-MT 論文翻訳(概要): Efficient Facial Landmark Detection for Embedded Systems

論文の概要: Efficient Facial Landmark Detection for Embedded Systems

arxiv url: http://arxiv.org/abs/2407.10228v1
Date: Sun, 14 Jul 2024 14:49:20 GMT
ステータス: 翻訳完了
システム内更新日: 2024-07-16 18:59:20.319399
Title: Efficient Facial Landmark Detection for Embedded Systems
Title（参考訳）: 組込みシステムにおける効率的な顔のランドマーク検出
Authors: Ji-Jia Wu,
Abstract要約: 本稿では、電力消費と時間遅延に関する課題に直面するエッジデバイス向けに特別に設計された、効率的な顔画像位置検出(EFLD)モデルを提案する。 EFLDは軽量のバックボーンとフレキシブルな検出ヘッドを備えており、それぞれがリソース制約されたデバイスの運用効率を大幅に向上する。予測コストを増大させることなく,モデルの一般化性と堅牢性を高めるためのクロスフォーマットトレーニング戦略を提案する。
参考スコア（独自算出の注目度）: 1.0878040851638
License: http://creativecommons.org/licenses/by/4.0/
Abstract: This paper introduces the Efficient Facial Landmark Detection (EFLD) model, specifically designed for edge devices confronted with the challenges related to power consumption and time latency. EFLD features a lightweight backbone and a flexible detection head, each significantly enhancing operational efficiency on resource-constrained devices. To improve the model's robustness, we propose a cross-format training strategy. This strategy leverages a wide variety of publicly accessible datasets to enhance the model's generalizability and robustness, without increasing inference costs. Our ablation study highlights the significant impact of each component on reducing computational demands, model size, and improving accuracy. EFLD demonstrates superior performance compared to competitors in the IEEE ICME 2024 Grand Challenges PAIR Competition, a contest focused on low-power, efficient, and accurate facial-landmark detection for embedded systems, showcasing its effectiveness in real-world facial landmark detection tasks.
Abstract（参考訳）: 本稿では、電力消費と時間遅延に関する課題に直面するエッジデバイス向けに特別に設計された、効率的な顔画像位置検出(EFLD)モデルを提案する。 EFLDは軽量のバックボーンとフレキシブルな検出ヘッドを備えており、それぞれがリソース制約されたデバイスの運用効率を大幅に向上する。モデルの堅牢性を改善するために,クロスフォーマットトレーニング戦略を提案する。この戦略は、さまざまな公開データセットを活用して、推論コストを増大させることなく、モデルの一般化性と堅牢性を高める。我々のアブレーション研究は、各コンポーネントが計算要求の削減、モデルサイズ、精度の向上に大きく影響していることを強調している。 EFLD は IEEE ICME 2024 Grand Challenges PAIR コンペティションにおいて、組み込みシステムに対する低消費電力で効率的で正確な顔ランドマーク検出に焦点を当てたコンペティションで、実際の顔ランドマーク検出タスクでの有効性を示している。

関連論文リスト

WebLeaper: Empowering Efficiency and Efficacy in WebAgent via Enabling Info-Rich Seeking [60.35109192765302]
情報検索は、自律的な推論と意思決定を可能にする中核的な能力である。我々は、高カバレッジなISタスクを構築し、効率的なソリューショントラジェクトリを生成するためのフレームワークであるWebLeaperを提案する。本手法は,強いベースラインに対する有効性と効率性の向上を継続的に達成する。
論文参考訳（メタデータ） (2025-10-28T17:51:42Z)
Efficient Perceptual Image Super Resolution: AIM 2025 Study and Benchmark [53.56717645904575]
我々は,厳密な効率制約を満たしつつ,Real-ESRGANの知覚結果を再現または改善することを目的としている。提案手法は,500枚の4K解像度の試験画像からなる新しいデータセット上で評価され,それぞれが複数の劣化型を用いて劣化した。最高パフォーマンスのアプローチは、すべてのベンチマークデータセットでReal-ESRGANを上回ります。
論文参考訳（メタデータ） (2025-10-14T17:45:22Z)
OptiFLIDS: Optimized Federated Learning for Energy-Efficient Intrusion Detection in IoT [0.8258451067861933]
IoT環境では、セキュリティを確保するために効果的な侵入検知システム(IDS)が不可欠である。従来の機械学習ベースのIDSモデルは一般的に大規模なデータセットを必要とするが、プライバシやセキュリティ上の懸念からデータ共有は制限されることが多い。本稿では,モデル複雑性とエネルギー消費を低減するため,局所訓練中にプルーニング技術を適用したOptiFLIDSを提案する。
論文参考訳（メタデータ） (2025-10-05T16:44:41Z)
ECORE: Energy-Conscious Optimized Routing for Deep Learning Models at the Edge [13.57054444887393]
複数の動的ルーティング戦略を統合するフレームワークであるECOREを提案する。 ECOREは、物体の特性に基づいてエネルギー効率と検出性能のバランスをとる。その結果,提案したコンテキスト対応ルーティング手法は,エネルギー消費と遅延をそれぞれ45%,遅延を49%削減できることがわかった。
論文参考訳（メタデータ） (2025-07-08T14:16:14Z)
Deploying Large AI Models on Resource-Limited Devices with Split Federated Learning [39.73152182572741]
本稿では、SFLAM(Quantized Split Federated Fine-Tuning Large AI Model)と呼ばれる新しいフレームワークを提案する。エッジデバイスとサーバ間のトレーニング負荷を分割することで、SFLAMはデバイス上の大規模なモデルの操作を容易にすることができる。 SFLAMは、トレーニング効率を高めるために、量子化管理、電力制御、帯域幅割り当て戦略を取り入れている。
論文参考訳（メタデータ） (2025-04-12T07:55:11Z)
An improved EfficientNetV2 for garbage classification [0.27309692684728615]
本稿では,データ取得コスト,一般化,リアルタイムパフォーマンスの課題に対処するため,EfficientNetV2に基づく廃棄物分類フレームワークを提案する。 Huawei Cloudの廃棄物分類データセットの実験では、本手法は95.4%の分類精度を達成し、ベースラインを3.2%上回り、主流モデルを上回っている。
論文参考訳（メタデータ） (2025-03-27T06:50:44Z)
DSMoE: Matrix-Partitioned Experts with Dynamic Routing for Computation-Efficient Dense LLMs [70.91804882618243]
本稿では,事前学習したFFN層を計算ブロックに分割することで,分散化を実現するDSMoEを提案する。我々は,Sigmoid アクティベーションとストレートスルー推定器を用いた適応型エキスパートルーティングを実装し,トークンがモデル知識の様々な側面に柔軟にアクセスできるようにする。 LLaMAモデルを用いた実験により、DSMoEは既存のプルーニング法やMoE法に比べて優れた性能を発揮することが示された。
論文参考訳（メタデータ） (2025-02-18T02:37:26Z)
Efficient Detection Framework Adaptation for Edge Computing: A Plug-and-play Neural Network Toolbox Enabling Edge Deployment [59.61554561979589]
エッジコンピューティングは、時間に敏感なシナリオでディープラーニングベースのオブジェクト検出をデプロイするための重要なパラダイムとして登場した。既存のエッジ検出手法では、軽量モデルによる検出精度のバランスの難しさ、適応性の制限、現実の検証の不十分といった課題に直面している。本稿では,汎用的なプラグイン・アンド・プレイコンポーネントを用いてエッジ環境にオブジェクト検出モデルを適用するエッジ検出ツールボックス(ED-TOOLBOX)を提案する。
論文参考訳（メタデータ） (2024-12-24T07:28:10Z)
Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文参考訳（メタデータ） (2024-10-29T19:02:54Z)
big.LITTLE Vision Transformer for Efficient Visual Recognition [34.015778625984055]
big.LITTLE Vision Transformerは、効率的な視覚認識を実現するための革新的なアーキテクチャである。システムは、大きなパフォーマンスブロックとLITTLE効率ブロックの2つの異なるブロックで構成されている。画像処理では,各トークンの重要度を判定し,それに応じて割り当てる。
論文参考訳（メタデータ） (2024-10-14T08:21:00Z)
A Closer Look at Data Augmentation Strategies for Finetuning-Based Low/Few-Shot Object Detection [5.434078645728145]
本稿では、カスタムデータ拡張のモデル性能とエネルギー効率の両立と自動データ拡張選択戦略について検討する。多くの場合、データ拡張戦略の性能向上は、そのエネルギー使用量の増加によって、過度に隠蔽されていることが示されている。
論文参考訳（メタデータ） (2024-08-20T15:29:56Z)
Optimizing Intrusion Detection System Performance Through Synergistic Hyperparameter Tuning and Advanced Data Processing [3.3148772440755527]
侵入検知は、悪意のある活動に対するコンピュータネットワークの確保に不可欠である。そこで本研究では,ディープラーニングとデータバランシング,高次元化を組み合わせたシステムを提案する。 CIC IDS 2018やCIC IDS 2017のような広範なデータセットをトレーニングすることで、当社のモデルは堅牢なパフォーマンスと一般化を示している。
論文参考訳（メタデータ） (2024-08-03T14:09:28Z)
Towards Robust Federated Learning via Logits Calibration on Non-IID Data [49.286558007937856]
Federated Learning(FL)は、エッジネットワークにおける分散デバイスの共同モデルトレーニングに基づく、プライバシ保護のための分散管理フレームワークである。近年の研究では、FLは敵の例に弱いことが示されており、その性能は著しく低下している。本研究では,対戦型訓練(AT)フレームワークを用いて,対戦型実例(AE)攻撃に対するFLモデルの堅牢性を向上させる。
論文参考訳（メタデータ） (2024-03-05T09:18:29Z)
Interpreting and Improving Attention From the Perspective of Large Kernel Convolution [51.06461246235176]
本稿では,LKCA(Large Kernel Convolutional Attention)について紹介する。 LKCAは、特にデータ制約のある設定において、様々な視覚的タスク間での競合性能を達成する。
論文参考訳（メタデータ） (2024-01-11T08:40:35Z)
Filling the Missing: Exploring Generative AI for Enhanced Federated Learning over Heterogeneous Mobile Edge Devices [72.61177465035031]
ローカルデータのFIMI(FIlling the MIssing)部分を活用することにより,これらの課題に対処する,AIを活用した創発的なフェデレーション学習を提案する。実験の結果,FIMIはデバイス側エネルギーの最大50%を節約し,目標とするグローバルテスト精度を達成できることがわかった。
論文参考訳（メタデータ） (2023-10-21T12:07:04Z)
Efficiency Pentathlon: A Standardized Arena for Efficiency Evaluation [82.85015548989223]
Pentathlonは、モデル効率の総合的で現実的な評価のためのベンチマークである。 Pentathlonは、モデルライフサイクルにおける計算の大部分を占める推論に焦点を当てている。レイテンシ、スループット、メモリオーバーヘッド、エネルギー消費など、さまざまな効率面をターゲットにしたメトリクスが組み込まれている。
論文参考訳（メタデータ） (2023-07-19T01:05:33Z)
AnycostFL: Efficient On-Demand Federated Learning over Heterogeneous Edge Devices [20.52519915112099]
我々はAny CostFLというコスト調整可能なFLフレームワークを提案し、多様なエッジデバイスがローカル更新を効率的に実行できるようにする。実験結果から,我々の学習フレームワークは,適切なグローバルテスト精度を実現するために,トレーニング遅延とエネルギー消費の最大1.9倍の削減が可能であることが示唆された。
論文参考訳（メタデータ） (2023-01-08T15:25:55Z)
Improved Speech Emotion Recognition using Transfer Learning and Spectrogram Augmentation [56.264157127549446]
音声感情認識(SER)は、人間とコンピュータの相互作用において重要な役割を果たす課題である。 SERの主な課題の1つは、データの不足である。本稿では,スペクトログラム拡張と併用した移動学習戦略を提案する。
論文参考訳（メタデータ） (2021-08-05T10:39:39Z)
Optimization-driven Machine Learning for Intelligent Reflecting Surfaces Assisted Wireless Networks [82.33619654835348]
インテリジェントサーフェス(IRS)は、個々の散乱素子の位相シフトを制御して無線チャネルを再形成するために用いられる。散乱素子の規模が大きいため、受動ビームフォーミングは一般に高い計算複雑性によって挑戦される。本稿では、IRS支援無線ネットワークの性能向上のための機械学習(ML)アプローチに焦点を当てる。
論文参考訳（メタデータ） (2020-08-29T08:39:43Z)
Hierarchical and Efficient Learning for Person Re-Identification [19.172946887940874]
階層的大域的, 部分的, 回復的特徴を複数の損失結合の監督の下で学習する, 階層的, 効率的なネットワーク(HENet)を提案する。また,RPE (Random Polygon Erasing) と呼ばれる新しいデータセット拡張手法を提案する。
論文参考訳（メタデータ） (2020-05-18T15:45:25Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。