論文の概要: Analyzing Transformer Models and Knowledge Distillation Approaches for Image Captioning on Edge AI
- arxiv url: http://arxiv.org/abs/2506.03607v1
- Date: Wed, 04 Jun 2025 06:37:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-05 21:20:14.181462
- Title: Analyzing Transformer Models and Knowledge Distillation Approaches for Image Captioning on Edge AI
- Title(参考訳): エッジAIを用いた画像キャプションのためのトランスフォーマーモデルと知識蒸留手法の解析
- Authors: Wing Man Casca Kwok, Yip Chiu Tung, Kunal Bhagchandani,
- Abstract要約: 本稿では,エッジデバイス上で効果的に動作する画像キャプション用トランスフォーマーモデルについて述べる。
モデル性能を維持しながら、リソース制約のあるデバイス上で推論を高速化できることを実証する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Edge computing decentralizes processing power to network edge, enabling real-time AI-driven decision-making in IoT applications. In industrial automation such as robotics and rugged edge AI, real-time perception and intelligence are critical for autonomous operations. Deploying transformer-based image captioning models at the edge can enhance machine perception, improve scene understanding for autonomous robots, and aid in industrial inspection. However, these edge or IoT devices are often constrained in computational resources for physical agility, yet they have strict response time requirements. Traditional deep learning models can be too large and computationally demanding for these devices. In this research, we present findings of transformer-based models for image captioning that operate effectively on edge devices. By evaluating resource-effective transformer models and applying knowledge distillation techniques, we demonstrate inference can be accelerated on resource-constrained devices while maintaining model performance using these techniques.
- Abstract(参考訳): エッジコンピューティングは、処理能力をネットワークエッジに分散化し、IoTアプリケーションでリアルタイムAI駆動による意思決定を可能にする。
ロボット工学や頑丈なエッジAIといった産業自動化において、リアルタイムの知覚と知性は自律的な操作に不可欠である。
トランスフォーマーベースのイメージキャプションモデルをエッジに配置することで、マシンの認識を高め、自律ロボットのシーン理解を改善し、産業検査を支援することができる。
しかしながら、これらのエッジまたはIoTデバイスは、物理的アジリティのために計算リソースに制約されることが多いが、厳しい応答時間要件がある。
従来のディープラーニングモデルは、これらのデバイスには大きすぎるし、計算的に要求されることもある。
本研究では,エッジデバイス上で効果的に動作する画像キャプションのためのトランスフォーマーモデルについて述べる。
資源効率の良い変圧器モデルの評価と知識蒸留技術の適用により,これらの手法を用いてモデル性能を維持しつつ,資源制約されたデバイス上で推論を高速化できることを実証する。
関連論文リスト
- Explainable Artificial Intelligence Techniques for Accurate Fault Detection and Diagnosis: A Review [0.0]
この文脈でeXplainable AI(XAI)ツールとテクニックをレビューする。
私たちは、AI決定を透明にする彼らの役割、特に人間が関与する重要なシナリオに重点を置いています。
モデル性能と説明可能性のバランスをとることを目的とした,現在の限界と今後の研究について論じる。
論文 参考訳(メタデータ) (2024-04-17T17:49:38Z) - Using the Abstract Computer Architecture Description Language to Model
AI Hardware Accelerators [77.89070422157178]
AI統合製品の製造者は、製品のパフォーマンス要件に適合するアクセラレータを選択するという、重大な課題に直面します。
抽象コンピュータアーキテクチャ記述言語(ACADL)は、コンピュータアーキテクチャブロック図の簡潔な形式化である。
本稿では,AIハードウェアアクセラレーションのモデル化にACADLを用いること,DNNのマッピングにACADL記述を使用し,タイミングシミュレーションのセマンティクスを解説し,性能評価結果の収集を行う。
論文 参考訳(メタデータ) (2024-01-30T19:27:16Z) - Random resistive memory-based deep extreme point learning machine for
unified visual processing [67.51600474104171]
ハードウェア・ソフトウェア共同設計型, ランダム抵抗型メモリベース深部極点学習マシン(DEPLM)を提案する。
我々の共同設計システムは,従来のシステムと比較して,エネルギー効率の大幅な向上とトレーニングコストの削減を実現している。
論文 参考訳(メタデータ) (2023-12-14T09:46:16Z) - Green Edge AI: A Contemporary Survey [46.11332733210337]
AIの変換力は、ディープニューラルネットワーク(DNN)の利用から導かれる。
ディープラーニング(DL)は、エンドユーザーデバイス(EUD)に近い無線エッジネットワークに移行しつつある。
その可能性にもかかわらず、エッジAIは大きな課題に直面している。主な原因は、無線エッジネットワークのリソース制限と、DLのリソース集約的な性質の分離である。
論文 参考訳(メタデータ) (2023-12-01T04:04:37Z) - AI-Generated Images as Data Source: The Dawn of Synthetic Era [61.879821573066216]
生成AIは、現実世界の写真によく似た合成画像を作成する可能性を解き放った。
本稿では、これらのAI生成画像を新しいデータソースとして活用するという革新的な概念を探求する。
実際のデータとは対照的に、AI生成データには、未整合のアブリダンスやスケーラビリティなど、大きなメリットがある。
論文 参考訳(メタデータ) (2023-10-03T06:55:19Z) - Energy-frugal and Interpretable AI Hardware Design using Learning
Automata [5.514795777097036]
Tsetlin Machineと呼ばれる新しい機械学習アルゴリズムが提案されている。
本稿では,エネルギーフルーガルな人工知能ハードウェア設計手法について検討する。
本研究は, 資源配分が, 頑健かつ解釈可能な学習を達成しつつ, 決定的なエネルギー削減をもたらすことを示す。
論文 参考訳(メタデータ) (2023-05-19T15:11:18Z) - Reliable Fleet Analytics for Edge IoT Solutions [0.0]
AIoTアプリケーションのエッジで機械学習を容易にするためのフレームワークを提案する。
コントリビューションは、大規模にフリート分析を提供するためのサービス、ツール、メソッドを含むアーキテクチャである。
本稿では,大学キャンパスの部屋でiotデバイスを用いた実験を行うことで,フレームワークの予備検証を行う。
論文 参考訳(メタデータ) (2021-01-12T11:28:43Z) - AI Online Filters to Real World Image Recognition [4.874719076317905]
本研究では,画像認識反射モデルに強化制御を加え,全体的な性能を向上させるための新しい手法について検討する。
環境検知とAIに基づく自己適応エージェントのモデリングを併用した共通インフラストラクチャに従って、我々は複数のタイプのAI制御エージェントを実装している。
論文 参考訳(メタデータ) (2020-02-11T08:23:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。