論文の概要: AIPC: Agent-Based Automation for AI Model Deployment with Qualcomm AI Runtime
- arxiv url: http://arxiv.org/abs/2604.14661v1
- Date: Thu, 16 Apr 2026 06:15:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-17 21:29:31.753532
- Title: AIPC: Agent-Based Automation for AI Model Deployment with Qualcomm AI Runtime
- Title(参考訳): AIPC: Qualcomm AIランタイムによるAIモデルデプロイのためのエージェントベースの自動化
- Authors: Jianhao Su, Zhanwei Wu, ShengTing Huang, Weidong Feng,
- Abstract要約: 本稿では,AIモデル展開の制約付き自動化のためのAIエージェント駆動型アプローチであるAIPCを紹介する。
標準化された検証可能なステージへのデプロイを分解し、デプロイドメインの知識をエージェントの実行に注入する。
PyTorchから実行可能なQNN/SNPE推論へのデプロイを7~20分以内に完了し、構造的に定期的な視覚モデルを実現する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Edge AI model deployment is a multi-stage engineering process involving model conversion, operator compatibility handling, quantization calibration, runtime integration, and accuracy validation. In practice, this workflow is long, failure-prone, and heavily dependent on deployment expertise, particularly when targeting hardware-specific inference runtimes. This technical report presents AIPC (AI Porting Conversion), an AI agent-driven approach for constrained automation of AI model deployment. AIPC decomposes deployment into standardized, verifiable stages and injects deployment-domain knowledge into agent execution through Agent Skills, helper scripts, and a stage-wise validation loop. This design reduces both the expertise barrier and the engineering time required for hardware deployment. Using Qualcomm AI Runtime (QAIRT) as the primary scenario, this report examines automated deployment across representative vision, multimodal, and speech models. In the cases covered here, AIPC can complete deployment from PyTorch to runnable QNN/SNPE inference within 7-20 minutes for structurally regular vision models, with indicative API costs roughly in the range of USD 0.7-10. For more complex models involving less-supported operators, dynamic shapes, or autoregressive decoding structures, fully automated deployment may still require further advances, but AIPC already provides practical support for execution, failure localization, and bounded repair.
- Abstract(参考訳): Edge AIモデルデプロイメントは、モデル変換、オペレータ互換性処理、量子化キャリブレーション、ランタイム統合、精度検証を含む、多段階のエンジニアリングプロセスである。
実際には、このワークフローは長く、障害が発生し、特にハードウェア固有の推論ランタイムをターゲットにする場合に、デプロイメントの専門知識に大きく依存する。
この技術レポートは、AIモデルデプロイメントの制約付き自動化のためのAIエージェント駆動のアプローチであるAIPC(AI Porting Conversion)を提示する。
AIPCは標準化された検証可能なステージへのデプロイメントを分解し、エージェントスキル、ヘルパースクリプト、ステージワイド検証ループを通じて、デプロイドメインの知識をエージェント実行に注入する。
この設計により、ハードウェアデプロイメントに必要な専門的障壁とエンジニアリング時間の両方が削減される。
Qualcomm AI Runtime(QAIRT)を主要なシナリオとして、代表的ビジョン、マルチモーダル、音声モデルにまたがる自動デプロイメントを検討する。
ここでは、AIPCがPyTorchから実行可能なQNN/SNPE推論へのデプロイを7~20分以内に完了し、構造的に規則的な視覚モデルが可能である。
サポートの少ない演算子、動的形状、自動回帰デコード構造を含むより複雑なモデルでは、完全に自動化されたデプロイメントは依然としてさらなる進歩を必要とするかもしれないが、AIPCはすでに実行、障害ローカライゼーション、バウンド修理の実用的なサポートを提供している。
関連論文リスト
- AIBuildAI: An AI Agent for Automatically Building AI Models [31.05147308924019]
タスク記述とトレーニングデータからAIモデルを自動的に構築するAIエージェントであるAIBuildAIを紹介する。
我々は、リアルなKaggleスタイルのAI開発タスクのベンチマークであるMLE-Bench上でAIBuildAIを評価する。
論文 参考訳(メタデータ) (2026-04-15T22:17:05Z) - Human-AI Collaboration for Scaling Agile Regression Testing: An Agentic-AI Teammate from Manual to Automated Testing [1.4902707653987912]
本稿では,検証済み仕様から直接システムレベルのテストスクリプトを生成するエージェントAIアプローチを提案する。
私たちのソリューションは,Haconのアジャイルアーキテクチャに統合された,検索可能なマルチエージェントアーキテクチャを備えています。
結果は、AIチームメイトがテストスクリプトのスループットを大幅に向上し、手作業によるオーサリングの労力を削減していることを示している。
論文 参考訳(メタデータ) (2026-03-09T10:19:13Z) - EmboCoach-Bench: Benchmarking AI Agents on Developing Embodied Robots [68.29056647487519]
Embodied AIは、高忠実度シミュレーションと大規模データ収集によって実現されている。
しかし、このスケーリング能力は、労働集約的な手作業の監視に依存しているため、いまだにボトルネックになっている。
実装ポリシーを自律的に構築するための LLM エージェントの能力を評価するベンチマークである textscEmboCoach-Bench を紹介する。
論文 参考訳(メタデータ) (2026-01-29T11:33:49Z) - ComAgent: Multi-LLM based Agentic AI Empowered Intelligent Wireless Networks [62.031889234230725]
6Gネットワークは複雑な層間最適化に依存している。
数学の定式化に高レベルの意図を手動で翻訳することは、まだボトルネックである。
我々はマルチLLMエージェントAIフレームワークであるComAgentを紹介する。
論文 参考訳(メタデータ) (2026-01-27T13:43:59Z) - AI-NativeBench: An Open-Source White-Box Agentic Benchmark Suite for AI-Native Systems [52.65695508605237]
我々は、Model Context Protocol(MCP)とAgent-to-Agent(A2A)標準に基づいて、アプリケーション中心でホワイトボックスのAI-NativeベンチマークスイートであるAI-NativeBenchを紹介する。
エージェントスパンを分散トレース内の第一級市民として扱うことにより,本手法は,単純な機能以上の工学的特性の粒度解析を可能にする。
この研究は、モデル能力の測定から信頼性の高いAI-Nativeシステムへの移行を導く最初の体系的な証拠を提供する。
論文 参考訳(メタデータ) (2026-01-14T11:32:07Z) - Agent0: Unleashing Self-Evolving Agents from Zero Data via Tool-Integrated Reasoning [84.70211451226835]
大規模言語モデル(LLM)エージェントは、人間の計算データへの依存によって制約される。
我々は,外部データを持たない高性能エージェントを進化させる完全自律型フレームワークであるAgent0を紹介する。
Agent0は推論能力を大幅に向上させ、Qwen3-8B-Baseモデルを数学的推論で18%改善し、一般的な推論ベンチマークで24%改善した。
論文 参考訳(メタデータ) (2025-11-20T05:01:57Z) - Engineering.ai: A Platform for Teams of AI Engineers in Computational Design [8.217119500224284]
計算設計におけるAIエンジニアのチームのためのプラットフォームであるEngineering.aiを紹介します。
このフレームワークは階層的なマルチエージェントアーキテクチャを採用しており、チーフエンジニアが特殊エージェントをコーディネートする。
このシステムはFreeCAD、Gmsh、OpenFOAM、CalculiX、BPM音響解析を統合し、並列多分野シミュレーションを可能にする。
論文 参考訳(メタデータ) (2025-10-31T08:00:48Z) - Scalable, Symbiotic, AI and Non-AI Agent Based Parallel Discrete Event Simulations [0.0]
本稿では,複数のAIエージェントと非AIエージェントを組み合わせた並列離散イベントシミュレーション(PDES)手法を提案する。
我々は、4つの異なるドメインから4つの問題を解き、その結果をAIモデルだけで比較することで、我々のアプローチを評価する。
その結果,バニラモデルの精度が23%未満であるため,アプローチ全体の精度は68%であった。
論文 参考訳(メタデータ) (2025-05-28T17:50:01Z) - AI2Agent: An End-to-End Framework for Deploying AI Projects as Autonomous Agents [15.802600809497097]
本稿では、ガイドライン駆動実行を通じてAIプロジェクトのデプロイメントを自動化するエンドツーエンドフレームワークであるAI2Agentを紹介する。
我々は、TTS、テキスト・ツー・イメージ生成、画像編集、その他のAIアプリケーションをカバーする、30のAIデプロイメントケースの実験を行った。
その結果、AI2Agentはデプロイメント時間を大幅に短縮し、成功率を向上させることがわかった。
論文 参考訳(メタデータ) (2025-03-31T10:58:34Z) - Intelligent Mobile AI-Generated Content Services via Interactive Prompt Engineering and Dynamic Service Provisioning [55.641299901038316]
AI生成コンテンツは、ネットワークエッジで協調的なMobile AIGC Service Providers(MASP)を編成して、リソース制約のあるユーザにユビキタスでカスタマイズされたコンテンツを提供することができる。
このようなパラダイムは2つの大きな課題に直面している: 1) 生のプロンプトは、ユーザーが特定のAIGCモデルで経験していないために、しばしば生成品質が低下する。
本研究では,Large Language Model (LLM) を利用してカスタマイズしたプロンプトコーパスを生成する対話型プロンプトエンジニアリング機構を開発し,政策模倣に逆強化学習(IRL)を用いる。
論文 参考訳(メタデータ) (2025-02-17T03:05:20Z) - Automated Machine Learning: A Case Study on Non-Intrusive Appliance Load Monitoring [81.06807079998117]
非侵入的機器負荷モニタリング(NIALM)のための自動機械学習(AutoML)を実現する新しい手法を提案する。
NIALMは、電子機器や家電のエネルギー消費を測定するためのスマートメーターに代わる費用対効果を提供する。
論文 参考訳(メタデータ) (2022-03-06T10:12:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。