論文の概要: ExecuTorch -- A Unified PyTorch Solution to Run AI Models On-Device
- arxiv url: http://arxiv.org/abs/2605.08195v1
- Date: Tue, 05 May 2026 18:59:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:49.450177
- Title: ExecuTorch -- A Unified PyTorch Solution to Run AI Models On-Device
- Title(参考訳): ExecuTorch - デバイス上でAIモデルを実行するための統一PyTorchソリューション
- Authors: Mergen Nachin, Digant Desai, Sicheng Stephen Jia, Chen Lai, Mengwei Liu, Jacob Szwejbka, Raziel Alvarez, RJ Ascani, Dave Bort, Manuel Candales, Andrew Caples, Yanan Cao, Zhengxu Chen, Soumith Chintala, Gregory Comer, Tanvir Islam, Songhao Jia, Tarun Karuturi, Jack Khuu, Abhinay Kukkadapu, Tugsbayasgalan Manlaibaatar, Andrew Or, Kimish Patel, Siddartha Pothapragada, Lucy Qiu, Supriya Rao, Orion Reblitz-Richardson, Max Ren, Scott Roy, Anthony Shoumikhin, Scott Wolchok, Guang Yang, Angela Yi, Martin Yuan, Hansong Zhang, Jack Zhang, Jerry Zhang, Shunting Zhang, C. Cagatay Bilgin,
- Abstract要約: ExecuTorchはエッジAIのための統合PyTorchネイティブデプロイメントフレームワークである。
これは、異質な計算環境にまたがる機械学習モデルのシームレスなデプロイを可能にする。
- 参考スコア(独自算出の注目度): 9.328077533565924
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Local execution of AI on edge devices is important for low latency and offline operation. However, deploying models on diverse hardware remains fragmented, often requiring model conversion or complete reimplementation outside the PyTorch ecosystem where the model was originally authored. We introduce ExecuTorch, a unified PyTorch-native deployment framework for edge AI. ExecuTorch enables seamless deployment of machine learning models across heterogeneous compute environments. It scales from embedded microcontrollers to complex system-on-chips (SoCs) with dedicated accelerators, powering devices ranging from wearables and smartphones to large compute clusters. ExecuTorch preserves PyTorch semantics while allowing customization, support for optimizations like quantization, and pluggable execution "backends". These features together enable fast experimentation, allowing researchers to validate deployment behavior entirely within PyTorch, bridging the gap between research and production.
- Abstract(参考訳): エッジデバイス上でのAIのローカル実行は、低レイテンシとオフライン操作において重要である。
しかし、様々なハードウェアにモデルをデプロイするには断片的であり、モデル変換やPyTorchエコシステムの外での完全な再実装がしばしば必要である。
エッジAIのための統合PyTorchネイティブデプロイメントフレームワークであるExecuTorchを紹介します。
ExecuTorchは、異種コンピューティング環境にまたがる機械学習モデルのシームレスなデプロイを可能にする。
組み込みマイクロコントローラから、専用のアクセラレーターを備えた複雑なシステムオンチップ(SoC)まで、ウェアラブルやスマートフォンから大規模計算クラスタまで、さまざまなデバイスを駆動する。
ExecuTorchは、カスタマイズを可能にしながらPyTorchセマンティクスを保存し、量子化のような最適化をサポートし、プラグイン可能な実行"バックエンド"をサポートする。
これらの機能は共同で高速な実験を可能にするため、研究者はPyTorch内でのデプロイメントの挙動を検証でき、研究と生産のギャップを埋めることができる。
関連論文リスト
- Device-Conditioned Neural Architecture Search for Efficient Robotic Manipulation [16.017058636822025]
我々はtextbfDevice-textbfConditioned textbfQuantization-textbfFor-textbfAll (DC-QFA) という統合フレームワークを提案する。
DC-QFAは、デバイス条件の量子化対応トレーニングとハードウェア制約のあるアーキテクチャサーチによるデプロイメントの取り組みを改善している。
論文 参考訳(メタデータ) (2026-04-11T11:36:16Z) - UNIFERENCE: A Discrete Event Simulation Framework for Developing Distributed AI Models [0.42015796373418257]
UNIは、分散AIモデルの開発とベンチマーク、デプロイのための離散イベントシミュレーションフレームワークである。
PyTorch Distributedとシームレスに統合され、シミュレーションから実際のデプロイメントへの移行を可能にする。
論文 参考訳(メタデータ) (2026-03-27T14:35:02Z) - RAGdb: A Zero-Dependency, Embeddable Architecture for Multimodal Retrieval-Augmented Generation on the Edge [0.0]
Retrieval-Augmented Generation (RAG) は、ドメイン固有の最新のデータにおいて、LLM(Large Language Models)を基盤とする標準パラダイムとして確立されている。
RAGdbは、自動マルチモーダル取り込み、ONNXベースの抽出、ハイブリッドベクトル検索を単一のポータブルコンテナに統合する。
システムは標準的なDockerベースのRAGスタックと比較してディスクフットプリントを約99.5%削減する。
論文 参考訳(メタデータ) (2025-12-09T15:12:13Z) - Elastic ViTs from Pretrained Models without Retraining [74.5386166956142]
ビジョンファウンデーションモデルは優れたパフォーマンスを達成するが、事前決定されたサイズの限られたセットでしか利用できない。
本稿では, プルーニングされた視覚変換器のためのシングルショットネットワーク近似であるSnapViTを紹介する。
提案手法は,進化的アルゴリズムを用いて近似した勾配情報とクロスネットワーク構造相関を効率的に結合する。
論文 参考訳(メタデータ) (2025-10-20T16:15:03Z) - PIPer: On-Device Environment Setup via Online Reinforcement Learning [74.52354321028493]
自動化された環境設定メソッドは、任意のリポジトリに対して、手作業なしで完全に構成された環境を提供することで、開発者を支援することができる。
近年の研究では、最先端のLarge Language Models (LLMs) でさえ、このタスクの自動化に限られた成功をおさめていることが明らかになっている。
我々は、正しいスクリプトを生成するための教師付き微調整と、環境設定のタスクに適応するために、Reinforcement Learning with Verifiable Rewards(RLVR)を組み合わせる。
EnvBench-Python では,より大型の Qwen3-32B や GPT-4 と同等に動作可能な Qwen3-8B (コンシューマハードウェア上で動作可能なモデル) を実現する。
論文 参考訳(メタデータ) (2025-09-29T20:03:05Z) - PyLate: Flexible Training and Retrieval for Late Interaction Models [3.737581531719168]
マルチベクタアーキテクチャをサポートするために,Sentence Transformer上に構築されたライブラリであるPyLateを紹介した。
PyLateは、効率的なインデックスのようなマルチベクタ固有の機能を提供することで、遅延相互作用モデルの研究開発と実世界の応用を加速することを目指している。
PyLateはすでに、GTE-ModernColBERTやReason-ModernColBERTなど、最先端のモデルの開発を可能にしている。
論文 参考訳(メタデータ) (2025-08-05T15:23:40Z) - NNTile: a machine learning framework capable of training extremely large GPT language models on a single node [83.9328245724548]
NNTileはタスクベースの並列処理を実装したStarPUライブラリをベースとしている。
これは、大きなニューラルネットワークをトレーニングするために必要な特定の操作が、CPUコアまたはGPUデバイスのいずれかで実行されることを意味する。
論文 参考訳(メタデータ) (2025-04-17T16:22:32Z) - STAMP: Scalable Task And Model-agnostic Collaborative Perception [24.890993164334766]
STAMPは、異種エージェントのためのタスクおよびモデルに依存しない協調認識パイプラインである。
計算オーバーヘッドを最小限に抑え、スケーラビリティを高め、モデルのセキュリティを維持する。
第一種フレームワークとしてSTAMPは,スケーラブルでセキュアなモビリティシステムの研究を,レベル5の自律性に向けて進めることを目指している。
論文 参考訳(メタデータ) (2025-01-24T16:27:28Z) - An Adaptive Device-Edge Co-Inference Framework Based on Soft
Actor-Critic [72.35307086274912]
高次元パラメータモデルと大規模数学的計算は、特にIoT(Internet of Things)デバイスにおける実行効率を制限する。
本稿では,ソフトポリシーの繰り返しによるエフェキシット点,エフェキシット点,エンフェキシット点を生成する離散的(SAC-d)のための新しい深層強化学習(DRL)-ソフトアクタ批判法を提案する。
レイテンシと精度を意識した報酬設計に基づいて、そのような計算は動的無線チャンネルや任意の処理のような複雑な環境によく適応でき、5G URLをサポートすることができる。
論文 参考訳(メタデータ) (2022-01-09T09:31:50Z) - PnP-DETR: Towards Efficient Visual Analysis with Transformers [146.55679348493587]
近年、DeTRはトランスフォーマーを用いたソリューションビジョンタスクの先駆者であり、画像特徴マップを直接オブジェクト結果に変換する。
最近の変圧器を用いた画像認識モデルとTTは、一貫した効率向上を示す。
論文 参考訳(メタデータ) (2021-09-15T01:10:30Z) - PyChain: A Fully Parallelized PyTorch Implementation of LF-MMI for
End-to-End ASR [65.20342293605472]
PyChainは、カルディ自動音声認識(ASR)ツールキットにおいて、いわゆるエンフィチェーンモデルのための、エンドツーエンドの格子フリー最大相互情報(LF-MMI)トレーニングの実装である。
他のPyTorchやKaldiベースのASRツールキットとは異なり、PyChainは可能な限り柔軟で軽量に設計されている。
論文 参考訳(メタデータ) (2020-05-20T02:10:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。