論文の概要: Uncertainty-Aware End-to-End Co-Design of Neural Network Processors: From Training and Mapping to Fabrication
- arxiv url: http://arxiv.org/abs/2606.04850v1
- Date: Wed, 03 Jun 2026 13:16:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 20:44:18.777599
- Title: Uncertainty-Aware End-to-End Co-Design of Neural Network Processors: From Training and Mapping to Fabrication
- Title(参考訳): ニューラルネットワークプロセッサの不確かさを意識したエンド・ツー・エンド設計:トレーニングとマッピングから製作まで
- Authors: Yuyang Du, Yujun Huang, Gioele Zardini,
- Abstract要約: 本稿では,ニューラルネットワークプロセッサ設計のための統一的なフレームワークを提案する。
ネットワークトレーニング、チップマッピング、ウエハレベルの製造、計算リソース割り当てにまたがる4つの相互運用可能な設計ブロックで構成されている。
3つのケーススタディがこのアプローチを検証する。
- 参考スコア(独自算出の注目度): 2.800728981953443
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Designing a neural network processor is an end-to-end co-design problem: network architecture and training budget determine the inference workload; hardware mapping decisions determine chip area, latency, and energy; and these characteristics govern fabrication yield and manufacturing cost. In practice, these decisions are made in separate stages, and existing co-design methodologies are tightly coupled to specific algorithms, making it difficult to improve one component without reworking the entire pipeline. This paper presents a unified framework, grounded in monotone co-design theory, that composes four interoperable design blocks spanning network training, chip mapping, wafer-level fabrication, and compute resource allocation. Each block exposes only a functionality-resource interface to the rest of the system, so any block can be refined without structural changes elsewhere. A central contribution is the treatment of uncertainty: rather than collapsing stochastic outcomes into point estimates, the framework introduces Confidence, the inverse of success probability, as an explicit and optimizable resource alongside cost, time, and power. Three case studies validate the approach. The first recovers Pareto-optimal implementations across heterogeneous application scenarios. The second confirms that Confidence functions as a continuously tunable design knob rather than a post-hoc diagnostic. The third demonstrates that improving a single block's implementation set automatically propagates to the global Pareto front, without modifying the co-design diagram.
- Abstract(参考訳): ニューラルネットワークプロセッサの設計は、エンドツーエンドの共同設計の問題である:ネットワークアーキテクチャとトレーニング予算が推論のワークロードを決定する;ハードウェアマッピング決定がチップ面積、レイテンシ、エネルギーを決定する;これらの特性は、製造の歩留まりと製造コストを左右する。
実際には、これらの決定は別々の段階で行われ、既存の共同設計方法論は特定のアルゴリズムと密結合されているため、パイプライン全体を再構築することなく、ひとつのコンポーネントを改善するのが難しくなる。
本稿では,ネットワークトレーニング,チップマッピング,ウエハレベルの製作,計算資源割り当ての4つの相互運用可能な設計ブロックを構成する,モノトーン共設計理論に基づく統一フレームワークを提案する。
各ブロックは機能の再利用インターフェースのみをシステムの他の部分に公開するので、他の部分で構造的な変更を加えることなく、任意のブロックを洗練することができる。
確率的な結果を点推定に分解するのではなく、このフレームワークは信頼性を導入し、成功確率の逆転を、コスト、時間、パワーとともに明示的で最適化可能なリソースとして導入する。
3つのケーススタディがこのアプローチを検証する。
ひとつは、異種アプリケーションシナリオ間のPareto-Optimal実装のリカバリだ。
2つ目は、信頼性がポストホック診断ではなく、継続的に調整可能な設計ノブとして機能することを確認する。
3つ目は、単一のブロックの実装セットの改善が、共同設計図を変更することなく、自動的にグローバルなParetoフロントに伝播することを示しています。
関連論文リスト
- OneComp: One-Line Revolution for Generative AI Model Compression [5.503278667006273]
トレーニング後の圧縮は、性能を著しく低下させることなくモデルパラメータの精度を低下させる。
私たちは、このエキスパートワークフローをリソース適応パイプラインに変換するオープンソースの圧縮フレームワークOneCompを紹介します。
重要なアーキテクチャ上の選択は、最初の量子化されたチェックポイントをデプロイ可能なピボットとして扱い、各ステージが同じモデルを改善することを保証することである。
論文 参考訳(メタデータ) (2026-03-30T17:43:32Z) - Robust Optimization Approach and Learning Based Hide-and-Seek Game for Resilient Network Design [10.37026246853005]
本研究では、信号が許容しきい値以下になる前に、信号が限られた距離までしか転送できない、レジリエントで信頼性の高い通信ネットワークの設計について検討する。
過度な信号劣化が発生した場合、選択されたネットワークノードにインストールされた再生器を通して再生する必要がある。
論文 参考訳(メタデータ) (2026-02-12T11:48:24Z) - Scaling Code-Assisted Chain-of-Thoughts and Instructions for Model Reasoning [65.20602712957725]
Cacoは、高品質で検証可能な多様な命令-CoT推論データの合成を自動化する新しいフレームワークである。
我々の研究は、人間の介入なしに自己持続的で信頼できる推論システムを構築するためのパラダイムを確立します。
論文 参考訳(メタデータ) (2025-10-05T07:59:24Z) - Unlocking Symbol-Level Precoding Efficiency Through Tensor Equivariant Neural Network [84.22115118596741]
シンボルレベルのプリコーディングにおいて,推論の複雑さの低いエンドツーエンドディープラーニング(DL)フレームワークを提案する。
提案手法は,従来の手法よりも約80倍の高速化を実現しつつ,SLPの大幅な性能向上を達成できることを示す。
論文 参考訳(メタデータ) (2025-10-02T15:15:50Z) - Localized Physics-informed Gaussian Processes with Curriculum Training for Topology Optimization [3.6352820455705372]
物理インフォームドガウス過程(GP)に基づく同時かつメッシュフリーなトポロジー最適化(TO)フレームワークを提案する。
我々のフレームワークは、カスタマイズされたディープニューラルネットワーク(DNN)を介してパラメータ化される共有のマルチアウトプット平均関数を持つGPプリエントを介して、すべての設計と状態変数を提供する。
我々のTOアプローチは、適切に定義された材料インターフェースを生成し、グローバルな最適性を促進するための継続特性を内蔵している。
論文 参考訳(メタデータ) (2025-03-18T22:59:16Z) - Automated and Holistic Co-design of Neural Networks and ASICs for Enabling In-Pixel Intelligence [4.063480188363124]
放射能検出のための可読ASICなどの極端エッジAIシステムは、厳密なハードウェア制約の下で動作しなければならない。
理想的なソリューションを見つけることは、爆発的に拡張されたデザイン空間から最適なAIとASIC設計の選択を特定することを意味する。
論文 参考訳(メタデータ) (2024-07-18T17:58:05Z) - SONIQ: System-Optimized Noise-Injected Ultra-Low-Precision Quantization with Full-Precision Parity [16.80594978261954]
SONIQは、推論で使用されるのと同じ規則の下でトレーニング中に、ウェイトとアクティベーションの両方のチャネル毎の混合精度を学習する。
SONIQは、デプロイ時に使われる個別の算術に対して、起動時なしでモデルを操縦する。
CNNとTransformers全体では、SONIQは最大16倍と7倍の圧縮を達成し、完全精度のマッチングや超精度の向上を実現している。
論文 参考訳(メタデータ) (2023-11-23T17:20:09Z) - End-to-End Meta-Bayesian Optimisation with Transformer Neural Processes [52.818579746354665]
本稿では,ニューラルネットワークを一般化し,トランスフォーマーアーキテクチャを用いて獲得関数を学習する,エンド・ツー・エンドの差別化可能な最初のメタBOフレームワークを提案する。
我々は、この強化学習(RL)によるエンドツーエンドのフレームワークを、ラベル付き取得データの欠如に対処できるようにします。
論文 参考訳(メタデータ) (2023-05-25T10:58:46Z) - Deep Model Reassembly [60.6531819328247]
我々はDeep Model Reassembly(DeRy)と呼ばれる新しい知識伝達タスクを探索する。
DeRyの目標は、まず各モデルを固有のビルディングブロックに分割し、それから派生したブロックを選択的に再組み立てて、カスタマイズされたネットワークを生成することである。
ImageNetでは、最高の再組み立てモデルは微調整なしで78.6%のトップ1の精度を実現している。
論文 参考訳(メタデータ) (2022-10-24T10:16:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。