論文の概要: Quantization Impact on the Accuracy and Communication Efficiency Trade-off in Federated Learning for Aerospace Predictive Maintenance
- arxiv url: http://arxiv.org/abs/2604.08474v1
- Date: Thu, 09 Apr 2026 17:13:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-10 18:34:06.040822
- Title: Quantization Impact on the Accuracy and Communication Efficiency Trade-off in Federated Learning for Aerospace Predictive Maintenance
- Title(参考訳): 空域予測維持のためのフェデレーション学習における精度とコミュニケーション効率のトレードオフに及ぼす量子化の影響
- Authors: Abdelkarim Loukili,
- Abstract要約: フェデレートラーニング(FL)は、分散航空宇宙艦隊間のプライバシ保護による予測メンテナンスを可能にする。
本稿では,対称均一量子化がカスタム設計軽量畳み込みモデルの精度-効率トレードオフに与える影響について検討する。
Int4はFD001とFD002でFP32と区別できない精度を実現する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Federated learning (FL) enables privacy-preserving predictive maintenance across distributed aerospace fleets, but gradient communication overhead constrains deployment on bandwidth-limited IoT nodes. This paper investigates the impact of symmetric uniform quantization ($b \in \{32,8,4,2\}$ bits) on the accuracy--efficiency trade-off of a custom-designed lightweight 1-D convolutional model (AeroConv1D, 9\,697 parameters) trained via FL on the NASA C-MAPSS benchmark under a realistic Non-IID client partition. Using a rigorous multi-seed evaluation ($N=10$ seeds), we show that INT4 achieves accuracy \emph{statistically indistinguishable} from FP32 on both FD001 ($p=0.341$) and FD002 ($p=0.264$ MAE, $p=0.534$ NASA score) while delivering an $8\times$ reduction in gradient communication cost (37.88~KiB $\to$ 4.73~KiB per round). A key methodological finding is that naïve IID client partitioning artificially suppresses variance; correct Non-IID evaluation reveals the true operational instability of extreme quantization, demonstrated via a direct empirical IID vs.\ Non-IID comparison. INT2 is empirically characterized as unsuitable: while it achieves lower MAE on FD002 through extreme quantization-induced over-regularization, this apparent gain is accompanied by catastrophic NASA score instability (CV\,=\,45.8\% vs.\ 22.3\% for FP32), confirming non-reproducibility under heterogeneous operating conditions. Analytical FPGA resource projections on the Xilinx ZCU102 confirm that INT4 fits within hardware constraints (85.5\% DSP utilization), potentially enabling a complete FL pipeline on a single SoC. The full simulation codebase and FPGA estimation scripts are publicly available at https://github.com/therealdeadbeef/aerospace-fl-quantization.
- Abstract(参考訳): フェデレートドラーニング(FL)は、分散航空宇宙艦隊間のプライバシ保護による予測メンテナンスを可能にするが、グラデーション通信のオーバーヘッドは、帯域幅に制限のあるIoTノードへのデプロイメントを制限している。
本稿では,NASA C-MAPSSベンチマーク上でFLを用いて学習したカスタム設計軽量1-D畳み込みモデル(AeroConv1D, 9\,697パラメータ)の精度-効率トレードオフに対する対称均一量子化(b \in \{32,8,4,2\}$ bits)の影響について検討する。
FD001(p=0.341$)とFD002(p=0.264$ MAE, $p=0.534$ NASA score)の両方で、INT4がFP32から精度を達成し、勾配通信コスト(37.88~KiB $\to$4.73~KiB)を8ドル(約8,800円)削減したことを示す。
重要な方法として, ナイーブIIDクライアント分割が分散を人工的に抑制すること, 非IID評価の正しさは, 直接的経験的IID vs. により実証された極端量子化の真の運用不安定性を明らかにすることが挙げられる。
非IID比較。
INT2は、極度の量子化による過剰規則化によってFD002上の低いMAEを達成するが、この明らかな上昇は、NASAの破滅的なスコア不安定(CV\,=\,45.8\%)と伴う。
22.3\%(FP32)は不均一な操作条件下での再現性を確認する。
Xilinx ZCU102の解析的FPGAリソースプロジェクションは、INT4がハードウェア制約(85.5\% DSP)に適合していることを確認し、単一のSoC上で完全なFLパイプラインを可能にする可能性がある。
完全なシミュレーションコードベースとFPGA推定スクリプトはhttps://github.com/therealdeadbeef/aerospace-fl-quantizationで公開されている。
関連論文リスト
- GPU-Accelerated Optimization of Transformer-Based Neural Networks for Real-Time Inference [0.0]
本稿では,混合精度最適化を用いたNVIDIARTを用いた変圧器モデルのためのGPU加速型推論パイプラインの設計と評価を行う。
このシステムはCPUベースラインの64.4倍のスピードアップ、シングルサンプル推論の10ms以下のレイテンシ、メモリ使用量の63%削減を実現している。
論文 参考訳(メタデータ) (2026-03-30T17:27:33Z) - V-ABFT: Variance-Based Adaptive Threshold for Fault-Tolerant Matrix Multiplication in Mixed-Precision Deep Learning [2.1424453911169596]
V-ABFTは、検証差を直接モデル化することで、より厳密なエラー境界を達成する分散ベースの適応しきい値アルゴリズムである。
V-ABFTは、しきい値と実際のエラーの比率を、FP32/FP64で約7-20times$、BF16で48-158times$に下げる。
論文 参考訳(メタデータ) (2026-02-08T16:21:02Z) - Speeding Up MACE: Low-Precision Tricks for Equivarient Force Fields [51.95157731126864]
機械学習力場は高い計算コストで正確な分子動力学(MD)を提供することができる。
この論文は、計算ボトルネックを特定し、低精度の実行ポリシーを評価することで、MACEを安価かつ高速にすることを目的としている。
論文 参考訳(メタデータ) (2025-10-23T14:02:34Z) - Winning the Pruning Gamble: A Unified Approach to Joint Sample and Token Pruning for Efficient Supervised Fine-Tuning [71.30276778807068]
サンプルプルーニングとトークンプルーニングを戦略的に協調する統合フレームワークを提案する。
Q-Tuningは、トレーニングデータの12.5%しか使用せず、全データSFTベースラインに対する平均38%の改善を実現している。
論文 参考訳(メタデータ) (2025-09-28T13:27:38Z) - Quaff: Quantized Parameter-Efficient Fine-Tuning under Outlier Spatial Stability Hypothesis [9.884521812433661]
Quaffは、大規模言語モデルのための量子化されたパラメータ効率の微調整フレームワークである。
軽量な操作を使用して、排他的な不変チャネルを抑える。
1.73倍のレイテンシ削減を実現し、30パーセントのメモリ節約を実現している。
論文 参考訳(メタデータ) (2025-05-20T07:19:36Z) - Decentralized Nonconvex Composite Federated Learning with Gradient Tracking and Momentum [78.27945336558987]
分散サーバ(DFL)はクライアント・クライアント・アーキテクチャへの依存をなくす。
非滑らかな正規化はしばしば機械学習タスクに組み込まれる。
本稿では,これらの問題を解決する新しいDNCFLアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-04-17T08:32:25Z) - A Specialized Semismooth Newton Method for Kernel-Based Optimal
Transport [92.96250725599958]
カーネルベース最適輸送(OT)推定器は、サンプルからOT問題に対処するための代替的機能的推定手順を提供する。
SSN法は, 標準正規性条件下でのグローバル収束率$O (1/sqrtk)$, 局所二次収束率を達成できることを示す。
論文 参考訳(メタデータ) (2023-10-21T18:48:45Z) - Data-Free Dynamic Compression of CNNs for Tractable Efficiency [46.498278084317704]
構造化プルーニング手法は, 精度が大幅に低下することなく浮動小数点演算を低下させる可能性を示唆している。
HASTE(Hashing for Tractable Efficiency)は,データフリーでプラグイン・アンド・プレイのコンボリューションモジュールで,トレーニングや微調整なしにネットワークのテスト時間推論コストを瞬時に低減する。
CIFAR-10とImageNetでは46.72%のFLOPを1.25%の精度で削減した。
論文 参考訳(メタデータ) (2023-09-29T13:09:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。