論文の概要: Distributed Transfer Learning with 4th Gen Intel Xeon Processors
- arxiv url: http://arxiv.org/abs/2310.06916v1
- Date: Tue, 10 Oct 2023 18:12:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-13 01:37:48.732723
- Title: Distributed Transfer Learning with 4th Gen Intel Xeon Processors
- Title(参考訳): 第4世代intel xeonプロセッサによる分散転送学習
- Authors: Lakshmi Arunachalam, Fahim Mohammad, Vrushabh H. Sanghavi
- Abstract要約: 我々は、転送学習とIntel Xeonを組み合わせることで、トレーニングが主にGPUに依存しているという従来の信念に反する方法について検討する。
本稿では,公開データセット上の画像分類における最先端画像の精度に近いケーススタディを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we explore how transfer learning, coupled with Intel Xeon,
specifically 4th Gen Intel Xeon scalable processor, defies the conventional
belief that training is primarily GPU-dependent. We present a case study where
we achieved near state-of-the-art accuracy for image classification on a
publicly available Image Classification TensorFlow dataset using Intel Advanced
Matrix Extensions(AMX) and distributed training with Horovod.
- Abstract(参考訳): 本稿では,intel xeon,特に第4世代intel xeonスケーラブルプロセッサと組み合わされたトランスファー・ラーニングが,トレーニングが主にgpuに依存したものだという従来の考え方とどのように矛盾するかを考察する。
本稿では,Intel Advanced Matrix Extensions(AMX)を用いたTensorFlowデータセットとHorovodを用いた分散トレーニングを用いて,画像分類の最先端の精度向上を実現したケーススタディを提案する。
関連論文リスト
- Offline Adaptation of Quadruped Locomotion using Diffusion Models [59.882275766745295]
本稿では,複数のスキル間の相互補間と学習の限界に同時に対処する,四足歩行への拡散に基づくアプローチを提案する。
これらの機能は、マルチスキルポリシーと互換性があり、ほとんど変更することなく、最小限の計算オーバーヘッドで適用可能であることを示す。
ANYmal四重奏プラットフォーム上でのハードウェア実験によるアプローチの有効性を検証する。
論文 参考訳(メタデータ) (2024-11-13T18:12:15Z) - Deep Learning Computer Vision Algorithms for Real-time UAVs On-board
Camera Image Processing [77.34726150561087]
本稿では,ディープラーニングに基づくコンピュータビジョンアルゴリズムを用いて,小型UAVのリアルタイムセンサ処理を実現する方法について述べる。
すべてのアルゴリズムは、ディープニューラルネットワークに基づく最先端の画像処理手法を用いて開発されている。
論文 参考訳(メタデータ) (2022-11-02T11:10:42Z) - FingerFlex: Inferring Finger Trajectories from ECoG signals [68.8204255655161]
FingerFlexモデル(FingerFlex model)は、脳波(ECoG)データに対する指の動きの回帰に適応した畳み込みエンコーダ・デコーダアーキテクチャである。
実測軌道と予測軌道の相関係数が最大0.74であるBCIコンペティションIVデータセット4で最先端の性能が達成された。
論文 参考訳(メタデータ) (2022-10-23T16:26:01Z) - Image Classification on Accelerated Neural Networks [0.0]
畳み込みニューラルネットワーク(CNN)は、画像分類アプリケーションにおいて最も頻繁に使用されるディープラーニング手法の1つである。
本稿では,FPGAのパワーを用いたアクセラレーション設計を基本CNNモデルに適用する。
このFPGA設計は、最先端のディープラーニングプラットフォームのパフォーマンスを上回っているので、結果は大いに励まされる。
論文 参考訳(メタデータ) (2022-03-21T16:03:07Z) - Convolutional Xformers for Vision [2.7188347260210466]
視覚変換器(ViT)は、特定のベンチマークにおける最先端の精度にもかかわらず、画像処理において限られた実用的利用しか見つからない。
限られた使用理由としては、畳み込みニューラルネットワーク(CNN)と比較して、より大きなトレーニングデータセットと計算リソースの必要性がある。
本稿では,これらの制約を克服するために,線形アテンション-畳み込みハイブリッドアーキテクチャーであるConvolutional X-formers for Vision (CXV)を提案する。
二次的注意をPerformer,Nystr"omformer,Linear Transformerなどの線形注意機構に置き換えてGPU使用量を削減する。
論文 参考訳(メタデータ) (2022-01-25T12:32:09Z) - Image Classification with CondenseNeXt for ARM-Based Computing Platforms [0.0]
我々は、自動運転車向けに開発された自動運転開発プラットフォームであるBlueBox上のCondenseNeXtという超効率的なディープ・ニューラル・ニューラルネットワークアーキテクチャの実装を実演する。
計算資源が限られているARMベースの組み込みコンピューティングプラットフォーム向けに設計されたFLOPにおいて,CondenseNeXtは極めて効率的であることを示す。
論文 参考訳(メタデータ) (2021-06-26T22:22:03Z) - Knowledge Distillation By Sparse Representation Matching [107.87219371697063]
本稿では,一方の畳み込みネットワーク(cnn)から他方へ,スパース表現を用いて中間知識を伝達するスパース表現マッチング(srm)を提案する。
勾配降下を利用して効率的に最適化し、任意のCNNにプラグアンドプレイで統合できるニューラルプロセッシングブロックとして定式化します。
実験の結果,教師と生徒のネットワーク間のアーキテクチャの違いに頑健であり,複数のデータセットにまたがる他のkd技術よりも優れていた。
論文 参考訳(メタデータ) (2021-03-31T11:47:47Z) - Reinforcement Learning with Latent Flow [78.74671595139613]
Flow of Latents for Reinforcement Learning (Flare)はRLのためのネットワークアーキテクチャであり、潜時ベクトル差分を通じて時間情報を明示的に符号化する。
本研究では,Frareが状態速度に明示的にアクセスすることなく,状態ベースRLの最適性能を回復することを示す。
我々はまた、FlareがDeepMindコントロールベンチマークスイート内のピクセルベースの挑戦的な連続制御タスクで最先端のパフォーマンスを達成することも示しています。
論文 参考訳(メタデータ) (2021-01-06T03:50:50Z) - Towards Scalable Distributed Training of Deep Learning on Public Cloud
Clusters [30.4449309904155]
分散トレーニングのための新しいトップkスパシフィケーション通信ライブラリを提案する。
CNNやTransformerの既存の最先端システムよりも25%~40%高速であることを示す。
論文 参考訳(メタデータ) (2020-10-20T17:16:29Z) - On Coresets for Support Vector Machines [61.928187390362176]
coresetは、元のデータポイントの小さな、代表的なサブセットである。
我々は,本アルゴリズムを用いて,既製のSVMソルバをストリーミング,分散,動的データ設定に適用可能であることを示す。
論文 参考訳(メタデータ) (2020-02-15T23:25:12Z) - GraphACT: Accelerating GCN Training on CPU-FPGA Heterogeneous Platforms [1.2183405753834562]
グラフ畳み込みネットワーク(GCN)は、グラフ上での表現学習のための最先端のディープラーニングモデルとして登場した。
実質的かつ不規則なデータ通信のため、GCNの訓練を加速することは困難である。
我々はCPU-FPGAヘテロジニアスシステム上でGCNをトレーニングするための新しいアクセラレータを設計する。
論文 参考訳(メタデータ) (2019-12-31T21:19:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。