論文の概要: Lightweight Jet Reconstruction and Identification as an Object Detection
Task
- arxiv url: http://arxiv.org/abs/2202.04499v1
- Date: Wed, 9 Feb 2022 15:01:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-10 16:09:03.836503
- Title: Lightweight Jet Reconstruction and Identification as an Object Detection
Task
- Title(参考訳): 物体検出タスクとしての軽量ジェットの再構成と同定
- Authors: Adrian Alan Pol, Thea Aarrestad, Ekaterina Govorkova, Roi Halily, Anat
Klempner, Tal Kopetz, Vladimir Loncar, Jennifer Ngadiuba, Maurizio Pierini,
Olya Sirkin, Sioni Summers
- Abstract要約: 我々は、CERN大型ハドロン衝突型加速器で遭遇したジェットのエンド・ツー・エンドの識別と再構築作業に畳み込み技術を適用した。
PFJet-SSDは、クラスタジェットへの同時ローカライゼーション、分類、回帰タスクを実行し、特徴を再構築する。
3次ネットワークは、その完全精度の等価な性能と密に一致し、最先端のルールベースアルゴリズムより優れていることを示す。
- 参考スコア(独自算出の注目度): 5.071565475111431
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We apply object detection techniques based on deep convolutional blocks to
end-to-end jet identification and reconstruction tasks encountered at the CERN
Large Hadron Collider (LHC). Collision events produced at the LHC and
represented as an image composed of calorimeter and tracker cells are given as
an input to a Single Shot Detection network. The algorithm, named PFJet-SSD
performs simultaneous localization, classification and regression tasks to
cluster jets and reconstruct their features. This all-in-one single
feed-forward pass gives advantages in terms of execution time and an improved
accuracy w.r.t. traditional rule-based methods. A further gain is obtained from
network slimming, homogeneous quantization, and optimized runtime for meeting
memory and latency constraints of a typical real-time processing environment.
We experiment with 8-bit and ternary quantization, benchmarking their accuracy
and inference latency against a single-precision floating-point. We show that
the ternary network closely matches the performance of its full-precision
equivalent and outperforms the state-of-the-art rule-based algorithm. Finally,
we report the inference latency on different hardware platforms and discuss
future applications.
- Abstract(参考訳): 我々は,CERN大型ハドロン衝突型加速器(LHC)で遭遇した端端から端までのジェットの識別と再構成作業に,深部畳み込みブロックに基づく物体検出技術を適用した。
LHCで発生し、カロリーメータとトラッカーセルからなる画像として表される衝突事象は、シングルショット検出ネットワークへの入力として与えられる。
PFJet-SSDと名付けられたこのアルゴリズムは、クラスタジェットへの同時ローカライゼーション、分類、回帰タスクを実行し、特徴を再構築する。
このオールインワンのフィードフォワードパスは、実行時間と従来のルールベースの手法による精度の向上という面で利点がある。
ネットワークのスリム化、均質量子化、および典型的なリアルタイム処理環境のメモリとレイテンシの制約を満たす最適化されたランタイムからさらに利益を得る。
8ビットおよび3進量子化を実験し、その精度と推論レイテンシを単一精度浮動小数点に対してベンチマークした。
3次ネットワークは、その完全精度の等価な性能と密に一致し、最先端のルールベースアルゴリズムより優れていることを示す。
最後に,様々なハードウェアプラットフォームにおける推論遅延を報告し,今後のアプリケーションについて考察する。
関連論文リスト
- Collaborative Edge AI Inference over Cloud-RAN [37.3710464868215]
クラウド無線アクセスネットワーク(Cloud-RAN)ベースの協調エッジAI推論アーキテクチャを提案する。
具体的には、地理的に分散したデバイスが、リアルタイムのノイズ破壊センサデータサンプルをキャプチャし、ノイズの多い局所特徴ベクトルを抽出する。
我々は,各RRHが同一リソースブロック上の全デバイスから局所的特徴ベクトルを同時に受信することを可能にする。
これらの集約された特徴ベクトルは量子化され、さらに集約および下流推論タスクのために中央プロセッサに送信される。
論文 参考訳(メタデータ) (2024-04-09T04:26:16Z) - Edge-Enabled Real-time Railway Track Segmentation [0.0]
エッジ対応鉄道線路分割アルゴリズムを提案する。
ネットワーク構造を最適化し、トレーニング後のモデルを定量化することで、エッジアプリケーションに適したように最適化されている。
実験結果から,提案アルゴリズムの精度は83.3%であった。
論文 参考訳(メタデータ) (2024-01-21T13:45:52Z) - Task-Oriented Over-the-Air Computation for Multi-Device Edge AI [57.50247872182593]
エッジAIをサポートするための6Gネットワークは、AIタスクの効率的かつ効率的な実行に焦点を当てたタスク指向のテクニックを備えている。
本稿では,マルチデバイススプリット推論システムにおけるタスク指向オーバー・ザ・エア計算(AirComp)方式を提案する。
論文 参考訳(メタデータ) (2022-11-02T16:35:14Z) - MAPLE-Edge: A Runtime Latency Predictor for Edge Devices [80.01591186546793]
汎用ハードウェアの最先端遅延予測器であるMAPLEのエッジデバイス指向拡張であるMAPLE-Edgeを提案する。
MAPLEと比較して、MAPLE-Edgeはより小さなCPUパフォーマンスカウンタを使用して、ランタイムとターゲットデバイスプラットフォームを記述することができる。
また、共通ランタイムを共有するデバイスプール上でトレーニングを行うMAPLEとは異なり、MAPLE-Edgeは実行時に効果的に一般化できることを示す。
論文 参考訳(メタデータ) (2022-04-27T14:00:48Z) - AEGNN: Asynchronous Event-based Graph Neural Networks [54.528926463775946]
イベントベースのグラフニューラルネットワークは、標準のGNNを一般化して、イベントを"進化的"時間グラフとして処理する。
AEGNNは同期入力で容易に訓練でき、テスト時に効率的な「非同期」ネットワークに変換できる。
論文 参考訳(メタデータ) (2022-03-31T16:21:12Z) - ZippyPoint: Fast Interest Point Detection, Description, and Matching
through Mixed Precision Discretization [71.91942002659795]
我々は,ネットワーク量子化技術を用いて推論を高速化し,計算限定プラットフォームでの利用を可能にする。
バイナリディスクリプタを用いた効率的な量子化ネットワークZippyPointは,ネットワーク実行速度,ディスクリプタマッチング速度,3Dモデルサイズを改善する。
これらの改善は、ホモグラフィー推定、視覚的ローカライゼーション、マップフリーな視覚的再ローカライゼーションのタスクで評価されるように、小さなパフォーマンス劣化をもたらす。
論文 参考訳(メタデータ) (2022-03-07T18:59:03Z) - Faster object tracking pipeline for real time tracking [0.0]
マルチオブジェクトトラッキング(MOT)は、視覚ベースのアプリケーションにとって難しい実践的問題である。
本稿では,検出に基づく物体追跡手法の高速化に有効な汎用パイプラインについて紹介する。
論文 参考訳(メタデータ) (2020-11-08T06:33:48Z) - Distance-Weighted Graph Neural Networks on FPGAs for Real-Time Particle
Reconstruction in High Energy Physics [11.125632758828266]
FPGA上で1$mumathrms未満のレイテンシで実行できる距離重み付きグラフネットワークの設計方法について論じる。
本研究では,粒子衝突型加速器で動作する次世代熱量計における粒子の再構成と同定に関連する代表的課題について考察する。
我々は、圧縮されたモデルをファームウェアに変換し、FPGA上で実装する。
論文 参考訳(メタデータ) (2020-08-08T21:26:31Z) - AQD: Towards Accurate Fully-Quantized Object Detection [94.06347866374927]
本稿では,浮動小数点演算を除去するために,AQDと呼ばれる高精度な量子化オブジェクト検出ソリューションを提案する。
我々のAQDは、非常に低ビットのスキームの下での完全精度と比較して、同等またはそれ以上の性能を実現しています。
論文 参考訳(メタデータ) (2020-07-14T09:07:29Z) - Depthwise Non-local Module for Fast Salient Object Detection Using a
Single Thread [136.2224792151324]
本稿では,高速な物体検出のための新しいディープラーニングアルゴリズムを提案する。
提案アルゴリズムは,1つのCPUスレッドと同時に,競合精度と高い推論効率を実現する。
論文 参考訳(メタデータ) (2020-01-22T15:23:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。