論文の概要: Tiny Collaborative Inference for Occlusion-Robust Object Detection
- arxiv url: http://arxiv.org/abs/2606.02894v2
- Date: Wed, 03 Jun 2026 10:50:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 17:40:41.613317
- Title: Tiny Collaborative Inference for Occlusion-Robust Object Detection
- Title(参考訳): Occlusion-Robust 物体検出のためのTiny Collaborative Inference
- Authors: Chieh-Tung Cheng, Mustafa Aslanov, Eiman Kanjo,
- Abstract要約: 検索と救助のためのエッジAIノードは、コンピュータビジョンをローカルで実行することがますます期待されている。
ウルトラローエンドハードウェアは、メモリ、計算、デバイス間通信に厳しい制約を課す。
本研究は、MCUバックボーン、YOLOv2検出ヘッド、Lite量子化を組み合わせることで、1MB未満の閉塞物検出装置に対処する。
- 参考スコア(独自算出の注目度): 0.5352699766206808
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Edge AI nodes for search and rescue are increasingly expected to run computer vision locally, yet ultra-low-end hardware imposes hard constraints on memory, compute, and inter-device communication. This work addresses occlusion-robust object detection on devices with less than 1 MB SRAM by combining an MCUNet backbone, a YOLOv2 detection head, and Lite quantisation. Two collaborative inference strategies are evaluated: feature-level fusion, concatenating intermediate feature maps, and decision-level fusion via Weighted Boxes Fusion (WBF). WBF outperforms feature-level fusion under all tested occlusion conditions, yielding gains of up to +0.2736 mAP in asymmetric scenarios. Extending fusion to three views improves accuracy further (up to +0.3827 mAP) at modest communication overhead (~1.3 KB per exchange). Hardware experiments progress from a host-assisted USB-relay baseline to a Wi-Fi peer-to-peer deployment on two Coral Dev Board Micro units, where WBF executes on-device with negligible communication energy relative to inference. In a 301.9 s autonomous session of 108 frames, fused output is produced on 61 frames versus 47 for a single board - a coverage gain of +29.8%. A decentralised federated learning feasibility note is included but not treated as a primary result, as performance remains limited under non-iid data. The results support decision-level fusion as a viable option for improving occlusion robustness in small-scale edge object detection, including host-free multi-board operation on ultra-low-end hardware.
- Abstract(参考訳): 検索と救助のためのエッジAIノードは、コンピュータビジョンをローカルで実行することがますます期待されているが、ウルトラローエンドハードウェアは、メモリ、計算、デバイス間通信に厳しい制約を課している。
本研究は,MCUNetバックボーン,YOLOv2検出ヘッド,ライト量子化を組み合わせることで,SRAMが1MB未満のデバイス上でのオクルージョン・ロバスト物体検出に対処する。
特徴レベル融合、中間特徴写像の連結、重み付きボックス融合(WBF)による決定レベル融合という2つの協調的推論戦略が評価されている。
WBFは全ての試験オクルージョン条件下で特徴レベルの融合よりも優れており、非対称シナリオでは+0.2736 mAPの利得が得られる。
融合を3つのビューに拡張することで、より正確(+0.3827 mAPまで)な通信オーバーヘッド(交換1KBあたり約1.3KB)が向上する。
ハードウェア実験は、ホスト支援のUSB-リレーベースラインから、2つのCoral Dev Board Microユニット上のWi-Fiピアツーピアデプロイメントまで進行し、WBFは推論に対して無視できる通信エネルギーでデバイス上で実行する。
108フレームの301.9秒の自律的なセッションでは、融合出力は61フレームで、シングルボードでは47フレームで、カバー率は+29.8%である。
非イドデータの下では性能が制限されるため、分散化されたフェーザビリティノートを含むが、一次結果として扱われない。
その結果, 極低ハードウェア上でのホストフリーマルチボード操作を含む, 小型エッジオブジェクト検出におけるオクルージョンロバスト性向上の有効な選択肢として, 決定レベル融合が支持された。
関連論文リスト
- Profiling-Driven Adaptive Distributed Transformer Inference on Embedded Edge Deployment [60.442064966340524]
本稿では、WiFi経由で接続されたNVIDIA Jetson Orin Nanoデバイスに関するプロトタイプ研究を行う。
主な発見は、主なボトルネックは、ネットワーク帯域幅だけでなく、通信中のCPU-GPUステージングである。
実験によると、この戦略はフルテンソル交換と比較して遅延を65%-77%減らし、エネルギー消費を34%-52%減らしている。
論文 参考訳(メタデータ) (2026-05-25T10:39:28Z) - WISV: Wireless-Informed Semantic Verification for Distributed Speculative Decoding in Device-Edge LLM Inference [56.297697169678095]
WISV(Wireless-Informed Semantic Verification)は、分散投機的復号化フレームワークである。
WISVは最大60.8%の許容長の増加、37.3%の対話ラウンドの削減、31.4%のエンドツーエンドレイテンシの改善を実現している。
NVIDIA Jetson AGX OrinとA40搭載サーバからなるハードウェアテストベッド上でWISVを検証する。
論文 参考訳(メタデータ) (2026-04-20T01:29:56Z) - Fully Autonomous Z-Score-Based TinyML Anomaly Detection on Resource-Constrained MCUs Using Power Side-Channel Data [0.13750624267664155]
本稿では,低消費電力マイクロコントローラに実装した完全自律型Tiny Machine Learning (TinyML) Z-Scoreによる異常検出システムを提案する。
異常は軽量なZスコアしきい値を用いて検出され、組み込み配置に適した解釈可能かつ計算効率の良い推論が可能である。
結果は、精度1.00の精度とリコール、数十マイクロ秒の推論レイテンシ、メモリフットプリント全体の約3.3KBと63KBのフラッシュの完全な検出性能を示す。
論文 参考訳(メタデータ) (2026-03-28T20:15:50Z) - SC-MII: Infrastructure LiDAR-based 3D Object Detection on Edge Devices for Split Computing with Multiple Intermediate Outputs Integration [1.1761374316223123]
LiDARベースのポイントクラウドデータとディープニューラルネットワークを用いた3Dオブジェクト検出は、自動運転技術において不可欠である。
最先端デバイスに最先端モデルをデプロイすることは、高い計算要求とエネルギー消費による課題を示す。
本稿では,複数の中間出力を統合したスプリットコンピューティングのためのエッジデバイス上での複数インフラLiDARベースの3Dオブジェクト検出であるSC-MIIを提案する。
論文 参考訳(メタデータ) (2026-01-12T01:17:01Z) - Integrated Sensing, Communication, and Computation for Over-the-Air Federated Edge Learning [52.904670248426626]
本稿では,統合されたセンサ,通信,計算機能を備えた空対空フェデレーションエッジ・ラーニング(Air-FEEL)システムについて検討する。
バッチサイズ制御とネットワークリソース割り当てを交互に最適化することにより、低複雑さI SCCアルゴリズムを導出する。
論文 参考訳(メタデータ) (2025-08-21T02:46:46Z) - An Experimental Study of Split-Learning TinyML on Ultra-Low-Power Edge/IoT Nodes [2.624902795082451]
スプリット学習(SL)は、センサ上の推論プロセスの一部を実行し、残りの部分を同伴装置にオフロードする。
本稿では,Espressif ESP32-S3基板上に構築されたTinyML+SLテストベッドについて述べる。
我々は、8ビット整数に量子化され、分割され、オーバー・ザ・エアの更新によってノードに配信されるMobileNetV2画像認識モデルの性能をベンチマークする。
論文 参考訳(メタデータ) (2025-07-22T13:50:12Z) - HeteroEdge: Addressing Asymmetry in Heterogeneous Collaborative
Autonomous Systems [1.274065448486689]
2台の無人地上車両(UGV)と2台のNVIDIA Jetsonデバイスからなるテストベッドの自己適応最適化フレームワークを提案する。
このフレームワークは、異種ノード上の複数のタスク(ストレージ、処理、計算、送信、推論)を同時に効率的に管理する。
入力された画像フレームの圧縮とマスキング、類似したフレームの識別、および最適化のための境界条件を得るためにプロファイリング装置を含む。
論文 参考訳(メタデータ) (2023-05-05T02:43:16Z) - DPNet: Dual-Path Network for Real-time Object Detection with Lightweight
Attention [15.360769793764526]
本稿では,リアルタイム物体検出のための軽量アテンション方式を用いて,DPNetというデュアルパスネットワークを提案する。
DPNetは、検出精度と実装効率の間の最先端のトレードオフを実現する。
論文 参考訳(メタデータ) (2022-09-28T09:11:01Z) - MSMDFusion: Fusing LiDAR and Camera at Multiple Scales with Multi-Depth
Seeds for 3D Object Detection [89.26380781863665]
自律運転システムにおける高精度で信頼性の高い3次元物体検出を実現するためには,LiDARとカメラ情報の融合が不可欠である。
近年のアプローチでは、2次元カメラ画像の3次元空間への昇華点によるカメラ特徴のセマンティックな密度の探索が試みられている。
マルチグラニュラリティLiDARとカメラ機能とのマルチスケールなプログレッシブインタラクションに焦点を当てた,新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-09-07T12:29:29Z) - EPNet++: Cascade Bi-directional Fusion for Multi-Modal 3D Object
Detection [56.03081616213012]
本稿では,新しいCasscade Bi-directional Fusion(CB-Fusion)モジュールを導入することで,マルチモーダル3Dオブジェクト検出のためのEPNet++を提案する。
提案したCB-Fusionモジュールは、カスケード双方向相互作用融合方式で画像特徴と点特徴の豊富な意味情報を高める。
KITTI、JRDB、SUN-RGBDデータセットの実験結果は、最先端の手法よりもEPNet++の方が優れていることを示している。
論文 参考訳(メタデータ) (2021-12-21T10:48:34Z) - EPMF: Efficient Perception-aware Multi-sensor Fusion for 3D Semantic Segmentation [62.210091681352914]
自律運転やロボティクスなど,多くのアプリケーションを対象とした3次元セマンティックセマンティックセグメンテーションのためのマルチセンサフュージョンについて検討する。
本研究では,知覚認識型マルチセンサフュージョン(PMF)と呼ばれる協調融合方式について検討する。
本稿では,2つのモードから特徴を分離して抽出する2ストリームネットワークを提案する。
論文 参考訳(メタデータ) (2021-06-21T10:47:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。