論文の概要: Instance-Aware Knowledge Distillation for Semi-Supervised Learning of an On-Board Multi-Task Dense Prediction Model for Collision Avoidance System
- arxiv url: http://arxiv.org/abs/2606.16414v1
- Date: Mon, 15 Jun 2026 08:51:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 16:21:34.249326
- Title: Instance-Aware Knowledge Distillation for Semi-Supervised Learning of an On-Board Multi-Task Dense Prediction Model for Collision Avoidance System
- Title(参考訳): 衝突回避システムのためのオンボードマルチタスクデンス予測モデルの半教師付き学習のためのインスタンス認識知識蒸留
- Authors: Gyutae Hwang, Sang Jun Lee,
- Abstract要約: 半教師付き学習のための事例認識型知識蒸留フレームワークを提案する。
提案した衝突回避システムに、訓練された軽量の学生を配置する。
教師と比較して、FLOPsを22.68$times$、パラメータを14.33$times$、低コストのエッジデバイスで6.46 FPSを達成する。
- 参考スコア(独自算出の注目度): 14.053056152598794
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Collision avoidance systems have evolved toward camera-based deep learning approaches for driving scene understanding. However, deployment in edge environments such as country clubs is constrained by limited computational resources and unreliable communication infrastructure. Moreover, constructing large-scale datasets for the target domain involves substantial annotation cost. To address these limitations, we propose an instance-aware knowledge distillation framework for semi-supervised learning. Specifically, we generate pseudo labels that mitigate teacher bias by leveraging domain priors from the teacher and instance-centric knowledge from foundation models. The trained lightweight student is deployed in the proposed collision avoidance system and performs multiple dense prediction tasks in real-time. The system detects frontal obstacles and encodes their spatial information into controller area network messages for automated guided vehicle operation. To achieve this, we construct a large-scale country club dataset and perform field validation of the proposed system. Experimental results demonstrate that the student outperforms the large teacher in instance segmentation while mitigating performance degradation in monocular depth estimation. Compared with the teacher, the student reduces FLOPs by 22.68$\times$ and parameters by 14.33$\times$, achieving 6.46 FPS on a low-cost edge device.
- Abstract(参考訳): 衝突回避システムは、シーン理解を促進するためのカメラベースのディープラーニングアプローチへと進化してきた。
しかし、カントリークラブのようなエッジ環境への展開は、限られた計算資源と信頼性の低い通信インフラによって制限されている。
さらに、ターゲットドメイン用の大規模データセットの構築には、相当なアノテーションコストが伴う。
これらの制約に対処するために,半教師付き学習のための事例認識型知識蒸留フレームワークを提案する。
具体的には、教師からのドメイン優先と基礎モデルからのインスタンス中心の知識を活用することで、教師のバイアスを軽減する擬似ラベルを生成する。
訓練された軽量な学生は、提案した衝突回避システムに配置され、リアルタイムに複数の密集予測タスクを実行する。
本システムは、前方障害物を検出し、その空間情報を制御エリアネットワークメッセージに符号化し、自動誘導車両操作を行う。
そこで本研究では,大規模なカントリークラブデータセットを構築し,提案システムのフィールド検証を行う。
実験結果から, 単眼深度推定における性能劣化を軽減しつつ, 大規模教員のインスタンスセグメンテーションにおいて, 成績が優れていたことが示唆された。
教師と比較して、FLOPsを22.68$\times$とパラメータを14.33$\times$に減らし、低コストのエッジデバイスで6.46 FPSを達成する。
関連論文リスト
- Self-Supervised Learning to Fly using Efficient Semantic Segmentation and Metric Depth Estimation for Low-Cost Autonomous UAVs [5.602128292727329]
本稿では,制御室内環境下での小型UAVのための視覚のみの自律飛行システムを提案する。
このシステムは、セマンティックセグメンテーションと単眼深度推定を組み合わせることで、障害物回避、シーン探索、自律型安全な着陸操作を可能にする。
鍵となる革新は適応スケールファクターアルゴリズムであり、非メトリックな単眼深度予測を正確な距離測定に変換する。
論文 参考訳(メタデータ) (2025-10-18T19:35:17Z) - Efficient Prompt Tuning of Large Vision-Language Model for Fine-Grained Ship Classification [59.99976102069976]
リモートセンシング(RS-FGSC)における船のきめ細かい分類は、クラス間の高い類似性とラベル付きデータの限られた可用性のために大きな課題となる。
大規模な訓練済みビジョンランゲージモデル(VLM)の最近の進歩は、少数ショット学習やゼロショット学習において印象的な能力を示している。
本研究は, 船種別分類精度を高めるために, VLMの可能性を生かしたものである。
論文 参考訳(メタデータ) (2024-03-13T05:48:58Z) - Bidirectional Knowledge Reconfiguration for Lightweight Point Cloud
Analysis [74.00441177577295]
ポイントクラウド分析は計算システムのオーバーヘッドに直面し、モバイルやエッジデバイスでの利用を制限する。
本稿では,軽量点雲モデルのための特徴蒸留について検討する。
本研究では,教師から生徒への情報的文脈的知識を抽出するための双方向知識再構成を提案する。
論文 参考訳(メタデータ) (2023-10-08T11:32:50Z) - Online Data Selection for Federated Learning with Limited Storage [53.46789303416799]
ネットワークデバイス間での分散機械学習を実現するために、フェデレートラーニング(FL)が提案されている。
デバイス上のストレージがFLの性能に与える影響はまだ調査されていない。
本研究では,デバイス上のストレージを限定したFLのオンラインデータ選択について検討する。
論文 参考訳(メタデータ) (2022-09-01T03:27:33Z) - Towards an Error-free Deep Occupancy Detector for Smart Camera Parking
System [0.26249027950824505]
我々は,OcpDetと呼ばれる物体検出装置による自律的占有度を提供する,エンドツーエンドのスマートカメラ駐車システムを提案する。
我々の検出器はまた、トレーニングや空間知識といった対照的なモジュールからの有意義な情報も提供しています。
我々は、既存のPKLotデータセット上でOcpDetをベンチマークし、従来の分類ソリューションと比較して競合する結果を得た。
論文 参考訳(メタデータ) (2022-08-17T11:02:29Z) - Efficient and Robust LiDAR-Based End-to-End Navigation [132.52661670308606]
我々は,LiDARをベースとした効率的なエンドツーエンドナビゲーションフレームワークを提案する。
本稿では,スパース畳み込みカーネル最適化とハードウェア対応モデル設計に基づくFast-LiDARNetを提案する。
次に,単一の前方通過のみから予測の不確かさを直接推定するハイブリッド・エビデンシャル・フュージョンを提案する。
論文 参考訳(メタデータ) (2021-05-20T17:52:37Z) - Offloading Optimization in Edge Computing for Deep Learning Enabled
Target Tracking by Internet-of-UAVs [22.143742665920573]
無人航空機(UAV)は標的追跡などの情報提供に広く利用されている。
プレトレーニングされた畳み込みニューラルネットワーク(CNN)がUAVに展開され、キャプチャされたビデオフレームからターゲットを特定する。
この種の視覚目標追跡は、所望の高推論精度と厳格な遅延要求のため、多くの計算資源を必要とする。
これは、このようなディープラーニング(DL)タスクをモバイルエッジコンピューティング(MEC)サーバにオフロードすることを検討する動機となります。
論文 参考訳(メタデータ) (2020-08-18T16:00:36Z) - Reinforced Wasserstein Training for Severity-Aware Semantic Segmentation
in Autonomous Driving [45.11602128316305]
我々は,クラス間の相関関係を,その基準を誤分類の重大度として定義し,学習枠組みを構築した。
CamVidとCityscapesのデータセットでの実験は、ワッサースタインの損失の有効性を実証した。
論文 参考訳(メタデータ) (2020-08-11T15:00:41Z) - Distilling Object Detectors with Task Adaptive Regularization [97.52935611385179]
現在の最先端のオブジェクト検出器は高い計算コストを犠牲にしており、ローエンドデバイスへのデプロイが困難である。
より大規模な教師モデルから知識を伝達することで、より小さな学生ネットワークを訓練することを目的とした知識蒸留は、モデル小型化のための有望な解決策の1つである。
論文 参考訳(メタデータ) (2020-06-23T15:58:22Z) - Visually Impaired Aid using Convolutional Neural Networks, Transfer
Learning, and Particle Competition and Cooperation [0.0]
本稿では、畳み込みニューラルネットワーク(CNN)、伝達学習、半教師付き学習(SSL)を用いて、視覚障害者支援を目的としたフレームワークを構築することを提案する。
計算コストが低く、従って、追加の機器に頼ることなく、現在のスマートフォンで実装することができる。
論文 参考訳(メタデータ) (2020-05-09T16:11:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。