論文の概要: TriLiteNet: Lightweight Model for Multi-Task Visual Perception
- arxiv url: http://arxiv.org/abs/2509.04092v1
- Date: Thu, 04 Sep 2025 10:48:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-05 20:21:10.135446
- Title: TriLiteNet: Lightweight Model for Multi-Task Visual Perception
- Title(参考訳): TriLiteNet:マルチタスク視覚知覚のための軽量モデル
- Authors: Quang-Huy Che, Duc-Khai Lam,
- Abstract要約: TriLiteNetは低計算コストを維持しながら性能を最適化するように設計されている。
提案モデルでは,パラメータがわずか0.14Mの小さな構成で,最小限の計算量でマルチタスクのソリューションを提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Efficient perception models are essential for Advanced Driver Assistance Systems (ADAS), as these applications require rapid processing and response to ensure safety and effectiveness in real-world environments. To address the real-time execution needs of such perception models, this study introduces the TriLiteNet model. This model can simultaneously manage multiple tasks related to panoramic driving perception. TriLiteNet is designed to optimize performance while maintaining low computational costs. Experimental results on the BDD100k dataset demonstrate that the model achieves competitive performance across three key tasks: vehicle detection, drivable area segmentation, and lane line segmentation. Specifically, the TriLiteNet_{base} demonstrated a recall of 85.6% for vehicle detection, a mean Intersection over Union (mIoU) of 92.4% for drivable area segmentation, and an Acc of 82.3% for lane line segmentation with only 2.35M parameters and a computational cost of 7.72 GFLOPs. Our proposed model includes a tiny configuration with just 0.14M parameters, which provides a multi-task solution with minimal computational demand. Evaluated for latency and power consumption on embedded devices, TriLiteNet in both configurations shows low latency and reasonable power during inference. By balancing performance, computational efficiency, and scalability, TriLiteNet offers a practical and deployable solution for real-world autonomous driving applications. Code is available at https://github.com/chequanghuy/TriLiteNet.
- Abstract(参考訳): 先進運転支援システム(ADAS)では, リアルタイム環境における安全性と有効性を確保するために, 迅速な処理と応答を必要とするため, 効率的な認識モデルが不可欠である。
このような知覚モデルのリアルタイム実行ニーズに対処するために,TriLiteNetモデルを提案する。
このモデルは、パノラマ駆動知覚に関連する複数のタスクを同時に管理することができる。
TriLiteNetは低計算コストを維持しながら性能を最適化するように設計されている。
BDD100kデータセットの実験結果は、車両検出、乾燥可能な領域分割、車線分割という3つの重要なタスクで、モデルが競争性能を達成することを示した。
具体的には、TriLiteNet_{base}は、車両検出のための85.6%のリコール、乾燥可能なエリアセグメンテーションのための平均接点(mIoU)92.4%のインターセクション、わずか2.35Mパラメータと計算コスト7.72GFLOPsのレーン線セグメンテーションのための82.3%のAccを実証した。
提案モデルでは,パラメータがわずか0.14Mの小さな構成で,最小限の計算量でマルチタスクのソリューションを提供する。
組み込みデバイス上でのレイテンシと電力消費を評価するため、両方の構成のTriLiteNetは、推論中に低レイテンシと合理的なパワーを示す。
パフォーマンス、計算効率、スケーラビリティのバランスをとることで、TriLiteNetは現実の自律運転アプリケーションに対して実用的でデプロイ可能なソリューションを提供する。
コードはhttps://github.com/chequanghuy/TriLiteNetで入手できる。
関連論文リスト
- SCoTT: Strategic Chain-of-Thought Tasking for Wireless-Aware Robot Navigation in Digital Twins [78.53885607559958]
無線対応経路計画フレームワークであるSCoTTを提案する。
SCoTT は DP-WA* の2% 以内で経路ゲインを達成し, 連続的に短い軌道を生成できることを示す。
また,ガゼボシミュレーションにおいて,SCoTTをROSノードとして配置することにより,本手法の実用性を示す。
論文 参考訳(メタデータ) (2024-11-27T10:45:49Z) - TwinLiteNet+: An Enhanced Multi-Task Segmentation Model for Autonomous Driving [2.1204495827342438]
TwinLiteNet+は、リアルタイムドライビング可能な領域とレーンセグメンテーションのための拡張マルチタスクセグメンテーションモデルである。
これは、ストライドベースの拡張畳み込みと深さ方向に分離可能な拡張畳み込みを統合するハイブリッドエンコーダアーキテクチャを採用している。
このモデルは、超コンパクトなTwinLiteNet+_Nano (34Kパラメータ)から高性能なTwinLiteNet+_Large (1.94Mパラメータ)までの4つの構成で利用できる。
論文 参考訳(メタデータ) (2024-03-25T17:17:45Z) - Latency-aware Unified Dynamic Networks for Efficient Image Recognition [72.8951331472913]
LAUDNetは動的ネットワークの理論的および実用的な効率ギャップを橋渡しするフレームワークである。
3つの主要な動的パラダイム - 適応型計算、動的層スキップ、動的チャネルスキップ - を統合している。
これにより、V100,3090やTX2 GPUのようなプラットフォーム上で、ResNetのようなモデルの遅延を50%以上削減できる。
論文 参考訳(メタデータ) (2023-08-30T10:57:41Z) - TwinLiteNet: An Efficient and Lightweight Model for Driveable Area and
Lane Segmentation in Self-Driving Cars [0.0]
本稿では、駆動可能領域と車線分割のための軽量モデルを提案する。
BDD100Kデータセット上でTwinLiteNetを評価し,最新のモデルと比較した。
具体的には、TwinLiteNetは、乾燥領域タスクで91.3%、レーン検出タスクで31.08%のIoUというmIoUスコアを達成している。
論文 参考訳(メタデータ) (2023-07-20T08:53:47Z) - Lightweight and Progressively-Scalable Networks for Semantic
Segmentation [100.63114424262234]
マルチスケール学習フレームワークは,セマンティックセグメンテーションを向上する有効なモデルのクラスと見なされてきた。
本稿では,畳み込みブロックの設計と,複数スケールにわたる相互作用の仕方について,徹底的に解析する。
我々は,軽量で拡張性の高いネットワーク(LPS-Net)を考案した。
論文 参考訳(メタデータ) (2022-07-27T16:00:28Z) - Real-Time Semantic Segmentation via Auto Depth, Downsampling Joint
Decision and Feature Aggregation [54.28963233377946]
本稿では,セグメンテーション戦略の自動化を目的として,AutoRTNetという共同検索フレームワークを提案する。
具体的には,ネットワーク深度とダウンサンプリング戦略を協調的に決定するハイパーセルと,自動マルチスケール機能アグリゲーションを実現するアグリゲーションセルを提案する。
論文 参考訳(メタデータ) (2020-03-31T14:02:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。