論文の概要: eWaSR -- an embedded-compute-ready maritime obstacle detection network
- arxiv url: http://arxiv.org/abs/2304.11249v1
- Date: Fri, 21 Apr 2023 20:53:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-25 19:34:30.884108
- Title: eWaSR -- an embedded-compute-ready maritime obstacle detection network
- Title(参考訳): eWaSR -- 組み込み計算可能な海上障害物検出ネットワーク
- Authors: Matija Ter\v{s}ek and Lojze \v{Z}ust and Matej Kristan
- Abstract要約: 現在最も優れた海上障害物検出ネットワークであるWASRを解析する。
次に、最も計算集約的な段階の置換を提案し、その組込み計算可能な変種eWaSRを提案する。
eWaSRは最先端のWaSRに匹敵する検出結果を達成し、F1スコアは0.52%に過ぎなかった。
- 参考スコア(独自算出の注目度): 9.119786455673967
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Maritime obstacle detection is critical for safe navigation of autonomous
surface vehicles (ASVs). While the accuracy of image-based detection methods
has advanced substantially, their computational and memory requirements
prohibit deployment on embedded devices. In this paper we analyze the currently
best-performing maritime obstacle detection network WaSR. Based on the analysis
we then propose replacements for the most computationally intensive stages and
propose its embedded-compute-ready variant eWaSR. In particular, the new design
follows the most recent advancements of transformer-based lightweight networks.
eWaSR achieves comparable detection results to state-of-the-art WaSR with only
0.52% F1 score performance drop and outperforms other state-of-the-art
embedded-ready architectures by over 9.74% in F1 score. On a standard GPU,
eWaSR runs 10x faster than the original WaSR (115 FPS vs 11 FPS). Tests on a
real embedded device OAK-D show that, while WaSR cannot run due to memory
restrictions, eWaSR runs comfortably at 5.5 FPS. This makes eWaSR the first
practical embedded-compute-ready maritime obstacle detection network. The
source code and trained eWaSR models are publicly available here:
https://github.com/tersekmatija/eWaSR.
- Abstract(参考訳): 海上障害物検出は、自律表面車両(ASV)の安全な航行に重要である。
画像に基づく検出手法の精度は大幅に向上しているが、その計算とメモリ要件は組み込みデバイスへの展開を禁止している。
本稿では,現在最も高性能な海上障害物検出ネットワークwasrの解析を行う。
この分析に基づいて、計算集約的なステージの置換を提案し、組込み畳み込み型 eWaSR を提案する。
特に、新しい設計は変圧器ベースの軽量ネットワークの最新の進歩に続くものである。
eWaSRは、0.52%のF1スコアで最先端のWaSRに匹敵する検出結果を達成し、F1スコアで9.74%以上向上した。
標準GPUでは、eWaSRは元のWaSR(115 FPS対11 FPS)より10倍高速で動作する。
実際の組み込みデバイスOAK-Dでのテストでは、WaSRはメモリ制限のために動作できないが、eWaSRは5.5FPSで快適に動作している。
これにより、eWaSRは初めて組み込み計算可能な海上障害物検出ネットワークとなる。
ソースコードとトレーニングされたeWaSRモデルはこちらで公開されている。
関連論文リスト
- DiRecNetV2: A Transformer-Enhanced Network for Aerial Disaster Recognition [4.678150356894011]
災害評価における航空画像処理のための人工知能(AI)モデルと無人航空機の統合には、例外的な精度、計算効率、リアルタイム処理能力が必要である。
伝統的に、畳み込みニューラルネットワーク(CNN)は局所的特徴抽出の効率を示すが、大域的文脈解釈の可能性によって制限される。
視覚変換器(ViT)は、注意機構を用いることで、グローバルな文脈解釈の改善を約束するが、それでもUAVベースの災害対応アプリケーションでは未検討である。
論文 参考訳(メタデータ) (2024-10-17T15:25:13Z) - Enhancing sea ice segmentation in Sentinel-1 images with atrous
convolutions [1.0905169282633254]
MLトレーニングと評価のために生成された高解像度ベンチマークデータセットであるExtreme Earthバージョン2を使用します。
我々のパイプラインは、SAR画像セグメンテーションのためのResNetsとAtrous Space Pyramid Poolingを組み合わせたものである。
提案手法は,全SARシーンを1回の実行で効率的に分割することができ,ベースラインのU-Netよりも高速で,空間解像度と寸法を保ち,パッチ分類に依存するアプローチに比べてノイズに対して頑健である。
論文 参考訳(メタデータ) (2023-10-26T03:43:28Z) - Exploiting Sparsity in Automotive Radar Object Detection Networks [1.3194391758295114]
本稿では,グリッドベースの強力な検出と低計算資源を組み合わせたスパース畳み込みオブジェクト検出ネットワークについて検討する。
本稿では、グリッドレンダリングとスパースバックボーンアーキテクチャの補正として、スパースカーネルポイントピラー(SKPP)とデュアルボクセルポイントコンボリューション(DVPC)を提案する。
SKPP-DPVCN アーキテクチャを nuScenes 上で評価し, ベースラインの5.89%, 先行状態の4.19% を Car AP4.0 で上回った。
論文 参考訳(メタデータ) (2023-08-15T12:58:06Z) - Oriented R-CNN for Object Detection [61.78746189807462]
本研究では、オブジェクト指向R-CNNと呼ばれる、効果的でシンプルなオブジェクト指向オブジェクト検出フレームワークを提案する。
第1段階では,高品質な指向型提案をほぼ無償で直接生成する指向型領域提案ネットワーク(指向RPN)を提案する。
第2段階は、R-CNNヘッダーで、興味のある領域(オブジェクト指向のRoI)を精製し、認識する。
論文 参考訳(メタデータ) (2021-08-12T12:47:43Z) - WNARS: WFST based Non-autoregressive Streaming End-to-End Speech
Recognition [59.975078145303605]
本稿では,ハイブリッドCTC-attention AEDモデルと重み付き有限状態トランスデューサを用いた新しいフレームワークWNARSを提案する。
AISHELL-1タスクでは、640msの遅延で5.22%の文字エラー率を達成し、オンラインASRの最先端のパフォーマンスである私たちの知識を最大限に活用します。
論文 参考訳(メタデータ) (2021-04-08T07:56:03Z) - FastFlowNet: A Lightweight Network for Fast Optical Flow Estimation [81.76975488010213]
ディセンス光学フロー推定は、多くのロボットビジョンタスクで重要な役割を果たしています。
現在のネットワークはしばしば多くのパラメータを占有し、計算コストがかかる。
提案したFastFlowNetは、周知の粗大なやり方で、以下のイノベーションで機能する。
論文 参考訳(メタデータ) (2021-03-08T03:09:37Z) - GhostSR: Learning Ghost Features for Efficient Image Super-Resolution [49.393251361038025]
畳み込みニューラルネットワーク(CNN)に基づく単一の画像スーパーリゾリューション(SISR)システムは、膨大な計算コストを必要としながら派手なパフォーマンスを実現します。
SISRモデルの冗長な特徴(すなわちゴースト特徴)を生成するためにシフト演算を用いることを提案する。
提案モジュールに埋め込まれた非コンパクトかつ軽量なSISRモデルの両方が,ベースラインと同等の性能を発揮することを示す。
論文 参考訳(メタデータ) (2021-01-21T10:09:47Z) - SplitSR: An End-to-End Approach to Super-Resolution on Mobile Devices [7.72178128781302]
SplitSRと呼ばれる新しいハイブリッドアーキテクチャを用いて、デバイス上の超解像に対する最先端のレイテンシと精度を示す。
SplitSRは標準の畳み込みブロックと軽量な残留ブロックからなるハイブリッド設計である。
私たちのモデルをZoomSRというアプリでスマートフォンにデプロイし、デバイス上のディープラーニングベースのSRの最初のインスタンスをデモします。
論文 参考訳(メタデータ) (2021-01-20T06:47:41Z) - On-Device Text Image Super Resolution [0.0]
我々は、よりシャープな文字エッジを再構築し、OCRの信頼性を高める新しいディープニューラルネットワークを提案する。
提案アーキテクチャは, バイコビックアップサンプリングによるPSNRの大幅な改善を実現するだけでなく, 平均推定時間1枚当たり11.7msで動作する。
ICDAR 2015 TextSRデータセットでは、OCRの精度が75.89%に達しています。
論文 参考訳(メタデータ) (2020-11-20T07:49:48Z) - Dual-mode ASR: Unify and Improve Streaming ASR with Full-context
Modeling [76.43479696760996]
本稿では,ストリーミングとフルコンテキスト音声認識の両方に共通重みを持つ単一エンドツーエンドのASRモデルをトレーニングするための統合フレームワークであるDual-mode ASRを提案する。
そこで本研究では,ストリーミングASRのレイテンシと精度が,重み共有とフルコンテキストASRの連成訓練のメリットを顕著に示す。
論文 参考訳(メタデータ) (2020-10-12T21:12:56Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。