論文の概要: Rethinking RAFT for Efficient Optical Flow
- arxiv url: http://arxiv.org/abs/2401.00833v1
- Date: Mon, 1 Jan 2024 18:23:39 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-03 15:32:40.972304
- Title: Rethinking RAFT for Efficient Optical Flow
- Title(参考訳): 効率的な光流動のためのRAFTの再考
- Authors: Navid Eslami, Farnoosh Arefi, Amir M. Mansourian, Shohreh Kasaei
- Abstract要約: 本稿ではRAFTフレームワークに基づく新しいアプローチを提案する。
グローバルな特徴抽出と繰り返しパターンへの対処のためのアテンションメカニズムが組み込まれている。
提案手法は,効率的なRAFT(Ef-RAFT)であり,Sintelデータセットで10%,RAFT上でのKITTIデータセットで5%の大幅な改善を実現している。
- 参考スコア(独自算出の注目度): 9.115508086522887
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Despite significant progress in deep learning-based optical flow methods,
accurately estimating large displacements and repetitive patterns remains a
challenge. The limitations of local features and similarity search patterns
used in these algorithms contribute to this issue. Additionally, some existing
methods suffer from slow runtime and excessive graphic memory consumption. To
address these problems, this paper proposes a novel approach based on the RAFT
framework. The proposed Attention-based Feature Localization (AFL) approach
incorporates the attention mechanism to handle global feature extraction and
address repetitive patterns. It introduces an operator for matching pixels with
corresponding counterparts in the second frame and assigning accurate flow
values. Furthermore, an Amorphous Lookup Operator (ALO) is proposed to enhance
convergence speed and improve RAFTs ability to handle large displacements by
reducing data redundancy in its search operator and expanding the search space
for similarity extraction. The proposed method, Efficient RAFT
(Ef-RAFT),achieves significant improvements of 10% on the Sintel dataset and 5%
on the KITTI dataset over RAFT. Remarkably, these enhancements are attained
with a modest 33% reduction in speed and a mere 13% increase in memory usage.
The code is available at: https://github.com/n3slami/Ef-RAFT
- Abstract(参考訳): ディープラーニングに基づくオプティカルフロー手法の大幅な進歩にもかかわらず、大きな変位や繰り返しパターンを正確に推定することは課題である。
これらのアルゴリズムで使用される局所的特徴と類似性検索パターンの制限がこの問題に寄与する。
さらに、いくつかの既存のメソッドは、実行が遅く、グラフィックメモリ消費が過剰である。
そこで本研究では,RAFTフレームワークに基づく新しいアプローチを提案する。
AFL(Attention-based Feature Localization)アプローチでは、グローバルな特徴抽出と繰り返しパターンへの対処のためのアテンション機構が組み込まれている。
第2フレームで対応するピクセルと対応するピクセルをマッチングし、正確なフロー値を割り当てる演算子を導入する。
さらに,アモルファスルックアップ演算子(alo)を提案し,探索演算子のデータ冗長性を低減し,類似度抽出のための探索空間を拡大することにより,収束速度の向上と大きな変位処理能力の向上を図る。
提案手法は,効率的なRAFT(Ef-RAFT)であり,Sintelデータセットで10%,RAFT上でのKITTIデータセットで5%の大幅な改善を実現している。
驚くべきことに、これらの拡張は、わずか33%の速度低下と、わずか13%のメモリ使用の増加で達成されている。
コードは https://github.com/n3slami/Ef-RAFT
関連論文リスト
- An Efficient Outlier Detection Algorithm for Data Streaming [51.56874851156008]
Local Outlier Factor (LOF)アルゴリズムのような従来の異常検出手法は、リアルタイムデータと競合する。
本稿では,オンライン異常検出におけるLOFアルゴリズムの効率向上のための新しい手法を提案し,EILOFアルゴリズムを提案する。
EILOFアルゴリズムは計算コストを大幅に削減するだけでなく、加算点数が増加すると検出精度を体系的に改善する。
論文 参考訳(メタデータ) (2025-01-02T05:12:43Z) - Accelerating spherical K-means clustering for large-scale sparse document data [0.7366405857677226]
本稿では,大規模かつ高次元のスパース文書データセットを対象とした球面K平均クラスタリングアルゴリズムを提案する。
提案手法は, 大規模文書において, 最先端技術を用いたアルゴリズムと比較して, 高速性能を効果的に達成できることを実験的に実証した。
論文 参考訳(メタデータ) (2024-11-18T05:50:58Z) - Efficient LoFTR: Semi-Dense Local Feature Matching with Sparse-Like
Speed [42.861344584752]
従来は検出不要であったLoFTRは、大きな視点の変化とテクスチャ・ポーアのシナリオを扱う際、顕著な整合性を示した。
設計上の選択を再検討し、効率と精度の両面で複数の改善を導出する。
提案手法は,競争力のあるセミセンス・マーカと比較して高い精度を実現することができる。
論文 参考訳(メタデータ) (2024-03-07T18:58:40Z) - SpirDet: Towards Efficient, Accurate and Lightweight Infrared Small
Target Detector [60.42293239557962]
我々は、赤外線小ターゲットの効率的な検出のための新しいアプローチであるSpirDetを提案する。
新しいデュアルブランチスパースデコーダを用いて特徴写像を復元する。
大規模な実験により、提案されたSpirDetは最先端モデルよりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2024-02-08T05:06:14Z) - MF-NeRF: Memory Efficient NeRF with Mixed-Feature Hash Table [62.164549651134465]
MF-NeRFは,Mixed-Featureハッシュテーブルを用いてメモリ効率を向上し,再構成品質を維持しながらトレーニング時間を短縮するメモリ効率の高いNeRFフレームワークである。
最新技術であるInstant-NGP、TensoRF、DVGOによる実験は、MF-NeRFが同じGPUハードウェア上で、同様のあるいはそれ以上のリコンストラクション品質で最速のトレーニング時間を達成できることを示唆している。
論文 参考訳(メタデータ) (2023-04-25T05:44:50Z) - Gradient Backpropagation based Feature Attribution to Enable
Explainable-AI on the Edge [1.7338677787507768]
そこで本研究では,勾配バックプロパゲーションに基づく特徴属性アルゴリズムのデータフローを解析し,推論に要するリソースのオーバーヘッドを推定する。
我々は,エッジデバイスを対象とした高レベル合成(HLS)に基づくFPGA設計を開発し,3つの特徴帰属アルゴリズムをサポートする。
提案手法は,最小限のオーバーヘッドで特徴属性をサポートするために推論アクセラレータを再利用し,エッジ上でのリアルタイムXAIを実現する経路を示す。
論文 参考訳(メタデータ) (2022-10-19T22:58:59Z) - Shapley-NAS: Discovering Operation Contribution for Neural Architecture
Search [96.20505710087392]
ニューラルアーキテクチャ探索のための演算寄与度(Shapley-NAS)を評価するためのShapley値に基づく手法を提案する。
提案手法は,光探索コストに比例して最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-06-20T14:41:49Z) - Attention-based Proposals Refinement for 3D Object Detection [0.0]
本稿では、注意機構を用いたROI特徴抽出に対して、よりデータ駆動的なアプローチをとる。
KITTIのテキスト検証実験により, クラスカーの84.84 APの競争性能を適度に向上することを示した。
論文 参考訳(メタデータ) (2022-01-18T15:50:31Z) - a novel attention-based network for fast salient object detection [14.246237737452105]
現在の有向物体検出ネットワークにおいて、最も一般的な方法はU字型構造を用いることである。
3つのコントリビューションを持つ新しい深層畳み込みネットワークアーキテクチャを提案する。
提案手法は, 精度を損なうことなく, 原サイズの1/3まで圧縮できることを示した。
論文 参考訳(メタデータ) (2021-12-20T12:30:20Z) - FastFlowNet: A Lightweight Network for Fast Optical Flow Estimation [81.76975488010213]
ディセンス光学フロー推定は、多くのロボットビジョンタスクで重要な役割を果たしています。
現在のネットワークはしばしば多くのパラメータを占有し、計算コストがかかる。
提案したFastFlowNetは、周知の粗大なやり方で、以下のイノベーションで機能する。
論文 参考訳(メタデータ) (2021-03-08T03:09:37Z) - Spatial-Spectral Residual Network for Hyperspectral Image
Super-Resolution [82.1739023587565]
ハイパースペクトル画像超解像のための新しいスペクトル空間残差ネットワーク(SSRNet)を提案する。
提案手法は,2次元畳み込みではなく3次元畳み込みを用いて空間スペクトル情報の探索を効果的に行うことができる。
各ユニットでは空間的・時間的分離可能な3次元畳み込みを用いて空間的・スペクトル的な情報を抽出する。
論文 参考訳(メタデータ) (2020-01-14T03:34:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。