論文の概要: STMDNet: A Lightweight Directional Framework for Motion Pattern Recognition of Tiny Targets
- arxiv url: http://arxiv.org/abs/2501.13054v1
- Date: Wed, 22 Jan 2025 18:06:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-23 13:29:34.498548
- Title: STMDNet: A Lightweight Directional Framework for Motion Pattern Recognition of Tiny Targets
- Title(参考訳): STMDNet:Tinyターゲットの動作パターン認識のための軽量指向フレームワーク
- Authors: Mingshuo Xu, Hao Luan, Zhou Daniel Hao, Jigen Peng, Shigang Yue,
- Abstract要約: 可変速度での微小な目標の運動を認識するためのモデルベース計算フレームワークSTMDNetを提案する。
本研究では,空間的位置当たりの1つの相関関係から動き方向を決定する,最初の協調的指向性符号化デコーディング戦略を開発する。
様々な速度で、STMDNet-FはmF1を19%、16%、8%を240Hz、120Hz、60Hzで改善し、STMDNetは1つのCPUスレッドで87FPSを達成した。
- 参考スコア(独自算出の注目度): 6.331639152400688
- License:
- Abstract: Recognizing motions of tiny targets - only few dozen pixels - in cluttered backgrounds remains a fundamental challenge when standard feature-based or deep learning methods fail under scarce visual cues. We propose STMDNet, a model-based computational framework to Recognize motions of tiny targets at variable velocities under low-sampling frequency scenarios. STMDNet designs a novel dual-dynamics-and-correlation mechanism, harnessing ipsilateral excitation to integrate target cues and leakage-enhancing-type contralateral inhibition to suppress large-object and background motion interference. Moreover, we develop the first collaborative directional encoding-decoding strategy that determines the motion direction from only one correlation per spatial location, cutting computational costs to one-eighth of prior methods. Further, simply substituting the backbone of a strong STMD model with STMDNet raises AUC by 24%, yielding an enhanced STMDNet-F. Evaluations on real-world low sampling frequency datasets show state-of-the-art results, surpassing the deep learning baseline. Across diverse speeds, STMDNet-F improves mF1 by 19%, 16%, and 8% at 240Hz, 120Hz, and 60Hz, respectively, while STMDNet achieves 87 FPS on a single CPU thread. These advances highlight STMDNet as a next-generation backbone for tiny target motion pattern recognition and underscore its broader potential to revitalize model-based visual approaches in motion detection.
- Abstract(参考訳): 乱雑な背景の中で小さなターゲット(わずか数十ピクセル)の動作を認識することは、標準的な機能ベースあるいはディープラーニングメソッドが視覚的手がかりが不足している場合に、根本的な課題である。
我々は,低サンプリング周波数シナリオ下での可変速度での小さな目標の運動を認識するためのモデルベース計算フレームワークSTMDNetを提案する。
STMDNetは新たなデュアルダイナミック・アンド・コリレーション機構を設計し、Ipsilateral excitationを利用してターゲットキューとリークエンハンシング型対側抑制を統合し、大きな物体と背景運動の干渉を抑制する。
さらに,空間的位置当たりの1つの相関関係から,計算コストを削減し,先行手法の8分の1まで,動き方向を決定するための最初の協調的指向性符号化復号法を開発した。
さらに、STMDNetで強力なSTMDモデルのバックボーンを置換するだけで、AUCが24%上昇し、STMDNet-Fが強化される。
実世界の低サンプリング頻度データセットの評価は、ディープラーニングベースラインを超え、最先端の結果を示している。
様々な速度で、STMDNet-FはmF1を19%、16%、8%を240Hz、120Hz、60Hzで改善し、STMDNetは1つのCPUスレッドで87FPSを達成した。
これらの進歩は、STMDNetを小さな目標運動パターン認識のための次世代のバックボーンとして強調し、モデルに基づく動き検出の視覚的アプローチを活性化する幅広い可能性を強調している。
関連論文リスト
- DM3D: Distortion-Minimized Weight Pruning for Lossless 3D Object Detection [42.07920565812081]
本稿では,3次元物体検出のための新しいトレーニング後の重み付け手法を提案する。
事前訓練されたモデルにおける冗長パラメータを決定し、局所性と信頼性の両方において最小限の歪みをもたらす。
本フレームワークは,ネットワーク出力の歪みを最小限に抑え,検出精度を最大に維持することを目的とする。
論文 参考訳(メタデータ) (2024-07-02T09:33:32Z) - DA-Flow: Dual Attention Normalizing Flow for Skeleton-based Video Anomaly Detection [52.74152717667157]
本稿では,DAM(Dual Attention Module)と呼ばれる軽量モジュールを提案する。
フレームアテンション機構を使用して、最も重要なフレームを識別し、スケルトンアテンション機構を使用して、最小パラメータとフロップで固定されたパーティション間の広範な関係をキャプチャする。
論文 参考訳(メタデータ) (2024-06-05T06:18:03Z) - Enhancing Lightweight Neural Networks for Small Object Detection in IoT
Applications [1.6932009464531739]
そこで本研究では,既存の物体検出装置上で使用可能な適応型タイリング手法を提案する。
実験の結果,提案手法はF1スコアを最大225%向上し,平均オブジェクト数誤差を最大76%削減できることがわかった。
論文 参考訳(メタデータ) (2023-11-13T08:58:34Z) - Consistency Trajectory Models: Learning Probability Flow ODE Trajectory of Diffusion [56.38386580040991]
Consistency Trajectory Model (CTM) は Consistency Models (CM) の一般化である
CTMは、対戦訓練とスコアマッチング損失を効果的に組み合わせることで、パフォーマンスを向上させる。
CMとは異なり、CTMのスコア関数へのアクセスは、確立された制御可能/条件生成メソッドの採用を合理化することができる。
論文 参考訳(メタデータ) (2023-10-01T05:07:17Z) - Joint Spatial-Temporal and Appearance Modeling with Transformer for
Multiple Object Tracking [59.79252390626194]
本稿ではTransSTAMという新しい手法を提案する。Transformerを利用して各オブジェクトの外観特徴とオブジェクト間の空間的時間的関係の両方をモデル化する。
提案手法はMOT16, MOT17, MOT20を含む複数の公開ベンチマークで評価され, IDF1とHOTAの両方で明確な性能向上を実現している。
論文 参考訳(メタデータ) (2022-05-31T01:19:18Z) - Revisit Geophysical Imaging in A New View of Physics-informed Generative
Adversarial Learning [2.12121796606941]
完全な波形反転は高分解能地下モデルを生成する。
最小二乗関数を持つFWIは、局所ミニマ問題のような多くの欠点に悩まされる。
偏微分方程式とニューラルネットワークを用いた最近の研究は、2次元FWIに対して有望な性能を示している。
本稿では,波動方程式を識別ネットワークに統合し,物理的に一貫したモデルを正確に推定する,教師なし学習パラダイムを提案する。
論文 参考訳(メタデータ) (2021-09-23T15:54:40Z) - MotionHint: Self-Supervised Monocular Visual Odometry with Motion
Constraints [70.76761166614511]
モノクローナルビジュアル・オドメトリー(VO)のための新しい自己教師型アルゴリズムMotionHintを提案する。
我々のMotionHintアルゴリズムは、既存のオープンソースSSM-VOシステムに容易に適用できる。
論文 参考訳(メタデータ) (2021-09-14T15:35:08Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z) - A Generative Learning Approach for Spatio-temporal Modeling in Connected
Vehicular Network [55.852401381113786]
本稿では,コネクテッドカーの無線アクセス遅延を実現するための総合的時間品質フレームワークであるLaMI(Latency Model Inpainting)を提案する。
LaMIはイメージインペイントと合成のアイデアを採用し、2段階の手順で欠落したレイテンシサンプルを再構築することができる。
特に、パッチ方式のアプローチを用いて各地域で収集されたサンプル間の空間的相関を初めて発見し、その後、原点および高度に相関したサンプルをバラエナオートコーダ(VAE)に供給する。
論文 参考訳(メタデータ) (2020-03-16T03:43:59Z) - A Time-Delay Feedback Neural Network for Discriminating Small,
Fast-Moving Targets in Complex Dynamic Environments [8.645725394832969]
複雑な視覚環境の中で小さな移動物体を識別することは、自律型マイクロロボットにとって重要な課題である。
フィードバック接続を備えたSTMDベースのニューラルネットワーク(Feedback STMD)を提案する。
論文 参考訳(メタデータ) (2019-12-29T03:10:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。