論文の概要: Multiple feature fusion-based video face tracking for IoT big data
- arxiv url: http://arxiv.org/abs/2104.08096v1
- Date: Thu, 15 Apr 2021 07:10:13 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-20 11:08:56.672981
- Title: Multiple feature fusion-based video face tracking for IoT big data
- Title(参考訳): IoTビッグデータのための複数機能融合型ビデオ顔追跡
- Authors: Tianping Li, Zhifeng Liu, Jianping Qiao
- Abstract要約: 積分ヒストグラムに基づく多機能融合アルゴリズムとリアルタイム更新追跡粒子フィルタリングモジュールを提案する。
その結果,このアルゴリズムは映像追跡精度を向上し,粒子操作の複雑さを単純化し,速度を向上し,反干渉能力とロバスト性が向上した。
- 参考スコア(独自算出の注目度): 1.8907108368038217
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With the advancement of IoT and artificial intelligence technologies, and the
need for rapid application growth in fields such as security entrance control
and financial business trade, facial information processing has become an
important means for achieving identity authentication and information security.
In this paper, we propose a multi-feature fusion algorithm based on integral
histograms and a real-time update tracking particle filtering module. First,
edge and colour features are extracted, weighting methods are used to weight
the colour histogram and edge features to describe facial features, and fusion
of colour and edge features is made adaptive by using fusion coefficients to
improve face tracking reliability. Then, the integral histogram is integrated
into the particle filtering algorithm to simplify the calculation steps of
complex particles. Finally, the tracking window size is adjusted in real time
according to the change in the average distance from the particle centre to the
edge of the current model and the initial model to reduce the drift problem and
achieve stable tracking with significant changes in the target dimension. The
results show that the algorithm improves video tracking accuracy, simplifies
particle operation complexity, improves the speed, and has good
anti-interference ability and robustness.
- Abstract(参考訳): iotと人工知能技術の進歩と、セキュリティの参入管理や金融取引といった分野での急速なアプリケーション成長の必要性により、顔情報処理はアイデンティティ認証と情報セキュリティを実現する上で重要な手段となっている。
本稿では,積分ヒストグラムに基づく多機能融合アルゴリズムと,リアルタイム更新追跡粒子フィルタリングモジュールを提案する。
まず、エッジとカラーの特徴を抽出し、顔の特徴を記述するために色ヒストグラムとエッジの特徴を重み付けに重み付け手法を使用し、顔追跡の信頼性を向上させるために融合係数を用いて色とエッジの特徴の融合を適応させる。
そして、積分ヒストグラムを粒子フィルタリングアルゴリズムに統合し、複雑な粒子の計算手順を簡素化する。
最後に、粒子中心から電流モデルの端までの平均距離の変化と、ドリフト問題を低減するための初期モデルとに基づいて、トラッキングウィンドウサイズをリアルタイムに調整し、目標寸法を大きく変化させて安定したトラッキングを実現する。
その結果,このアルゴリズムは映像追跡精度を向上し,粒子操作の複雑さを単純化し,速度を向上し,反干渉能力とロバスト性が向上した。
関連論文リスト
- Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。
既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。
ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T19:02:54Z) - EEPNet: Efficient Edge Pixel-based Matching Network for Cross-Modal Dynamic Registration between LiDAR and Camera [6.817117737186402]
自動運転車が複雑な環境の中で軌道を正確に知覚し、分析し、計画するためには、マルチセンサー融合が不可欠である。
画像にLiDAR点雲を登録する現在の手法は、固有の違いと計算オーバーヘッドのために大きな課題に直面している。
我々は、ポイントクラウド投影から得られたモダリティマップを利用して、登録精度を向上させる高度ネットワークであるEEPNetを提案する。
論文 参考訳(メタデータ) (2024-09-28T10:28:28Z) - Coordinate-Aware Thermal Infrared Tracking Via Natural Language Modeling [16.873697155916997]
NLMTrackは、座標対応の熱赤外追跡モデルである。
NLMTrackは、特徴抽出と特徴融合を統一するエンコーダを適用している。
実験により、NLMTrackは複数のベンチマークで最先端のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2024-07-11T08:06:31Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - Spatiotemporal Attention-based Semantic Compression for Real-time Video
Recognition [117.98023585449808]
本稿では,各フレームにおけるフレームと画素の重要性を評価するために,時間的注意に基づくオートエンコーダ(STAE)アーキテクチャを提案する。
我々は3D-2D CNNを組み合わせた軽量デコーダを開発し、欠落した情報を再構成する。
実験の結果,VT_STAEはビデオデータセットH51を,5%の精度で104倍圧縮できることがわかった。
論文 参考訳(メタデータ) (2023-05-22T07:47:27Z) - Efficient Context Integration through Factorized Pyramidal Learning for
Ultra-Lightweight Semantic Segmentation [1.0499611180329804]
本稿では,FPL(Facterized Pyramidal Learning)モジュールを提案する。
空間ピラミッドを2つのステージに分解し,モジュール内での簡易かつ効率的な特徴融合により,悪名高いチェッカーボード効果を解決する。
FPLモジュールとFIRユニットをベースとしたFPLNetと呼ばれる超軽量リアルタイムネットワークを提案する。
論文 参考訳(メタデータ) (2023-02-23T05:34:51Z) - Towards Real-Time Visual Tracking with Graded Color-names Features [10.475679500780574]
MeanShiftアルゴリズムは、その単純さと効率性から、タスクのトラッキングに広く利用されている。
従来のMeanShiftアルゴリズムでは、ターゲットの初期領域をラベル付けする必要があるため、アルゴリズムの適用性が低下する。
我々は,背景モデルと色名の階調特徴を組み合わせた追跡手法をMeanShiftフレームワークで開発する。
論文 参考訳(メタデータ) (2022-06-17T11:38:37Z) - Multitask AET with Orthogonal Tangent Regularity for Dark Object
Detection [84.52197307286681]
暗黒環境下でのオブジェクト検出を強化するために,新しいマルチタスク自動符号化変換(MAET)モデルを提案する。
自己超越的な方法で、MAETは、現実的な照明劣化変換を符号化して復号することで、本質的な視覚構造を学習する。
我々は,合成および実世界のデータセットを用いて最先端のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2022-05-06T16:27:14Z) - An efficient real-time target tracking algorithm using adaptive feature
fusion [5.629708188348423]
低次元適応型特徴融合に基づく効率的なリアルタイム目標追跡手法を提案する。
提案アルゴリズムは、それぞれ0.023と0.019の改善により、より高い成功率と精度を得ることができる。
提案手法は,複雑な環境下でのリアルタイムな目標追従タスクを実現するための,より有望な方法である。
論文 参考訳(メタデータ) (2022-04-05T08:40:52Z) - AOT: Appearance Optimal Transport Based Identity Swapping for Forgery
Detection [76.7063732501752]
顔偽造検出のための外観の相違が大きい新しい識別スワップアルゴリズムを提案する。
外観のギャップは主に、照明と肌の色における大きな相違から生じる。
実画像パッチと偽画像パッチの混在とを識別するために識別器を導入する。
論文 参考訳(メタデータ) (2020-11-05T06:17:04Z) - An Image Enhancing Pattern-based Sparsity for Real-time Inference on
Mobile Devices [58.62801151916888]
パターンと接続性を組み合わせた新しい空間空間,すなわちパターンベースの空間空間を導入し,高度に正確かつハードウェアに親しみやすいものにした。
新たなパターンベースの空間性に対する我々のアプローチは,モバイルプラットフォーム上での高効率DNN実行のためのコンパイラ最適化に自然に適合する。
論文 参考訳(メタデータ) (2020-01-20T16:17:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。