論文の概要: GPU-accelerated image alignment for object detection in industrial
applications
- arxiv url: http://arxiv.org/abs/2112.05576v1
- Date: Fri, 10 Dec 2021 14:43:24 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-13 18:20:59.653196
- Title: GPU-accelerated image alignment for object detection in industrial
applications
- Title(参考訳): gpu加速画像アライメントによる産業用物体検出
- Authors: Trung-Son Le, Chyi-Yeu Lin
- Abstract要約: 本研究は, 産業応用におけるロバストな類似度尺度を用いた画像アライメント手法を用いて, 特徴物検出のための実用的手法を提案する。
提案したGPU(Graphics Processing Unit)高速化アルゴリズムは、CPUとGPUの両方の実装の比較実験で成功していると見なされている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This research proposes a practical method for detecting featureless objects
by using image alignment approach with a robust similarity measure in
industrial applications. This similarity measure is robust against occlusion,
illumination changes and background clutter. The performance of the proposed
GPU (Graphics Processing Unit) accelerated algorithm is deemed successful in
experiments of comparison between both CPU and GPU implementations
- Abstract(参考訳): 本研究では,産業用途におけるロバストな類似度尺度を用いた画像アライメント手法を用いて,無特徴物体の検出手法を提案する。
この類似度尺度は、閉塞、照明の変化、背景の乱れに対して堅牢である。
提案したGPU(グラフィックス処理ユニット)高速化アルゴリズムの性能は、CPUとGPUの実装の比較実験において成功していると考えられる。
関連論文リスト
- EDCSSM: Edge Detection with Convolutional State Space Model [3.649463841174485]
画像のエッジ検出は、コンピュータグラフィックスにおける多くの複雑なタスクの基礎となっている。
多層畳み込みとプールアーキテクチャによる特徴損失のため、学習ベースのエッジ検出モデルは、しばしば厚いエッジを生成する。
本稿では,上記の問題に効果的に対処するエッジ検出アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-09-03T05:13:25Z) - GS-SLAM: Dense Visual SLAM with 3D Gaussian Splatting [51.96353586773191]
我々は,まず3次元ガウス表現を利用したtextbfGS-SLAM を提案する。
提案手法は,地図の最適化とRGB-Dレンダリングの大幅な高速化を実現するリアルタイム微分可能なスプレイティングレンダリングパイプラインを利用する。
提案手法は,Replica,TUM-RGBDデータセット上の既存の最先端リアルタイム手法と比較して,競争性能が向上する。
論文 参考訳(メタデータ) (2023-11-20T12:08:23Z) - Learning to Detect Good Keypoints to Match Non-Rigid Objects in RGB
Images [7.428474910083337]
本稿では,非剛性画像対応タスクの正マッチ数を最大化するために,新しい学習キーポイント検出手法を提案する。
我々のトレーニングフレームワークは、アノテートされた画像対と予め定義された記述子抽出器をマッチングして得られる真の対応を利用して、畳み込みニューラルネットワーク(CNN)を訓練する。
実験の結果,本手法は平均整合精度で20時までに非剛体物体の実像に対して,最先端のキーポイント検出器よりも優れていた。
論文 参考訳(メタデータ) (2022-12-13T11:59:09Z) - RISP: Rendering-Invariant State Predictor with Differentiable Simulation
and Rendering for Cross-Domain Parameter Estimation [110.4255414234771]
既存のソリューションでは、大量のトレーニングデータが必要か、未知のレンダリング設定への一般化性が欠如している。
本稿では、ドメインのランダム化と微分可能なレンダリング勾配を併用してこの問題に対処する手法を提案する。
提案手法は, 再構成誤差を大幅に低減し, 未知のレンダリング構成間の一般化性が向上する。
論文 参考訳(メタデータ) (2022-05-11T17:59:51Z) - Mixed Reality Depth Contour Occlusion Using Binocular Similarity
Matching and Three-dimensional Contour Optimisation [3.9692358105634384]
混合現実のアプリケーションは、現実のオブジェクトによって部分的に隠された仮想オブジェクトを必要とすることが多い。
従来の研究や商業製品は、性能と効率の面で制限があった。
論文 参考訳(メタデータ) (2022-03-04T13:16:40Z) - Compressed Smooth Sparse Decomposition [3.8644240125444]
本稿では,画像中のスパース異常検出の理論的性能を保証する高速かつデータ効率の手法を提案する。
提案手法は,圧縮画像取得と分解に基づく画像処理技術を統合する一段階法として,圧縮平滑スパース分解法 (CSSD) と命名された。
従来のスムーズかつスパースな分解アルゴリズムと比較して、伝送コストの大幅な削減と計算速度の向上は無視できる性能損失で達成できる。
論文 参考訳(メタデータ) (2022-01-19T03:50:41Z) - Recall@k Surrogate Loss with Large Batches and Similarity Mixup [62.67458021725227]
微分不可能な場合、評価計量の勾配降下による直接最適化は不可能である。
本研究は,リコールにおける相異なるサロゲート損失を提案する。
提案手法は,複数の画像検索ベンチマークにおいて最先端の結果を得る。
論文 参考訳(メタデータ) (2021-08-25T11:09:11Z) - You Better Look Twice: a new perspective for designing accurate
detectors with reduced computations [56.34005280792013]
BLT-netは、新しい低計算の2段階オブジェクト検出アーキテクチャである。
非常にエレガントな第1ステージを使用して、オブジェクトをバックグラウンドから分離することで、計算を削減します。
結果のイメージ提案は、高度に正確なモデルによって第2段階で処理される。
論文 参考訳(メタデータ) (2021-07-21T12:39:51Z) - Robust and efficient post-processing for video object detection [9.669942356088377]
この研究は、従来の後処理メソッドの制限を克服する、新しい後処理パイプラインを導入している。
本手法は,特に高速移動物体に関する最先端の映像検出器の結果を改善する。
そして、YOLOのような効率的な静止画像検出器に適用することで、より計算集約的な検出器に匹敵する結果が得られる。
論文 参考訳(メタデータ) (2020-09-23T10:47:24Z) - Kernel methods through the roof: handling billions of points efficiently [94.31450736250918]
カーネル法は、非パラメトリック学習に対するエレガントで原則化されたアプローチを提供するが、今のところ大規模な問題ではほとんど利用できない。
最近の進歩は、最適化、数値線形代数、ランダム射影など、多くのアルゴリズム的アイデアの利点を示している。
ここでは、これらの取り組みをさらに進めて、GPUハードウェアを最大限に活用する解決器を開発し、テストする。
論文 参考訳(メタデータ) (2020-06-18T08:16:25Z) - Image Matching across Wide Baselines: From Paper to Practice [80.9424750998559]
局所的な特徴とロバストな推定アルゴリズムの包括的なベンチマークを導入する。
パイプラインのモジュール構造は、さまざまなメソッドの容易な統合、構成、組み合わせを可能にします。
適切な設定で、古典的な解決策は依然として芸術の知覚された状態を上回る可能性があることを示す。
論文 参考訳(メタデータ) (2020-03-03T15:20:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。