論文の概要: Transferability of labels between multilens cameras
- arxiv url: http://arxiv.org/abs/2501.11513v1
- Date: Mon, 20 Jan 2025 14:43:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-22 14:22:31.241772
- Title: Transferability of labels between multilens cameras
- Title(参考訳): マルチレンズカメラ間のラベルの転送性
- Authors: Ignacio de Loyola Páez-Ubieta, Daniel Frau-Alfaro, Santiago T. Puente,
- Abstract要約: マルチレンズカメラ上で複数のチャンネルにまたがるバウンディングボックス(BB)とマスクラベルを自動的に拡張する新しい手法を提案する。
提案手法は、よく知られた位相相関法と精錬法を組み合わせたものである。
その結果、この方法では、ほとんどの場合、90%以上の精度で、異なるレンズ間でラベルを転送できることが判明した。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: In this work, a new method for automatically extending Bounding Box (BB) and mask labels across different channels on multilens cameras is presented. For that purpose, the proposed method combines the well known phase correlation method with a refinement process. During the first step, images are aligned by localizing the peak of intensity obtained in the spatial domain after performing the cross correlation process in the frequency domain. The second step consists of obtaining the best possible transformation by using an iterative process maximising the IoU (Intersection over Union) metric. Results show that, by using this method, labels could be transferred across different lens on a camera with an accuracy over 90% in most cases and just by using 65 ms in the whole process. Once the transformations are obtained, artificial RGB images are generated, for labeling them so as to transfer this information into each of the other lens. This work will allow users to use this type of cameras in more fields rather than satellite or medical imagery, giving the chance of labeling even invisible objects in the visible spectrum.
- Abstract(参考訳): 本研究では,マルチレンズカメラ上で複数のチャンネルにまたがるバウンディングボックス(BB)とマスクラベルを自動的に拡張する手法を提案する。
その目的のために,提案手法はよく知られた位相相関法と精錬法を組み合わせたものである。
第1ステップでは、周波数領域における相互相関プロセスを実行した後、空間領域で得られる強度のピークを局所化することにより、画像が整列される。
第2のステップは、IoU(Intersection over Union)メトリックを最大化する反復プロセスを使用することで、可能な限りの変換を得ることである。
その結果、この方法では、ほとんどの場合90%以上の精度でカメラ上の異なるレンズ間でラベルを転送することができ、そのプロセス全体で65msを使用するだけでよいことがわかった。
変換が得られた後、その情報を他のレンズに転送するためにラベル付けする人工RGB画像を生成する。
この研究により、ユーザーはこのタイプのカメラを、衛星画像や医療画像ではなく、より多くのフィールドで使用できるようになる。
関連論文リスト
- GlobalMamba: Global Image Serialization for Vision Mamba [73.50475621164037]
視覚マンバは、視覚トークンの数に対して線形複雑度で強い性能を示した。
既存のほとんどの方法はパッチベースの画像トークン化を採用し、因果処理のためにそれらを1Dシーケンスにフラット化する。
本稿では,グローバルな画像シリアライズ手法を提案し,その画像を因果トークンのシーケンスに変換する。
論文 参考訳(メタデータ) (2024-10-14T09:19:05Z) - A Multispectral Automated Transfer Technique (MATT) for machine-driven
image labeling utilizing the Segment Anything Model (SAM) [0.0]
本稿では,Multispectral Automated Transfer Technique (MATT) と呼ぶ手法について概説する。
RGB画像からSAMセグメンテーションマスクを変換することで、高精度で効率よくマルチスペクトル画像のセグメンテーションとラベルを自動で行うことができる。
本研究は,多スペクトル物体検出モデルを高速に分割,ラベル付け,訓練するための新しいオープンソース手法を提供することにより,多スペクトル物体検出の研究に大きく貢献する。
論文 参考訳(メタデータ) (2024-02-18T01:01:13Z) - Multi-Granularity Denoising and Bidirectional Alignment for Weakly
Supervised Semantic Segmentation [75.32213865436442]
本稿では,雑音ラベルと多クラス一般化問題を緩和するために,MDBAモデルを提案する。
MDBAモデルはPASCAL VOC 2012データセットの検証とテストセットにおいて69.5%と70.2%のmIoUに達することができる。
論文 参考訳(メタデータ) (2023-05-09T03:33:43Z) - Cross-Camera Deep Colorization [10.254243409261898]
本稿では,カラープラスモノデュアルカメラシステムからの画像の整列と融合を行う,エンドツーエンドの畳み込みニューラルネットワークを提案する。
提案手法は,約10dBPSNRゲインの大幅な改善を継続的に達成する。
論文 参考訳(メタデータ) (2022-08-26T11:02:14Z) - Heterogeneous Semantic Transfer for Multi-label Recognition with Partial Labels [70.45813147115126]
部分ラベル付きマルチラベル画像認識(MLR-PL)は、アノテーションのコストを大幅に削減し、大規模なMLRを促進する。
それぞれの画像と異なる画像の間に強い意味的相関が存在することがわかった。
これらの相関関係は、未知のラベルを取得するために、既知のラベルが持つ知識を転送するのに役立ちます。
論文 参考訳(メタデータ) (2022-05-23T08:37:38Z) - Deep Learning for Multi-View Ultrasonic Image Fusion [2.1410799064827226]
Delay-And-Sum (DAS)アルゴリズムは、反射信号がトランスデューサに戻るメインパスを用いて画像を生成する。
従来の画像融合技術は、通常、事前定義された画像変換、プーリング操作、しきい値のアドホックな組み合わせを使用する。
我々は、異なる共振路に対するDAS画像形成をネットワーク層として明示的に取り入れつつ、利用可能なすべてのデータをセグメントマップに直接マッピングするディープニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-09-08T13:04:07Z) - XCiT: Cross-Covariance Image Transformers [73.33400159139708]
本稿では,トークンではなく機能チャネルをまたいで機能する自己注意の「伝達」バージョンを提案する。
その結果、XCAはトークン数に線形複雑さを持ち、高解像度画像の効率的な処理を可能にする。
論文 参考訳(メタデータ) (2021-06-17T17:33:35Z) - TFill: Image Completion via a Transformer-Based Architecture [69.62228639870114]
画像補完を無方向性シーケンス対シーケンス予測タスクとして扱うことを提案する。
トークン表現には,小かつ重複しないRFを持つ制限型CNNを用いる。
第2フェーズでは、可視領域と発生領域の外観整合性を向上させるために、新しい注意認識層(aal)を導入する。
論文 参考訳(メタデータ) (2021-04-02T01:42:01Z) - Dual Attention GANs for Semantic Image Synthesis [101.36015877815537]
本稿では,写真リアリスティック・セマンティック・一貫性のあるイメージを合成するための新しいデュアルアテンションGAN(DAGAN)を提案する。
また,2つの新しいモジュール,すなわち位置対応空間アテンションモジュール(SAM)と規模対応チャネルアテンションモジュール(CAM)を提案する。
DAGANは、より少ないモデルパラメータを使用しながら、最先端のメソッドよりも驚くほど優れた結果が得られる。
論文 参考訳(メタデータ) (2020-08-29T17:49:01Z) - Polarimetric SAR Image Semantic Segmentation with 3D Discrete Wavelet
Transform and Markov Random Field [32.59900433812833]
本稿では,文脈的PolSAR画像セマンティックセグメンテーション手法を提案する。
3D-DWT手法は,新たに定義したチャネル的に一貫した特徴を入力として,スペックルノイズに頑健な識別的マルチスケール特徴を抽出する。
3D-DWT機能とMRFプリエントを同時に活用することにより、セグメンテーション中にコンテキスト情報が完全に統合され、正確かつスムーズなセグメンテーションが保証される。
論文 参考訳(メタデータ) (2020-08-05T08:28:18Z) - Automatic Image Labelling at Pixel Level [21.59653873040243]
画素レベルの画像ラベリングを自動的に生成する興味深い学習手法を提案する。
The Guided Filter Network (GFN) was first developed to learn the segmentation knowledge from a source domain。
GFNはそのようなセグメンテーションの知識を変換し、ターゲットドメインで粗いオブジェクトマスクを生成する。
論文 参考訳(メタデータ) (2020-07-15T00:34:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。