論文の概要: High-resolution power equipment recognition based on improved
self-attention
- arxiv url: http://arxiv.org/abs/2311.03518v2
- Date: Thu, 7 Dec 2023 00:45:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-08 18:15:00.723180
- Title: High-resolution power equipment recognition based on improved
self-attention
- Title(参考訳): 自己注意改善に基づく高分解能電力機器認識
- Authors: Siyi Zhang, Cheng Liu, Xiang Li, Xin Zhai, Zhen Wei, Sizhe Li, Xun Ma
- Abstract要約: 本稿では,この問題に適した自己注意型ネットワークの改良について紹介する。
提案モデルは,基礎的ネットワーク,領域提案ネットワーク,対象領域の抽出とセグメント化のためのモジュール,最終的な予測ネットワークの4つの重要なコンポーネントから構成される。
ディープ・セルフアテンション・ネットワークの予測メカニズムは、画像の意味的コンテキストをユニークに取り入れ、認識性能を大幅に改善する。
- 参考スコア(独自算出の注目度): 11.24310344443672
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The current trend of automating inspections at substations has sparked a
surge in interest in the field of transformer image recognition. However, due
to restrictions in the number of parameters in existing models, high-resolution
images can't be directly applied, leaving significant room for enhancing
recognition accuracy. Addressing this challenge, the paper introduces a novel
improvement on deep self-attention networks tailored for this issue. The
proposed model comprises four key components: a foundational network, a region
proposal network, a module for extracting and segmenting target areas, and a
final prediction network. The innovative approach of this paper differentiates
itself by decoupling the processes of part localization and recognition,
initially using low-resolution images for localization followed by
high-resolution images for recognition. Moreover, the deep self-attention
network's prediction mechanism uniquely incorporates the semantic context of
images, resulting in substantially improved recognition performance.
Comparative experiments validate that this method outperforms the two other
prevalent target recognition models, offering a groundbreaking perspective for
automating electrical equipment inspections.
- Abstract(参考訳): 変圧器画像認識の分野では,変圧器検査の自動化が注目されている。
しかし,既存のモデルではパラメータ数が制限されているため,高解像度画像を直接適用することはできない。
この課題に対処するため,本論文では,この問題に適した深層自己注意ネットワークの改良について紹介する。
提案モデルは,基本ネットワーク,地域提案ネットワーク,対象領域の抽出とセグメント化のためのモジュール,最終予測ネットワークの4つの主要コンポーネントからなる。
本論文の革新的アプローチは, 部分ローカライゼーションと認識のプロセスを切り離して, ローカライゼーションのための低分解能画像と認識のための高分解能画像とを区別するものである。
さらに、深層自己注意ネットワークの予測機構は、画像の意味的文脈を独自に取り入れ、認識性能を大幅に改善する。
比較実験により、この手法は他の2つの一般的な目標認識モデルよりも優れており、電気機器の点検を自動化するための画期的な視点を提供する。
関連論文リスト
- Overhead Line Defect Recognition Based on Unsupervised Semantic
Segmentation [8.672676348736834]
オーバーヘッドラインインスペクションは、可視光画像を用いた欠陥認識の恩恵が大きい。
本稿では,Faster RCNNネットワーク上に構築された新しい欠陥認識フレームワークを提案する。
論文 参考訳(メタデータ) (2023-11-02T03:52:59Z) - Affine-Consistent Transformer for Multi-Class Cell Nuclei Detection [76.11864242047074]
本稿では, 原子核位置を直接生成する新しいアフィン一貫性変換器 (AC-Former) を提案する。
本稿では,AAT (Adaptive Affine Transformer) モジュールを導入し,ローカルネットワークトレーニングのためのオリジナル画像をワープするための重要な空間変換を自動学習する。
実験結果から,提案手法は様々なベンチマークにおいて既存の最先端アルゴリズムを著しく上回ることがわかった。
論文 参考訳(メタデータ) (2023-10-22T02:27:02Z) - Pixel-Inconsistency Modeling for Image Manipulation Localization [63.54342601757723]
デジタル画像法医学は、画像認証と操作のローカライゼーションにおいて重要な役割を果たす。
本稿では,画素不整合アーチファクトの解析を通じて,一般化されたロバストな操作ローカライゼーションモデルを提案する。
実験により,本手法は固有の画素不整合偽指紋を抽出することに成功した。
論文 参考訳(メタデータ) (2023-09-30T02:54:51Z) - An Enhanced Low-Resolution Image Recognition Method for Traffic
Environments [3.018656336329545]
低解像度の画像は、小さなサイズ、低い品質、詳細さの欠如に悩まされ、従来のニューラルネットワーク認識アルゴリズムの精度が低下する。
本稿では、残差ネットワークの基本構造と共通特徴部分空間アルゴリズムを利用する二重分岐残差ネットワーク構造を提案する。
低解像度画像認識の精度を高めるために、中間層特徴の利用を取り入れている。
論文 参考訳(メタデータ) (2023-09-28T12:38:31Z) - Cross-resolution Face Recognition via Identity-Preserving Network and
Knowledge Distillation [12.090322373964124]
クロスレゾリューション顔認識は、現代の深層顔認識システムにとって難しい問題である。
本稿では,低分解能画像の低周波成分に蓄積される識別情報にネットワークを集中させる新しい手法を提案する。
論文 参考訳(メタデータ) (2023-03-15T14:52:46Z) - ASSET: Autoregressive Semantic Scene Editing with Transformers at High
Resolutions [28.956280590967808]
私たちのアーキテクチャは、新しい注意機構を備えたトランスフォーマーに基づいています。
我々のキーとなる考え方は、高解像度の画像解像度で抽出された濃密な注意によって導かれる、トランスフォーマーの注意行列を高解像度でスパース化することである。
本手法の有効性を示した質的,定量的な結果とユーザスタディについて述べる。
論文 参考訳(メタデータ) (2022-05-24T17:39:53Z) - Transferable Class-Modelling for Decentralized Source Attribution of
GAN-Generated Images [4.1483423188102755]
我々は、一連の関連するバイナリ分類タスクとして、ディープフェイク検出とソース属性の問題を再定義する。
我々は、転送学習を活用して、複数の独立属性問題に対する偽検出ネットワークを迅速に適用する。
私たちのモデルは、現在のベンチマークと競合するように実験によって決定されます。
論文 参考訳(メタデータ) (2022-03-18T07:43:03Z) - Detect and Locate: A Face Anti-Manipulation Approach with Semantic and
Noise-level Supervision [67.73180660609844]
本稿では,画像中の偽造顔を効率的に検出する,概念的にシンプルだが効果的な方法を提案する。
提案手法は,画像に関する意味の高い意味情報を提供するセグメンテーションマップに依存する。
提案モデルでは,最先端検出精度と顕著なローカライゼーション性能を実現する。
論文 参考訳(メタデータ) (2021-07-13T02:59:31Z) - Bayesian Attention Belief Networks [59.183311769616466]
注意に基づくニューラルネットワークは、幅広いタスクにおいて最先端の結果を得た。
本稿では,非正規化注意重みをモデル化してデコーダネットワークを構築するベイズ的注意信念ネットワークについて紹介する。
提案手法は, 精度, 不確実性推定, ドメイン間の一般化, 敵攻撃において, 決定論的注意と最先端の注意よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-06-09T17:46:22Z) - Revisiting The Evaluation of Class Activation Mapping for
Explainability: A Novel Metric and Experimental Analysis [54.94682858474711]
クラスアクティベーションマッピング(cam)アプローチは、アクティベーションマップの平均を重み付けすることで、効果的な可視化を提供する。
説明マップを定量化するための新しいメトリクスセットを提案し、より効果的な方法を示し、アプローチ間の比較を簡素化します。
論文 参考訳(メタデータ) (2021-04-20T21:34:24Z) - Unpaired Image Enhancement with Quality-Attention Generative Adversarial
Network [92.01145655155374]
品質の注意を払わないデータに基づいて訓練された生成敵対ネットワーク(QAGAN)を提案する。
提案されたQAGANの重要な新規性は、ジェネレータの注入されたQAMにある。
提案手法は客観的評価と主観評価の両方において良好な性能を実現する。
論文 参考訳(メタデータ) (2020-12-30T05:57:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。