Fugu-MT 論文翻訳(概要): High-resolution power equipment recognition based on improved self-attention

論文の概要: High-resolution power equipment recognition based on improved self-attention

arxiv url: http://arxiv.org/abs/2311.03518v1
Date: Mon, 6 Nov 2023 20:51:37 GMT
ステータス: 翻訳完了
システム内更新日: 2023-11-08 17:52:42.147334
Title: High-resolution power equipment recognition based on improved self-attention
Title（参考訳）: 自己注意改善に基づく高分解能電力機器認識
Authors: Siyi Zhang, Cheng Liu, Xiang Li, Xin Zhai, Zhen Wei, Sizhe Li, Xun Ma
Abstract要約: 本稿では,この問題に適した自己注意型ネットワークの改良について紹介する。提案モデルは,基礎的ネットワーク,領域提案ネットワーク,対象領域の抽出とセグメント化のためのモジュール,最終的な予測ネットワークの4つの重要なコンポーネントから構成される。ディープ・セルフアテンション・ネットワークの予測メカニズムは、画像の意味的コンテキストをユニークに取り入れ、認識性能を大幅に改善する。
参考スコア（独自算出の注目度）: 11.24310344443672
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The current trend of automating inspections at substations has sparked a surge in interest in the field of transformer image recognition. However, due to restrictions in the number of parameters in existing models, high-resolution images can't be directly applied, leaving significant room for enhancing recognition accuracy. Addressing this challenge, the paper introduces a novel improvement on deep self-attention networks tailored for this issue. The proposed model comprises four key components: a foundational network, a region proposal network, a module for extracting and segmenting target areas, and a final prediction network. The innovative approach of this paper differentiates itself by decoupling the processes of part localization and recognition, initially using low-resolution images for localization followed by high-resolution images for recognition. Moreover, the deep self-attention network's prediction mechanism uniquely incorporates the semantic context of images, resulting in substantially improved recognition performance. Comparative experiments validate that this method outperforms the two other prevalent target recognition models, offering a groundbreaking perspective for automating electrical equipment inspections.
Abstract（参考訳）: 変圧器画像認識の分野では,変圧器検査の自動化が注目されている。しかし,既存のモデルではパラメータ数が制限されているため,高解像度画像を直接適用することはできない。この課題に対処するため,本論文では,この問題に適した深層自己注意ネットワークの改良について紹介する。提案モデルは,基本ネットワーク,地域提案ネットワーク,対象領域の抽出とセグメント化のためのモジュール,最終予測ネットワークの4つの主要コンポーネントからなる。本論文の革新的アプローチは, 部分ローカライゼーションと認識のプロセスを切り離して, ローカライゼーションのための低分解能画像と認識のための高分解能画像とを区別するものである。さらに、深層自己注意ネットワークの予測機構は、画像の意味的文脈を独自に取り入れ、認識性能を大幅に改善する。比較実験により、この手法は他の2つの一般的な目標認識モデルよりも優れており、電気機器の点検を自動化するための画期的な視点を提供する。

関連論文リスト

From Fake Focus to Real Precision: Confusion-Driven Adversarial Attention Learning in Transformers [0.0]
トランスフォーマーに基づくモデルが感情分析タスクに広く採用されている。既存のモデルでは、主に一般的な単語に注意を向ける傾向があり、あまり人気がないがタスク関連性の高い用語を見越す傾向にある。そこで本研究では,注意重みを適切な焦点に自動的に再分配する,AFA(Adversarial Feedback for Attention)トレーニング機構を提案する。
論文参考訳（メタデータ） (2025-12-19T01:48:25Z)
Knowledge-Informed Neural Network for Complex-Valued SAR Image Recognition [51.03674130115878]
本稿では,新しい「圧縮集約圧縮」アーキテクチャ上に構築された軽量なフレームワークであるKnowledge-Informed Neural Network(KINN)を紹介する。 KINNはパラメータ効率の認識における最先端を確立し、データスカースとアウト・オブ・ディストリビューションのシナリオにおいて例外的な一般化を提供する。
論文参考訳（メタデータ） (2025-10-23T07:12:26Z)
A Meaningful Perturbation Metric for Evaluating Explainability Methods [55.09730499143998]
本稿では,画像生成モデルを用いて標的摂動を行う新しい手法を提案する。具体的には,画像の忠実さを保ちながら,入力画像の高関連画素のみを塗布し,モデルの予測を変更することに焦点を当てる。これは、しばしばアウト・オブ・ディストリビューションの修正を生み出し、信頼できない結果をもたらす既存のアプローチとは対照的である。
論文参考訳（メタデータ） (2025-04-09T11:46:41Z)
Mask Approximation Net: A Novel Diffusion Model Approach for Remote Sensing Change Captioning [15.88864190284027]
本稿では,拡散モデルを用いたリモートセンシング画像変化検出と記述のための新しいアプローチを提案する。高周波ノイズの管理によりモデル性能を向上させるために,周波数誘導型複素フィルタモジュールを導入する。本稿では,リモートセンシングによる変化検出と記述のための提案手法の有効性を検証する。
論文参考訳（メタデータ） (2024-12-26T11:35:57Z)
Unity in Diversity: Multi-expert Knowledge Confrontation and Collaboration for Generalizable Vehicle Re-identification [60.20318058777603]
一般化可能な車両再識別(ReID)は、微調整や再訓練を必要とせず、未知のターゲットドメインに適応可能なモデルの開発を目指している。これまでの研究は主に、ソースドメイン間のデータ分散を調整することで、ドメイン不変の機能の抽出に重点を置いてきた。そこで本研究では,この問題を解決するために,2段階のMulti-expert Knowledge Confrontation and Collaboration(MiKeCoCo)手法を提案する。
論文参考訳（メタデータ） (2024-07-10T04:06:39Z)
Overhead Line Defect Recognition Based on Unsupervised Semantic Segmentation [8.672676348736834]
オーバーヘッドラインインスペクションは、可視光画像を用いた欠陥認識の恩恵が大きい。本稿では,Faster RCNNネットワーク上に構築された新しい欠陥認識フレームワークを提案する。
論文参考訳（メタデータ） (2023-11-02T03:52:59Z)
Affine-Consistent Transformer for Multi-Class Cell Nuclei Detection [76.11864242047074]
本稿では, 原子核位置を直接生成する新しいアフィン一貫性変換器 (AC-Former) を提案する。本稿では,AAT (Adaptive Affine Transformer) モジュールを導入し,ローカルネットワークトレーニングのためのオリジナル画像をワープするための重要な空間変換を自動学習する。実験結果から,提案手法は様々なベンチマークにおいて既存の最先端アルゴリズムを著しく上回ることがわかった。
論文参考訳（メタデータ） (2023-10-22T02:27:02Z)
Pixel-Inconsistency Modeling for Image Manipulation Localization [59.968362815126326]
デジタル画像法医学は、画像認証と操作のローカライゼーションにおいて重要な役割を果たす。本稿では,画素不整合アーチファクトの解析を通じて,一般化されたロバストな操作ローカライゼーションモデルを提案する。実験により,本手法は固有の画素不整合偽指紋を抽出することに成功した。
論文参考訳（メタデータ） (2023-09-30T02:54:51Z)
An Enhanced Low-Resolution Image Recognition Method for Traffic Environments [3.018656336329545]
低解像度の画像は、小さなサイズ、低い品質、詳細さの欠如に悩まされ、従来のニューラルネットワーク認識アルゴリズムの精度が低下する。本稿では、残差ネットワークの基本構造と共通特徴部分空間アルゴリズムを利用する二重分岐残差ネットワーク構造を提案する。低解像度画像認識の精度を高めるために、中間層特徴の利用を取り入れている。
論文参考訳（メタデータ） (2023-09-28T12:38:31Z)
Cross-resolution Face Recognition via Identity-Preserving Network and Knowledge Distillation [12.090322373964124]
クロスレゾリューション顔認識は、現代の深層顔認識システムにとって難しい問題である。本稿では,低分解能画像の低周波成分に蓄積される識別情報にネットワークを集中させる新しい手法を提案する。
論文参考訳（メタデータ） (2023-03-15T14:52:46Z)
ASSET: Autoregressive Semantic Scene Editing with Transformers at High Resolutions [28.956280590967808]
私たちのアーキテクチャは、新しい注意機構を備えたトランスフォーマーに基づいています。我々のキーとなる考え方は、高解像度の画像解像度で抽出された濃密な注意によって導かれる、トランスフォーマーの注意行列を高解像度でスパース化することである。本手法の有効性を示した質的,定量的な結果とユーザスタディについて述べる。
論文参考訳（メタデータ） (2022-05-24T17:39:53Z)
Transferable Class-Modelling for Decentralized Source Attribution of GAN-Generated Images [4.1483423188102755]
我々は、一連の関連するバイナリ分類タスクとして、ディープフェイク検出とソース属性の問題を再定義する。我々は、転送学習を活用して、複数の独立属性問題に対する偽検出ネットワークを迅速に適用する。私たちのモデルは、現在のベンチマークと競合するように実験によって決定されます。
論文参考訳（メタデータ） (2022-03-18T07:43:03Z)
Detect and Locate: A Face Anti-Manipulation Approach with Semantic and Noise-level Supervision [67.73180660609844]
本稿では,画像中の偽造顔を効率的に検出する,概念的にシンプルだが効果的な方法を提案する。提案手法は,画像に関する意味の高い意味情報を提供するセグメンテーションマップに依存する。提案モデルでは,最先端検出精度と顕著なローカライゼーション性能を実現する。
論文参考訳（メタデータ） (2021-07-13T02:59:31Z)
Bayesian Attention Belief Networks [59.183311769616466]
注意に基づくニューラルネットワークは、幅広いタスクにおいて最先端の結果を得た。本稿では,非正規化注意重みをモデル化してデコーダネットワークを構築するベイズ的注意信念ネットワークについて紹介する。提案手法は, 精度, 不確実性推定, ドメイン間の一般化, 敵攻撃において, 決定論的注意と最先端の注意よりも優れていることを示す。
論文参考訳（メタデータ） (2021-06-09T17:46:22Z)
Revisiting The Evaluation of Class Activation Mapping for Explainability: A Novel Metric and Experimental Analysis [54.94682858474711]
クラスアクティベーションマッピング(cam)アプローチは、アクティベーションマップの平均を重み付けすることで、効果的な可視化を提供する。説明マップを定量化するための新しいメトリクスセットを提案し、より効果的な方法を示し、アプローチ間の比較を簡素化します。
論文参考訳（メタデータ） (2021-04-20T21:34:24Z)
Unpaired Image Enhancement with Quality-Attention Generative Adversarial Network [92.01145655155374]
品質の注意を払わないデータに基づいて訓練された生成敵対ネットワーク(QAGAN)を提案する。提案されたQAGANの重要な新規性は、ジェネレータの注入されたQAMにある。提案手法は客観的評価と主観評価の両方において良好な性能を実現する。
論文参考訳（メタデータ） (2020-12-30T05:57:20Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。