論文の概要: Algorithms for Object Detection in Substations
- arxiv url: http://arxiv.org/abs/2311.07577v1
- Date: Sat, 23 Sep 2023 20:18:07 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-15 16:23:26.118668
- Title: Algorithms for Object Detection in Substations
- Title(参考訳): 変電所における物体検出アルゴリズム
- Authors: Bingying Jin, Yadong Liu, Qinlin Qian
- Abstract要約: 本稿では,オブジェクト関係モデリングとトランスフォーマーモデルを組み合わせる。
バックボーン、エンコーダ、デコーダ、予測ヘッドの4つの部分がある。
提案手法は,サブステーションにおける物体認識において,他の3つのモデルよりもはるかに優れた性能を示す。
- 参考スコア(独自算出の注目度): 1.2332152663522145
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Inspection of high-voltage power equipment is an effective way to ensure
power supply reliability. Object recognition, one of the key technologies in
automatic power equipment inspection, attracts attention of many researchers
and engineers. Although quite a few existing models have some their own
advantages, object relationship between equipment which is very important in
this task is scarcely considered. This paper combining object relationship
modeling and Transformer Model proposes a Relation Transformer Model. It has
four parts -- backbone, encoder, decoder and prediction heads. With this
structure, the proposed method shows in experiments a much better performance
than other three commonly used models in object recognition in substation,
largely promoting the development of automatic power equipment inspection.
- Abstract(参考訳): 高電圧設備の検査は電源信頼性を確保する効果的な方法である。
自動動力機器検査における重要な技術の一つである物体認識は、多くの研究者や技術者の注目を集めている。
既存のモデルにはいくつかの利点があるが、このタスクにおいて非常に重要な機器間のオブジェクト関係はほとんど考慮されていない。
本稿では,オブジェクト関係モデリングとトランスフォーマーモデルを組み合わせたリレーショナルトランスフォーマーモデルを提案する。
バックボーン、エンコーダ、デコーダ、予測ヘッドの4つの部分がある。
この構造を用いて, 提案手法は, 変電所における物体認識における他の3つのモデルよりも優れた性能を示し, 自動動力機器検査の開発を推進している。
関連論文リスト
- Evaluating Vision Transformer Models for Visual Quality Control in Industrial Manufacturing [0.0]
工業生産における機械学習の最も有望なユースケースの1つは、欠陥のある製品の早期発見である。
我々は、異常検出手法とともに、現在の視覚変換器モデルを評価する。
品質管理システムに適したモデルアーキテクチャを実際に選択するためのガイドラインを提示する。
論文 参考訳(メタデータ) (2024-11-22T14:12:35Z) - Machine learning approaches for automatic defect detection in photovoltaic systems [1.121744174061766]
太陽電池(PV)モジュールは、製造、設置、運用中に損傷を受けやすい。
無人航空機による運用中のPVモジュールの継続的な監視が不可欠である。
コンピュータビジョンは、大規模なPVプラントの欠陥を監視するための、自動的で非破壊的で費用対効果の高いツールを提供する。
論文 参考訳(メタデータ) (2024-09-24T13:11:05Z) - Adventures of Trustworthy Vision-Language Models: A Survey [54.76511683427566]
本稿では,バイス,ロバスト性,解釈可能性の3つの基本原理を用いて,視覚言語変換器の徹底的な検証を行う。
本研究の主な目的は, トランスフォーマーの実用化に伴う複雑さと複雑さを掘り下げることであり, 信頼性と説明責任を高める方法の理解を深めることである。
論文 参考訳(メタデータ) (2023-12-07T11:31:20Z) - SimPLR: A Simple and Plain Transformer for Scaling-Efficient Object Detection and Segmentation [49.65221743520028]
本研究は, 背骨と頭部が非階層的であり, 単一スケールの機能で動作するSimPLRを, スケール認識型トランスフォーマーベース検出器により検出できることを示す。
マルチスケールおよびシングルスケールの最先端と比較して、我々のモデルはより大きなキャパシティ(自己監督型)モデルとより事前学習データにより、はるかに良くスケールする。
論文 参考訳(メタデータ) (2023-10-09T17:59:26Z) - A Comprehensive Survey on Applications of Transformers for Deep Learning
Tasks [60.38369406877899]
Transformerは、シーケンシャルデータ内のコンテキスト関係を理解するために自己認識メカニズムを使用するディープニューラルネットワークである。
Transformerモデルは、入力シーケンス要素間の長い依存関係を処理し、並列処理を可能にする。
我々の調査では、トランスフォーマーベースのモデルのためのトップ5のアプリケーションドメインを特定します。
論文 参考訳(メタデータ) (2023-06-11T23:13:51Z) - Object Detection with Transformers: A Review [11.255962936937744]
本報告では, 従来のDETRモデルにおいて提案された21の進歩について概説する。
我々は、様々な検出変換器の比較分析を行い、その性能とネットワークアーキテクチャを評価した。
この研究は、既存の課題に対処し、オブジェクト検出領域におけるトランスフォーマーの適用を探求する研究者の間で、さらなる関心を喚起することを期待している。
論文 参考訳(メタデータ) (2023-06-07T16:13:38Z) - Hierarchical Point Attention for Indoor 3D Object Detection [111.04397308495618]
本研究は、点ベース変圧器検出器の汎用階層設計として、2つの新しい注意操作を提案する。
まず、よりきめ細かい特徴学習を可能にするために、シングルスケールの入力機能からマルチスケールトークンを構築するマルチスケール注意(MS-A)を提案する。
第2に,適応型アテンション領域を持つサイズ適応型ローカルアテンション(Local-A)を提案する。
論文 参考訳(メタデータ) (2023-01-06T18:52:12Z) - An Extendable, Efficient and Effective Transformer-based Object Detector [95.06044204961009]
我々は、視覚・検出変換器(ViDT)を統合し、効果的で効率的な物体検出装置を構築する。
ViDTは、最近のSwin Transformerをスタンドアロンのオブジェクト検出器に拡張するために、再構成されたアテンションモジュールを導入した。
オブジェクト検出とインスタンスセグメンテーションのための共同タスク学習をサポートするために、ViDT+に拡張する。
論文 参考訳(メタデータ) (2022-04-17T09:27:45Z) - Multi-Modal Learning for AU Detection Based on Multi-Head Fused
Transformers [12.669741472823192]
AU検出のためのエンドツーエンドのマルチヘッドフューズ変換器 (MFT) を提案する。
変換器エンコーダによって異なるモダリティから特徴表現をAU符号化し、他のフュージョントランスモジュールによってモダリティを融合する。
提案手法は、BP4DとBP4D+の2つのパブリックマルチモーダルAUデータベース上で評価される。
論文 参考訳(メタデータ) (2022-03-22T03:31:29Z) - ViDT: An Efficient and Effective Fully Transformer-based Object Detector [97.71746903042968]
検出変換器は、オブジェクト検出のための最初のエンドツーエンド学習システムである。
視覚変換器は、画像分類のための最初の完全変換器ベースのアーキテクチャである。
本稿では、視覚・検出変換器(ViDT)を統合し、効果的で効率的な物体検出装置を構築する。
論文 参考訳(メタデータ) (2021-10-08T06:32:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。