論文の概要: Power-LLaVA: Large Language and Vision Assistant for Power Transmission Line Inspection
- arxiv url: http://arxiv.org/abs/2407.19178v1
- Date: Sat, 27 Jul 2024 05:29:10 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-30 19:31:05.589398
- Title: Power-LLaVA: Large Language and Vision Assistant for Power Transmission Line Inspection
- Title(参考訳): Power-LLaVA: 送電線検査のための大規模言語と視覚アシスタント
- Authors: Jiahao Wang, Mingxuan Li, Haichen Luo, Jinguo Zhu, Aijun Yang, Mingzhe Rong, Xiaohua Wang,
- Abstract要約: 送電線に対するプロフェッショナルで信頼性の高い検査サービスを提供するために設計された,最初の大規模言語および視覚アシスタントであるPower-LLaVAを紹介する。
構築されたデータセットに2段階のトレーニング戦略を採用することで、Power-LLaVAは比較的低いトレーニングコストで例外的なパフォーマンスを示す。
- 参考スコア(独自算出の注目度): 22.155175897737447
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The inspection of power transmission line has achieved notable achievements in the past few years, primarily due to the integration of deep learning technology. However, current inspection approaches continue to encounter difficulties in generalization and intelligence, which restricts their further applicability. In this paper, we introduce Power-LLaVA, the first large language and vision assistant designed to offer professional and reliable inspection services for power transmission line by engaging in dialogues with humans. Moreover, we also construct a large-scale and high-quality dataset specialized for the inspection task. By employing a two-stage training strategy on the constructed dataset, Power-LLaVA demonstrates exceptional performance at a comparatively low training cost. Extensive experiments further prove the great capabilities of Power-LLaVA within the realm of power transmission line inspection. Code shall be released.
- Abstract(参考訳): 電力送電線の検査は,近年,ディープラーニング技術の統合が主な成果となっている。
しかし、現在の検査手法は一般化と知能の難しさに悩まされ続けており、適用性はさらに制限されている。
本稿では,人間と対話することで,送電線に対するプロフェッショナルで信頼性の高い検査サービスを提供するための,最初の大規模言語および視覚アシスタントであるPower-LLaVAを紹介する。
また,検査作業に特化した大規模かつ高品質なデータセットを構築した。
構築されたデータセットに2段階のトレーニング戦略を採用することで、Power-LLaVAは比較的低いトレーニングコストで例外的なパフォーマンスを示す。
大規模な実験により、送電線検査の領域におけるパワー・ラバの優れた能力が証明された。
コードは解放される。
関連論文リスト
- TL-CLIP: A Power-specific Multimodal Pre-trained Visual Foundation Model for Transmission Line Defect Recognition [3.361647807059187]
伝送線路欠陥認識のための2段階の伝送線路指向コントラスト言語画像事前学習(TL-CLIP)フレームワークを提案する。
事前学習プロセスでは、パワー関連セマンティック知識のモデリングを改善するために、2つのパワー特化事前学習タスクを補助する、新しいパワー特化マルチモーダルアルゴリズムを採用している。
実験により,本手法は,分類タスクと検出タスクの両方において,伝送線路欠陥認識の性能を著しく向上することを示した。
論文 参考訳(メタデータ) (2024-11-18T08:32:51Z) - Bootstrapping Reinforcement Learning with Imitation for Vision-Based Agile Flight [20.92646531472541]
本稿では,Reinforcement Learning(RL)とImitation Learning(IL)のサンプル効率を組み合わせた新しいアプローチを提案する。
本フレームワークは、RLを用いた3段階の教員政策と、ILによる学生政策に蒸留する特権状態情報と、RLによる適応微調整とを含む。
テストでは、スクラッチからRLが失敗するシナリオだけでなく、ロバストさとパフォーマンスの両方で既存のILメソッドよりも優れています。
論文 参考訳(メタデータ) (2024-03-18T19:25:57Z) - Non-Intrusive Load Monitoring for Feeder-Level EV Charging Detection:
Sliding Window-based Approaches to Offline and Online Detection [4.820576346277399]
我々は,スライディングウインドウの特徴抽出と古典的機械学習技術を含む,供給者レベルでのEV検出のための新規かつ効果的なアプローチを開発した。
開発した手法は,高速なトレーニングが可能な軽量で効率的なソリューションを提供する。
実験の結果,Fスコア98.88%,オンライン検出93.01%の高精度なEV充電検出が可能となった。
論文 参考訳(メタデータ) (2023-12-04T13:40:22Z) - Autonomous Point Cloud Segmentation for Power Lines Inspection in Smart
Grid [56.838297900091426]
高電圧と低電圧の両方の電力線の特徴を検出し,抽出し,解析するために,教師なし機械学習(ML)フレームワークを提案する。
提案フレームワークは電力線を効率よく検出し,PLCに基づくハザード解析を行う。
論文 参考訳(メタデータ) (2023-08-14T17:14:58Z) - Non-Intrusive Electric Load Monitoring Approach Based on Current Feature
Visualization for Smart Energy Management [51.89904044860731]
我々はAIのコンピュータビジョン技術を用いて、スマートエネルギー管理のための非侵襲的な負荷監視手法を設計する。
マルチスケールの特徴抽出とアテンション機構を備えたU字型ディープニューラルネットワークを用いて,色特徴画像からすべての電気負荷を認識することを提案する。
論文 参考訳(メタデータ) (2023-08-08T04:52:19Z) - Weakly-supervised HOI Detection via Prior-guided Bi-level Representation
Learning [66.00600682711995]
ヒューマンオブジェクトインタラクション(HOI)検出は、人間中心のシーン理解において重要な役割を担い、多くの視覚タスクの基本的なビルディングブロックとして機能する。
HOI検出のための汎用的でスケーラブルな戦略の1つは、画像レベルのアノテーションからのみ学習する弱い監視を使用することである。
これは、不明瞭な人間と物体の関連、HOIを検出する大きな探索空間、非常にノイズの多い訓練信号によって本質的に困難である。
画像レベルとHOIインスタンスレベルの両方で事前の知識を組み込むことができるCLIP誘導HOI表現を開発し、不正な人間とオブジェクトの関連性を実証するために自己学習機構を採用する。
論文 参考訳(メタデータ) (2023-03-02T14:41:31Z) - DL-DRL: A double-level deep reinforcement learning approach for
large-scale task scheduling of multi-UAV [65.07776277630228]
分割・征服フレームワーク(DCF)に基づく二重レベル深層強化学習(DL-DRL)手法を提案する。
特に,上層部DRLモデルにおけるエンコーダ・デコーダ構成ポリシネットワークを設計し,タスクを異なるUAVに割り当てる。
また、低レベルDRLモデルにおける別の注意に基づくポリシーネットワークを利用して、各UAVの経路を構築し、実行されたタスク数を最大化する。
論文 参考訳(メタデータ) (2022-08-04T04:35:53Z) - Deep Reinforcement Learning Assisted Federated Learning Algorithm for
Data Management of IIoT [82.33080550378068]
産業用IoT(Industrial Internet of Things)の継続的な拡大により、IIoT機器は毎回大量のユーザデータを生成する。
IIoTの分野で、これらの時系列データを効率的かつ安全な方法で管理する方法は、依然として未解決の問題である。
本稿では,無線ネットワーク環境におけるIIoT機器データ管理におけるFL技術の適用について検討する。
論文 参考訳(メタデータ) (2022-02-03T07:12:36Z) - Knowledge Transfer in Multi-Task Deep Reinforcement Learning for
Continuous Control [65.00425082663146]
連続制御のための知識伝達に基づく多タスク深層強化学習フレームワーク(KTM-DRL)を提案する。
KTM-DRLでは、マルチタスクエージェントがまずオフラインの知識伝達アルゴリズムを利用して、タスク固有の教師の経験から制御ポリシーを素早く学習する。
実験結果は,KTM-DRLとその知識伝達とオンライン学習アルゴリズムの有効性を正当化するとともに,最先端技術よりも大きなマージンによる優位性を示した。
論文 参考訳(メタデータ) (2020-10-15T03:26:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。