Fugu-MT 論文翻訳(概要): VSLLaVA: a pipeline of large multimodal foundation model for industrial vibration signal analysis

論文の概要: VSLLaVA: a pipeline of large multimodal foundation model for industrial vibration signal analysis

arxiv url: http://arxiv.org/abs/2409.07482v1
Date: Tue, 3 Sep 2024 06:21:26 GMT
ステータス: 翻訳完了
システム内更新日: 2024-09-15 05:01:16.812601
Title: VSLLaVA: a pipeline of large multimodal foundation model for industrial vibration signal analysis
Title（参考訳）: 産業振動信号解析のための大規模マルチモーダル基礎モデルのパイプラインVSLLaVA
Authors: Qi Li, Jinfeng Huang, Hongliang He, Xinran Zhang, Feibin Zhang, Zhaoye Qin, Fulei Chu,
Abstract要約: 本稿では,信号パラメータの同定と故障の診断に専門家の知識を統合するために,大規模言語モデルを活用したVSLLaVAというパイプラインを提案する。このジェネレータは、ドメイン固有のパラメータ識別と故障診断問合せペアを用いて振動解析の専門家が提供した信号をマージして、信号問合せ三重項を構築する。この微調整モデルは,大規模言語モデルとエキスパートルールを組み合わせて,回答の精度と妥当性を評価することによって評価される。
参考スコア（独自算出の注目度）: 17.401380489591087
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Large multimodal foundation models have been extensively utilized for image recognition tasks guided by instructions, yet there remains a scarcity of domain expertise in industrial vibration signal analysis. This paper presents a pipeline named VSLLaVA that leverages a large language model to integrate expert knowledge for identification of signal parameters and diagnosis of faults. Within this pipeline, we first introduce an expert rule-assisted signal generator. The generator merges signal provided by vibration analysis experts with domain-specific parameter identification and fault diagnosis question-answer pairs to build signal-question-answer triplets. Then we use these triplets to apply low-rank adaptation methods for fine-tuning the linear layers of the Contrastive Language-Image Pretraining (CLIP) and large language model, injecting multimodal signal processing knowledge. Finally, the fine-tuned model is assessed through the combined efforts of large language model and expert rules to evaluate answer accuracy and relevance, which showcases enhanced performance in identifying, analyzing various signal parameters, and diagnosing faults. These enhancements indicate the potential of this pipeline to build a foundational model for future industrial signal analysis and monitoring.
Abstract（参考訳）: 大規模なマルチモーダル基礎モデルは、指示によって導かれる画像認識タスクに広く利用されているが、産業振動信号解析における領域の専門知識は乏しい。本稿では,信号パラメータの同定と故障の診断に専門家の知識を統合するために,大規模言語モデルを活用したVSLLaVAというパイプラインを提案する。このパイプライン内では、まず専門家によるルール支援信号生成装置を導入する。このジェネレータは、ドメイン固有のパラメータ識別と故障診断問合せペアを用いて振動解析の専門家が提供した信号をマージして、信号問合せ三重項を構築する。次に、これらの三重項を用いて、コントラスト言語-画像事前学習(CLIP)と大規模言語モデルの線形層を微調整し、マルチモーダル信号処理の知識を注入する低ランク適応手法を適用する。最後に, 各種信号パラメータの同定, 解析, 故障診断における性能向上を図り, 応答精度と妥当性を評価するため, 大規模言語モデルとエキスパートルールの組み合わせにより, 微調整モデルを評価した。これらの拡張は、将来の産業信号分析と監視のための基盤モデルを構築するためのパイプラインの可能性を示している。

関連論文リスト

RTNinja: a generalized machine learning framework for analyzing random telegraph noise signals in nanoelectronic devices [0.0]
RTNinjaは、ランダムな電信ノイズ信号の教師なし分析のための、完全に自動化された機械学習フレームワークである。評価のために,広帯域信号対雑音比と音源の複雑さにまたがるラベル付きデータセットを生成するモンテカルロシミュレータを開発した。この結果から,RTNinjaは無作為な電信ノイズ評価のための堅牢でスケーラブルでデバイスに依存しないツールであることがわかった。
論文参考訳（メタデータ） (2025-07-11T09:09:01Z)
Additive decomposition of one-dimensional signals using Transformers [48.7025991956527]
一次元信号分解は、様々な科学分野において確立され広く使われている技術である。近年の研究では、この問題に最新のディープラーニングモデルを適用すると、期待できる可能性を持った、エキサイティングで未探索な領域が現れることが示唆されている。我々はTransformerアーキテクチャを利用して、信号を構成コンポーネントに分解する。
論文参考訳（メタデータ） (2025-06-06T10:09:40Z)
OmniAD: Detect and Understand Industrial Anomaly via Multimodal Reasoning [76.90511414963265]
我々は,微粒化解析のための異常検出と理解を統一するフレームワークであるOmniADを紹介した。ビジュアル推論は、Text-as-Maskを活用することで詳細なインスペクションを提供する。 Visual Guided Textual Reasoningは、視覚知覚を統合することで包括的な分析を行う。
論文参考訳（メタデータ） (2025-05-28T07:02:15Z)
Generative Edge Detection with Stable Diffusion [52.870631376660924]
エッジ検出は一般的に、主に識別法によって対処されるピクセルレベルの分類問題と見なされる。本稿では、事前学習した安定拡散モデルのポテンシャルを十分に活用して、GED(Generative Edge Detector)という新しい手法を提案する。複数のデータセットに対して広範な実験を行い、競争性能を達成する。
論文参考訳（メタデータ） (2024-10-04T01:52:23Z)
RF Challenge: The Data-Driven Radio Frequency Signal Separation Challenge [66.33067693672696]
本稿では、深層学習手法を利用したデータ駆動手法を用いて、高周波信号における干渉拒否の重大な問題に対処する。本論文の主な貢献は、RF信号データセットであるRF Challengeの導入である。
論文参考訳（メタデータ） (2024-09-13T13:53:41Z)
BearLLM: A Prior Knowledge-Enhanced Bearing Health Management Framework with Unified Vibration Signal Representation [8.401364944653146]
大規模言語モデル(BearLLM)を活用したベアリング型健康管理フレームワークを提案する。 BearLLMは、ユーザのプロンプトと振動信号を処理することで、複数のベアリング関連タスクを統合する。私たちは、より有能な産業マルチモーダルモデルの構築に関する将来の研究を刺激するデータセット、モデル、コードを提供しています。
論文参考訳（メタデータ） (2024-08-21T02:04:54Z)
SHIELD: LLM-Driven Schema Induction for Predictive Analytics in EV Battery Supply Chain Disruptions [52.90276059116822]
ShiELDは、大型言語モデル(LLM)とEVバッテリサプライチェーンリスクアセスメントのためのドメインの専門知識を組み合わせたものだ。 365の資料(2022-2023)から12,070段落を評価したところ、ShiELDは破壊予測においてベースラインGCNとLLM+prompt法より優れていた。
論文参考訳（メタデータ） (2024-08-09T22:08:12Z)
A Transformer Model for Boundary Detection in Continuous Sign Language [55.05986614979846]
Transformerモデルは、分離された手話認識と連続手話認識の両方に使用される。トレーニングプロセスは、入力されたビデオから抽出された手指キーポイントの特徴を豊かにする、孤立した手指ビデオを使用する。トレーニングされたモデルと後処理の手法が組み合わさって、連続した手話ビデオ内の孤立した手話境界を検出する。
論文参考訳（メタデータ） (2024-02-22T17:25:01Z)
Causal Disentanglement Hidden Markov Model for Fault Diagnosis [55.90917958154425]
本研究では, 軸受破壊機構の因果性を学ぶために, 因果解離隠れマルコフモデル (CDHM) を提案する。具体的には、時系列データをフル活用し、振動信号を断層関連要因と断層関連要因に段階的に分解する。アプリケーションの範囲を広げるために、学習された非絡み合った表現を他の作業環境に転送するために、教師なしのドメイン適応を採用する。
論文参考訳（メタデータ） (2023-08-06T05:58:45Z)
Structural Vibration Signal Denoising Using Stacking Ensemble of Hybrid CNN-RNN [0.0]
近年,生物工学の分野では振動信号の利用が増加している。足音による振動は、人体や動物などの生体系の運動を分析するのに有用である。本稿では,複数信号のアンサンブルと,再帰的および畳み込み型ニューラルネットワーク予測の両方を活用する新しいアンサンブルモデルを提案する。
論文参考訳（メタデータ） (2023-03-11T00:49:45Z)
Decision Forest Based EMG Signal Classification with Low Volume Dataset Augmented with Random Variance Gaussian Noise [51.76329821186873]
我々は6種類の手振りを限定的なサンプル数で分類できるモデルを作成し、より広い聴衆によく一般化する。信号のランダムなバウンドの使用など、より基本的な手法のセットにアピールするが、これらの手法がオンライン環境で持てる力を示したいと考えている。
論文参考訳（メタデータ） (2022-06-29T23:22:18Z)
SVM and ANN based Classification of EMG signals by using PCA and LDA [0.0]
筋電信号(MES)は、人体の筋肉を一次元パターンとして生成する。 Support Vector Machines (SVM) は n 次元超平面を識別し、入力特徴点の集合を異なるクラスに分離する技術である。
論文参考訳（メタデータ） (2021-10-22T06:44:08Z)
Signal Transformer: Complex-valued Attention and Meta-Learning for Signal Recognition [33.178794056273304]
本稿では,理論収束保証を伴う一般の非評価問題に対して,CAMEL(complex-valued Attentional MEta Learner)を提案する。本報告では, 状態が小さい場合に, 提案したデータ認識実験の優位性を示す。
論文参考訳（メタデータ） (2021-06-05T03:57:41Z)
Discriminative Singular Spectrum Classifier with Applications on Bioacoustic Signal Recognition [67.4171845020675]
分析や分類に有用な特徴を効率的に抽出する識別機構を備えた生体音響信号分類器を提案する。タスク指向の現在のバイオ音響認識法とは異なり、提案モデルは入力信号をベクトル部分空間に変換することに依存する。提案法の有効性は,アヌラン,ミツバチ,蚊の3種の生物音響データを用いて検証した。
論文参考訳（メタデータ） (2021-03-18T11:01:21Z)
Interpreting Deep Learning Models for Epileptic Seizure Detection on EEG signals [4.748221780751802]
ディープラーニング(DL)は、しばしば人工知能ベースの医療意思決定支援の最先端とみなされます。臨床現場では未だに実装されており、ニューラルネットワークモデルの解釈能力が不十分なため、臨床医の信頼は低い。脳波信号に基づくてんかん発作のオンライン検出の文脈で解釈可能なDLモデルを開発することでこの問題に対処した。
論文参考訳（メタデータ） (2020-12-22T11:10:23Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。