論文の概要: A Foundation Model for DAS Signal Recognition and Visual Prompt Tuning of the Pre-trained Model for Downstream Tasks
- arxiv url: http://arxiv.org/abs/2508.04316v1
- Date: Wed, 06 Aug 2025 11:02:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-07 20:09:22.688235
- Title: A Foundation Model for DAS Signal Recognition and Visual Prompt Tuning of the Pre-trained Model for Downstream Tasks
- Title(参考訳): 下流タスクのための事前学習モデルのDAS信号認識と視覚プロンプトチューニングの基礎モデル
- Authors: Kun Gui, Hongliang Ren, Shang Shi, Jin Lu, Changqiu Yu, Quanjun Cao, Guomin Gu, Qi Xuan,
- Abstract要約: 本研究では,MAEPD と呼ばれる Masked Autocoder に基づくDAS信号認識の基礎モデルを提案する。
このモデルは635860サンプルのデータセットに事前トレーニングされており、DAS歩行信号、2つの時間的GASF画像、パイプライン漏れの2D時間周波数画像、クジラの発声や地震活動を含むオープンデータセット信号を含んでいる。
VPT-Deepアプローチは、パラメータの0.322%しか微調整されていない96.94%の分類精度を達成し、従来のFFT(Full Fine Tuning)法を0.61%上回り、トレーニング時間を短縮する。
- 参考スコア(独自算出の注目度): 6.14430079610632
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Distributed Acoustic Sensing (DAS) technology finds growing applications across various domains. However, data distribution disparities due to heterogeneous sensing environments pose challenges for data-driven artificial intelligence (AI) models, limiting cross-domain generalization and facing a shortage of labeled training data. To address these issues, this study proposes a foundational model for DAS signal recognition based on a Masked Autoencoder, named MAEPD. The MAEPD model is pretrained on a dataset of 635,860 samples, encompassing DAS gait spatiotemporal signals, 2D GASF images for perimeter security, 2D time-frequency images for pipeline leakage, and open-dataset signals including whale vocalizations and seismic activities, using a self-supervised mask reconstruction task to capture deep semantic features of DAS signals. Visual Prompt Tuning (VPT) is employed for downstream recognition tasks. This method freezes the pretrained backbone parameters and fine-tunes only a small set of learnable visual prompt vectors inserted into the Transformer encoder layers. Experiments on the NVIDIA GeForce RTX 4080 Super platform validate MAEPD using indoor gait recognition as a downstream task. The VPT-Deep approach achieves a classification accuracy of 96.94% with just 0.322% of parameters fine-tuned, surpassing the traditional Full Fine Tuning (FFT) method by 0.61% and reducing training time by 45%. The model also exhibits robust performance in pipeline leakage detection, confirming the generality, efficiency, and scalability of MAEPD as a foundational model. This approach offers a novel paradigm for addressing the limited generalization of signal recognition models in the DAS domain.
- Abstract(参考訳): 分散音響センシング(DAS)技術は、様々な領域にまたがる成長するアプリケーションを見つける。
しかし、異種検知環境によるデータ分散の相違は、データ駆動人工知能(AI)モデルに課題をもたらし、ドメイン間の一般化を制限し、ラベル付きトレーニングデータの不足に直面している。
そこで本研究では,Masked Autoencoder(MAEPD)に基づくDAS信号認識の基礎モデルを提案する。
MAEPDモデルは、635,860サンプルのデータセットに事前トレーニングされており、DAS信号の深い意味的特徴を捉えるために、DAS測位時空間信号、2次元GASF画像、パイプラインリークのための2次元時間周波数画像、クジラの発声や地震活動を含むオープンデータセット信号を含む。
下流認識タスクには、Visual Prompt Tuning (VPT)が使用される。
この方法は、トレーニング済みのバックボーンパラメータと、Transformerエンコーダ層に挿入された学習可能な視覚的プロンプトベクトルの小さなセットのみを凍結する。
NVIDIA GeForce RTX 4080 Super Platformの実験では、室内歩行認識を下流タスクとしてMAEPDを検証する。
VPT-Deepアプローチは、パラメータの0.322%しか微調整されていない96.94%の分類精度を達成し、従来のFFT(Full Fine Tuning)法を0.61%上回り、トレーニング時間を45%削減した。
このモデルはパイプラインリーク検出において堅牢な性能を示し、基礎モデルとしてMAEPDの汎用性、効率、スケーラビリティを確認する。
このアプローチは、DAS領域における信号認識モデルの限定的な一般化に対処するための新しいパラダイムを提供する。
関連論文リスト
- Adaptive Signal Analysis for Automated Subsurface Defect Detection Using Impact Echo in Concrete Slabs [0.0]
本研究は,コンクリートスラブの地下欠陥発生領域を検出するための,新しい,自動化された,スケーラブルな手法を提案する。
このアプローチは、高度な信号処理、クラスタリング、および視覚分析を統合して、地下の異常を識別する。
結果は方法論の堅牢性を示し、最小限の偽陽性とほとんど欠陥のない欠陥発生領域を一貫して同定した。
論文 参考訳(メタデータ) (2024-12-23T20:05:53Z) - Steering Masked Discrete Diffusion Models via Discrete Denoising Posterior Prediction [88.65168366064061]
本稿では,確率論的推論の課題として,事前学習したMDMを操る作業を行う新しいフレームワークであるDDPPを紹介する。
私たちのフレームワークは、3つの新しい目標のファミリーにつながります。
Wet-lab Validation(ウェット・ラブ・バリデーション)を用いて,報酬最適化タンパク質配列の過渡的発現を観察する。
論文 参考訳(メタデータ) (2024-10-10T17:18:30Z) - Open-Set Deepfake Detection: A Parameter-Efficient Adaptation Method with Forgery Style Mixture [58.60915132222421]
本稿では,顔偽造検出に汎用的かつパラメータ効率の高い手法を提案する。
フォージェリー・ソース・ドメインの多様性を増大させるフォージェリー・ミックス・フォーミュレーションを設計する。
設計したモデルは、トレーニング可能なパラメータを著しく減らし、最先端の一般化性を実現する。
論文 参考訳(メタデータ) (2024-08-23T01:53:36Z) - Test-time adaptation for geospatial point cloud semantic segmentation with distinct domain shifts [6.80671668491958]
テスト時間適応(TTA)は、ソースデータへのアクセスや追加のトレーニングなしに、推論段階でラベル付けされていないデータに事前訓練されたモデルの直接適応を可能にする。
本稿では,3つの領域シフトパラダイムを提案する。光グラムから空気中LiDAR,空気中LiDAR,合成-移動レーザー走査である。
実験の結果,分類精度は最大20%mIoUに向上し,他の手法よりも優れていた。
論文 参考訳(メタデータ) (2024-07-08T15:40:28Z) - Lazy Layers to Make Fine-Tuned Diffusion Models More Traceable [70.77600345240867]
新たな任意の任意配置(AIAO)戦略は、微調整による除去に耐性を持たせる。
拡散モデルの入力/出力空間のバックドアを設計する既存の手法とは異なり,本手法では,サンプルサブパスの特徴空間にバックドアを埋め込む方法を提案する。
MS-COCO,AFHQ,LSUN,CUB-200,DreamBoothの各データセットに関する実証研究により,AIAOの堅牢性が確認された。
論文 参考訳(メタデータ) (2024-05-01T12:03:39Z) - Object-Size-Driven Design of Convolutional Neural Networks: Virtual Axle Detection based on Raw Data [0.0]
本研究では,橋梁上に任意に設置したセンサを用いた列車軸受のリアルタイム検出手法を提案する。
VADER(Virtual Axle Detector with Enhanced Receptive Field)の開発は、単線鉄道橋上で検証されている。
生データを入力として使用することで、最先端のスペクトログラムベースの手法をスピードとメモリ使用率の両方で99%向上させた。
論文 参考訳(メタデータ) (2023-09-04T12:53:54Z) - MAPS: A Noise-Robust Progressive Learning Approach for Source-Free
Domain Adaptive Keypoint Detection [76.97324120775475]
クロスドメインキーポイント検出方法は、常に適応中にソースデータにアクセスする必要がある。
本稿では、ターゲット領域に十分に訓練されたソースモデルのみを提供する、ソースフリーなドメイン適応キーポイント検出について考察する。
論文 参考訳(メタデータ) (2023-02-09T12:06:08Z) - GaitSADA: Self-Aligned Domain Adaptation for mmWave Gait Recognition [14.750765172614836]
mmWaveレーダを用いた歩行認識は,mmWaveレーダの帰還信号から人間の歩行バイオメトリックスを捕捉する新しいユーザ識別法である。
この問題を軽減するために、GaitSADAと呼ばれる新しい自己整合ドメイン適応法を提案する。
実験により、GaitSADAは、低データ状態における平均精度で15.41%から26.32%の改善により、代表的ドメイン適応法よりも優れていることが示された。
論文 参考訳(メタデータ) (2023-01-31T03:21:08Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z) - Decision Forest Based EMG Signal Classification with Low Volume Dataset
Augmented with Random Variance Gaussian Noise [51.76329821186873]
我々は6種類の手振りを限定的なサンプル数で分類できるモデルを作成し、より広い聴衆によく一般化する。
信号のランダムなバウンドの使用など、より基本的な手法のセットにアピールするが、これらの手法がオンライン環境で持てる力を示したいと考えている。
論文 参考訳(メタデータ) (2022-06-29T23:22:18Z) - A Novel Approach For Analysis of Distributed Acoustic Sensing System
Based on Deep Transfer Learning [0.0]
畳み込みニューラルネットワークは、空間情報を抽出するための非常に有能なツールである。
LSTM(Long-Short term memory)は、シーケンシャルデータを処理するための有効な機器である。
我々のフレームワークのVGG-16アーキテクチャは、50のトレーニングで100%の分類精度が得られる。
論文 参考訳(メタデータ) (2022-06-24T19:56:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。