論文の概要: Beyond Low-Rank: Low-Rank Sparse Prompting via Spiking Neural Network and Prompt Factorization
- arxiv url: http://arxiv.org/abs/2606.01945v1
- Date: Mon, 01 Jun 2026 09:08:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:31.681019
- Title: Beyond Low-Rank: Low-Rank Sparse Prompting via Spiking Neural Network and Prompt Factorization
- Title(参考訳): 低ランクを超える:スパイキングニューラルネットワークとプロンプト因子化による低ランクスパースプロンプト
- Authors: Yumiao Zhao, Bo Jiang, Beibei Wang, Xixi Wan, Xiao Wang, Jin Tang,
- Abstract要約: 動的低ランクスパース視覚プロンプトを自然に学習する新しいフレームワークである textbfLow-textbfRank visual textbfSpike textbfPrompting (LoRSP) を提案する。
LoRSPは、スパイキングニューロンの脳に誘発されるスパース発火機構を利用して、各インスタンスに対してピクセルレベルのスパースプロンプトを生成する。
- 参考スコア(独自算出の注目度): 18.37290479210559
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visual Prompting (VP) has emerged as an efficient paradigm for adapting large-scale pre-trained vision models to downstream tasks by incorporating learnable prompts at the input level. However, existing VP methods typically employ dense pixel-level prompts, which often suffer from redundant perturbations, limited generalization and energy inefficiency. To overcome these limitations, we propose to integrate brain-inspired spiking learning into visual prompt learning tasks. As we know that spiking neuron can perform inexpensive information processing by transmitting the input data into discrete spike trains and return sparse outputs. Inspired by this, we propose \textbf{Lo}w-\textbf{R}ank visual \textbf{S}pike \textbf{P}rompting (LoRSP), a novel framework that learns dynamic low-rank sparse visual prompts naturally via a Spiking neuron learning mechanism. The core idea of LoRSP is to exploit the brain-inspired sparse firing mechanism of spiking neurons to generate pixel-level sparse prompt for each instance. To be specific, we first construct a series of prompt factors via low-rank factorization to capture distinct prompt subspaces. These prompt factors are then fed into an SNN architecture, which performs the integrate-and-fire process to emit spikes. As a result, our LoRSP generates a \emph{sparse} visual prompt while maintaining the low-rank constraint. This design enables instance-specific selective prompting, leading to more compact and robust adaptation across diverse downstream tasks. Extensive experiments on five heterogeneous vision backbones and multiple benchmarks demonstrate that LoRSP achieves competitive performance while requiring fewer tunable parameters compared to existing VP methods.
- Abstract(参考訳): ビジュアルプロンプティング(VP)は、学習可能なプロンプトを入力レベルで組み込むことで、大規模な事前学習された視覚モデルを下流タスクに適応するための効率的なパラダイムとして登場した。
しかし、既存のVP法は一般的に高密度のピクセルレベルのプロンプトを使用し、しばしば冗長な摂動、一般化の制限、エネルギーの効率の低下に悩まされる。
これらの制限を克服するために,脳に刺激を受けたスパイク学習を視覚的即興学習タスクに統合することを提案する。
スパイクニューロンは、離散スパイク列車に入力データを送信し、スパース出力を返すことで、安価な情報処理を行うことができる。
そこで本研究では, スパイキングニューロン学習機構を用いて, 動的低ランクスパース視覚プロンプトを学習する新しいフレームワークである, <textbf{Lo}w-\textbf{R}ank visual \textbf{S}pike \textbf{P}rompting (LoRSP)を提案する。
LoRSPの基本的な考え方は、スパイキングニューロンの脳に誘発されるスパース発射機構を利用して、各インスタンスに対してピクセルレベルのスパースプロンプトを生成することである。
具体的には、まず低ランク因子分解を用いて一連のプロンプト因子を構築し、異なるプロンプト部分空間をキャプチャする。
これらのプロンプト要因はSNNアーキテクチャに入力され、インテグレート・アンド・ファイア・プロセスを実行してスパイクを発生させる。
その結果、LoRSPは低ランク制約を維持しながら、emph{sparse}ビジュアルプロンプトを生成する。
この設計は、インスタンス固有の選択的プロンプトを可能にし、様々な下流タスクにまたがるよりコンパクトで堅牢な適応をもたらす。
5つのヘテロジニアスなビジョンバックボーンと複数のベンチマークに関する大規模な実験は、LoRSPが既存のVPメソッドと比較して調整可能なパラメータを少なくしながら、競争性能を達成することを示した。
関連論文リスト
- PTS-SNN: A Prompt-Tuned Temporal Shift Spiking Neural Networks for Efficient Speech Emotion Recognition [12.087823767638788]
音声感情認識(SER)は人間とコンピュータのインタラクションに広く利用されているが、高い計算コストはリソースに制約のあるエッジデバイスの実装を妨げる。
本稿では, スパイキングダイナミクスを用いたパラメータ効率のよいニューロモルフィック適応である, Prompt-Tuned Spiking Neural Networks (PTS-SNN) を提案する。
論文 参考訳(メタデータ) (2026-02-09T03:29:16Z) - How deep is your network? Deep vs. shallow learning of transfer operators [0.4473327661758546]
我々は、データから転送演算子とそのスペクトル分解を学習するためのRaNNDyと呼ばれるランダム化ニューラルネットワークアプローチを提案する。
主な利点は、精度の顕著な低下がなければ、このアプローチがトレーニング時間とリソースを大幅に削減することです。
複素力学系の挙動解析に重要な応用があるクープマン作用素やペロン・フロベニウス作用素など、様々な力学作用素に対する結果を示す。
論文 参考訳(メタデータ) (2025-09-24T09:38:42Z) - PromptSR: Cascade Prompting for Lightweight Image Super-Resolution [20.796302187697364]
視覚変換器は画像超解像(SR)が大幅に進歩している
ウィンドウベースの自己意識モデリングのため、限られた受容領域の固有の課題に直面している。
本稿では,新しいプロンプト型軽量画像SR法であるPromptSRを提案する。
論文 参考訳(メタデータ) (2025-07-05T17:56:45Z) - Instance-Aware Graph Prompt Learning [71.26108600288308]
本稿では,インスタンス対応グラフプロンプト学習(IA-GPL)について紹介する。
このプロセスでは、軽量アーキテクチャを使用して各インスタンスの中間プロンプトを生成する。
複数のデータセットと設定で実施された実験は、最先端のベースラインと比較して、IA-GPLの優れたパフォーマンスを示している。
論文 参考訳(メタデータ) (2024-11-26T18:38:38Z) - DISCOVER: Making Vision Networks Interpretable via Competition and
Dissection [11.028520416752325]
この研究は、ポストホック解釈可能性、特にネットワーク分割に寄与する。
私たちのゴールは、視覚タスクで訓練されたネットワークにおいて、各ニューロンの個々の機能を容易に発見できるフレームワークを提供することです。
論文 参考訳(メタデータ) (2023-10-07T21:57:23Z) - FFEINR: Flow Feature-Enhanced Implicit Neural Representation for
Spatio-temporal Super-Resolution [4.577685231084759]
本稿では,フローフィールドデータの超高分解能化のための特徴強調型ニューラルインシシット表現(FFEINR)を提案する。
モデル構造とサンプリング分解能の観点から、暗黙のニューラル表現を最大限に活用することができる。
FFEINRのトレーニングプロセスは、入力層に機能拡張を導入することで容易になる。
論文 参考訳(メタデータ) (2023-08-24T02:28:18Z) - Deep Multi-Threshold Spiking-UNet for Image Processing [51.88730892920031]
本稿では,SNN(Spike Neural Networks)とU-Netアーキテクチャを組み合わせた,画像処理のためのスパイキング-UNetの概念を紹介する。
効率的なスパイキング-UNetを実現するためには,スパイクによる高忠実度情報伝播の確保と,効果的なトレーニング戦略の策定という2つの課題に直面する。
実験の結果,画像のセグメンテーションとデノイングにおいて,スパイキングUNetは非スパイキングと同等の性能を発揮することがわかった。
論文 参考訳(メタデータ) (2023-07-20T16:00:19Z) - Signal Processing for Implicit Neural Representations [80.38097216996164]
Inlicit Neural Representation (INR)は、マルチ層パーセプトロンを介して連続したマルチメディアデータを符号化する。
既存の作業は、その離散化されたインスタンスの処理を通じて、そのような連続的な表現を操作する。
本稿では,INSP-Netと呼ばれる暗黙的ニューラル信号処理ネットワークを提案する。
論文 参考訳(メタデータ) (2022-10-17T06:29:07Z) - RLPrompt: Optimizing Discrete Text Prompts With Reinforcement Learning [84.75064077323098]
本稿では、強化学習(RL)を用いた離散的高速最適化手法RLPromptを提案する。
RLPromptは、マスク付きジベリッシュ(例:grammaBERT)や左から右へのモデル(例:GPT)など、様々な種類のLMに柔軟に適用可能である。
少数ショット分類と教師なしテキストスタイル転送の実験は、既存のファインタニングやプロンプト手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2022-05-25T07:50:31Z) - Rectified Linear Postsynaptic Potential Function for Backpropagation in
Deep Spiking Neural Networks [55.0627904986664]
スパイキングニューラルネットワーク(SNN)は、時間的スパイクパターンを用いて情報を表現し、伝達する。
本稿では,情報符号化,シナプス可塑性,意思決定におけるスパイクタイミングダイナミクスの寄与について検討し,将来のDeepSNNやニューロモルフィックハードウェアシステムの設計への新たな視点を提供する。
論文 参考訳(メタデータ) (2020-03-26T11:13:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。