Fugu-MT 論文翻訳(概要): SCT: A Simple Baseline for Parameter-Efficient Fine-Tuning via Salient Channels

論文の概要: SCT: A Simple Baseline for Parameter-Efficient Fine-Tuning via Salient Channels

arxiv url: http://arxiv.org/abs/2309.08513v5
Date: Mon, 29 Apr 2024 16:20:23 GMT
ステータス: 翻訳完了
システム内更新日: 2024-05-01 00:54:37.978653
Title: SCT: A Simple Baseline for Parameter-Efficient Fine-Tuning via Salient Channels
Title（参考訳）: SCT:Salient Channelsを用いたパラメータ効率の良いファインチューニングのための簡易ベースライン
Authors: Henry Hengyuan Zhao, Pichao Wang, Yuyang Zhao, Hao Luo, Fan Wang, Mike Zheng Shou,
Abstract要約: そこで本研究では,Salient Channel Tuning (SCT) と呼ばれる簡易かつ効果的な手法を提案する。 19の視覚的伝達学習の下流タスクに対する実験により、SCTは19のタスクのうち18のタスクにおいて、完全な微調整よりも優れていることが示された。
参考スコア（独自算出の注目度）: 37.82186536415279
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Pre-trained vision transformers have strong representation benefits to various downstream tasks. Recently, many parameter-efficient fine-tuning (PEFT) methods have been proposed, and their experiments demonstrate that tuning only 1\% extra parameters could surpass full fine-tuning in low-data resource scenarios. However, these methods overlook the task-specific information when fine-tuning diverse downstream tasks. In this paper, we propose a simple yet effective method called "Salient Channel Tuning" (SCT) to leverage the task-specific information by forwarding the model with the task images to select partial channels in a feature map that enables us to tune only 1/8 channels leading to significantly lower parameter costs. Experiments on 19 visual transfer learning downstream tasks demonstrate that our SCT outperforms full fine-tuning on 18 out of 19 tasks by adding only 0.11M parameters of the ViT-B, which is 780$\times$ fewer than its full fine-tuning counterpart. Furthermore, experiments on domain generalization and few-shot classification further demonstrate the effectiveness and generic of our approach. The code is available at https://github.com/showlab/SCT.
Abstract（参考訳）: 事前学習された視覚変換器は、様々な下流タスクに強力な表現上の利点がある。近年,多くのパラメータ効率細調整法が提案されており,その実験により,低データのリソースシナリオにおいて,パラメータの調整が完全な微調整を超えることが示されている。しかし、これらの手法は、様々な下流タスクを微調整する際、タスク固有の情報を見落としている。本稿では,SCT(Salient Channel Tuning)と呼ばれる簡易かつ効果的な手法を提案する。タスクイメージをモデルに転送し,特徴マップ内の部分的なチャネルを選択することで,パラメータコストを大幅に低減する1/8チャネルのみをチューニングできる。 19の視覚的伝達学習タスクの実験では、SCTは19のタスクのうち18のタスクに対して、完全な微調整よりも780$\times$のVT-Bのパラメータをわずか0.11M加えることで、完全な微調整よりも優れていた。さらに、ドメインの一般化と少数ショット分類に関する実験は、我々のアプローチの有効性と汎用性をさらに示している。コードはhttps://github.com/showlab/SCTで公開されている。

関連論文リスト

TR-PTS: Task-Relevant Parameter and Token Selection for Efficient Tuning [41.097430916756]
大規模な事前学習モデルは視覚タスクにおいて顕著な性能を達成するが、高い計算と記憶コストのために微調整には実用的ではない。タスク関連性を提案する。そしてToken Selection (TR-PTS)は、計算効率と精度の両方を向上させるタスク駆動フレームワークである。 FGVCとVTAB-1kを含むベンチマークでTR-PTSを評価し,それぞれ3.40%,10.35%の微調整を達成した。
論文参考訳（メタデータ） (2025-07-30T17:47:13Z)
Parameter-Free Fine-tuning via Redundancy Elimination for Vision Foundation Models [29.977749265185917]
本稿では,SAMモデルの冗長性を考察し,新しいパラメータフリー微調整法を提案する。パラメータを調整する従来の微調整手法とは異なり、本手法は事前訓練された特徴の選択、再利用、強化を強調する。ドメイン外のデータセットとドメイン内データセットの両方で実験を行い、本手法の有効性と有効性を示した。
論文参考訳（メタデータ） (2025-04-11T18:44:27Z)
Hierarchical Side-Tuning for Vision Transformers [33.536948382414316]
微調整された事前訓練された視覚変換器(ViTs)は、視覚認識タスクの強化に大きく貢献している。 PETLは、完全な微調整に比べてパラメータ更新が少なく、高いパフォーマンスを実現する可能性がある。本稿では,多様な下流タスクへのVTモデルの転送を容易にする革新的PETL手法である階層側チューニング(HST)を紹介する。
論文参考訳（メタデータ） (2023-10-09T04:16:35Z)
Regularized Mask Tuning: Uncovering Hidden Knowledge in Pre-trained Vision-Language Models [89.07925369856139]
我々は,学習可能な選択によってネットワークパラメータをマスクする,正規化マスクチューニングと呼ばれる新しいタイプのチューニング手法を設計する。神経経路にインスパイアされた我々は、下流タスクに必要な知識は、既にトレーニング済みの重みの中に存在するが、上流のトレーニング済みの段階では隠されていると論じる。平均2.56%のパラメータをマスキングすることで、ゼロショットのCLIPと比較して18.73%のパフォーマンス改善を実現しています。
論文参考訳（メタデータ） (2023-07-27T17:56:05Z)
Sensitivity-Aware Visual Parameter-Efficient Fine-Tuning [91.5113227694443]
私たちは新しいビジュアルを提案します。 Sensuous-Aware Fine-Tuning (SPT) スキーム。 SPTはタスク固有の重要な位置にトレーニング可能なパラメータを割り当てる。ダウンストリーム認識タスクの幅広い実験により,SPTは既存のPEFT法と相補的であることが示された。
論文参考訳（メタデータ） (2023-03-15T12:34:24Z)
Evaluating Parameter-Efficient Transfer Learning Approaches on SURE Benchmark for Speech Understanding [40.27182770995891]
ファインチューニングは、事前訓練されたモデルからのトランスファー学習のデフォルトアルゴリズムとして広く使われている。本稿では,様々な音声処理タスクに対するパラメータ効率学習のための音声不確定評価(SURE)ベンチマークを提案する。
論文参考訳（メタデータ） (2023-03-02T08:57:33Z)
Scaling & Shifting Your Features: A New Baseline for Efficient Model Tuning [126.84770886628833]
既存の微調整法は、事前訓練されたモデルの全てのパラメータ(フル微調整)をチューニングするか、最後の線形層(線形プローブ)のみをチューニングする。そこで本研究では,SSFと呼ばれるパラメータ効率の高いファインタニング手法を提案する。
論文参考訳（メタデータ） (2022-10-17T08:14:49Z)
Parameter-Efficient Image-to-Video Transfer Learning [66.82811235484607]
様々な下流タスクのための大規模な事前訓練されたモデルが、最近、有望なパフォーマンスで登場した。モデルのサイズが拡大しているため、モデルトレーニングや記憶の面では、標準のフルチューニングベースのタスク適応戦略がコストがかかる。本稿では,ビデオタスク毎のパラメータ効率の高い微調整のための新しいスペーシ・アダプタを提案する。
論文参考訳（メタデータ） (2022-06-27T18:02:29Z)
Few-Shot Parameter-Efficient Fine-Tuning is Better and Cheaper than In-Context Learning [81.3514358542452]
ICL (Few-shot in-context Learning) は、予測を行うたびにトレーニング例を全て処理するので、かなりの計算、メモリ、ストレージコストを発生させる。パラメータ効率の良い微調整は、モデルの新たなタスクの実行を可能にするために、小さなパラメータセットをトレーニングする、代替パラダイムを提供する。本稿では,少数ショットICLとパラメータ効率の微調整を厳密に比較し,後者が計算コストを劇的に削減できることを示す。
論文参考訳（メタデータ） (2022-05-11T17:10:41Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。