論文の概要: COLORA: Efficient Fine-Tuning for Convolutional Models with a Study Case on Optical Coherence Tomography Image Classification
- arxiv url: http://arxiv.org/abs/2505.18315v2
- Date: Mon, 20 Oct 2025 23:41:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:06.629175
- Title: COLORA: Efficient Fine-Tuning for Convolutional Models with a Study Case on Optical Coherence Tomography Image Classification
- Title(参考訳): COLORA:光コヒーレンス・トモグラフィー画像分類による畳み込みモデルの効率的な微調整
- Authors: Mariano Rivera, Angello Hoyos,
- Abstract要約: CoLoRAは畳み込みニューラルネットワーク(CNN)のためのパラメータ効率の良い微調整法である
OCNISTTMv2では、VGG16とResNet50に適用されたCoLoRAは、強いベースラインよりも最大1%の精度と0.013のAUC改善を実現している。
以上の結果から,CoLoRAは医用画像分類のための完全微調整に代わる安定かつ効果的な代替手段であることが示された。
- 参考スコア(独自算出の注目度): 2.7501248535328315
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We introduce CoLoRA (Convolutional Low-Rank Adaptation), a parameter-efficient fine-tuning method for convolutional neural networks (CNNs). CoLoRA extends LoRA to convolutional layers by decomposing kernel updates into lightweight depthwise and pointwise components.This design reduces the number of trainable parameters to 0.2 compared to conventional fine-tuning, preserves the original model size, and allows merging updates into the pretrained weights after each epoch, keeping inference complexity unchanged. On OCTMNISTv2, CoLoRA applied to VGG16 and ResNet50 achieves up to 1 percent accuracy and 0.013 AUC improvements over strong baselines (Vision Transformers, state-space, and Kolmogorov Arnold models) while reducing per-epoch training time by nearly 20 percent. Results indicate that CoLoRA provides a stable and effective alternative to full fine-tuning for medical image classification.
- Abstract(参考訳): 本稿では,畳み込みニューラルネットワーク(CNN)のためのパラメータ効率の良い微調整手法であるCoLoRAを紹介する。
この設計では、トレーニング可能なパラメータの数を従来の微調整に比べて0.2に減らし、オリジナルのモデルサイズを保ち、各エポック後のトレーニング済み重みへの更新をマージし、推論複雑性を一定に保ちながら、カーネルの更新を軽量な深度およびポイントワイドコンポーネントに分解することで、LoRAを拡張している。
OCTMNISTv2では、VGG16とResNet50に適用されたCoLoRAは、強力なベースライン(ビジョントランスフォーマー、ステートスペース、コルモゴロフアーノルドモデル)よりも最大1%の精度と0.013のAUC改善を実現し、画期的なトレーニング時間を約20%短縮した。
以上の結果から,CoLoRAは医用画像分類のための完全微調整に代わる安定かつ効果的な代替手段であることが示された。
関連論文リスト
- Distillation-Supervised Convolutional Low-Rank Adaptation for Efficient Image Super-Resolution [19.22142805041799]
畳み込みニューラルネットワーク(CNN)は画像の高解像度化に広く利用されている。
本稿では,DSCLoRA(Distillation-Supervised Convolutional Low-Rank Adaptation)を提案する。
論文 参考訳(メタデータ) (2025-04-15T15:12:57Z) - DIPLI: Deep Image Prior Lucky Imaging for Blind Astronomical Image Restoration [2.7523980737007414]
アストロフォトグラフィーは、訓練データに制限があるため、ディープラーニングに固有の課題を提示する。
この研究は、ブラインドトレーニングを促進するが過度に適合する可能性のあるDeep Image Prior(DIP)モデルのようなハイブリッド戦略を探求する。
本稿では,DIPモデルのベースライン性能を改良する手法を提案する。
論文 参考訳(メタデータ) (2025-03-20T09:33:16Z) - A-SDM: Accelerating Stable Diffusion through Model Assembly and Feature Inheritance Strategies [51.7643024367548]
安定拡散モデルは、テキスト・ツー・イメージ(T2I)と画像・ツー・イメージ(I2I)生成のための一般的かつ効果的なモデルである。
本研究では、SDMにおける冗長計算の削減と、チューニング不要とチューニング不要の両方の手法によるモデルの最適化に焦点をあてる。
論文 参考訳(メタデータ) (2024-05-31T21:47:05Z) - Contrastive-Adversarial and Diffusion: Exploring pre-training and fine-tuning strategies for sulcal identification [3.0398616939692777]
対人学習、コントラスト学習、拡散認知学習、通常の再構成学習といった技術が標準となっている。
この研究は、ニューラルネットワークの学習プロセスを強化するために、事前学習技術と微調整戦略の利点を解明することを目的としている。
論文 参考訳(メタデータ) (2024-05-29T15:44:51Z) - Low-resolution Prior Equilibrium Network for CT Reconstruction [3.5639148953570836]
本稿では,低分解能画像を導入し,ネットワークの堅牢性を改善するための効果的な正規化項を得る,新しいディープラーニングベースのCT再構成モデルを提案する。
狭角化と狭角化の両問題を実験的に検討し, ノイズ低減, コントラスト・ツー・ノイズ比, エッジ細部保存の両面において, エンド・ツー・エンドの低分解能事前平衡モデルが他の最先端手法よりも優れていることを示した。
論文 参考訳(メタデータ) (2024-01-28T13:59:58Z) - A-SDM: Accelerating Stable Diffusion through Redundancy Removal and
Performance Optimization [54.113083217869516]
本研究ではまず,ネットワークの計算冗長性について検討する。
次に、モデルの冗長性ブロックをプルークし、ネットワーク性能を維持する。
第3に,計算集約型注意部を高速化するグローバル地域対話型注意(GRI)を提案する。
論文 参考訳(メタデータ) (2023-12-24T15:37:47Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - ARHNet: Adaptive Region Harmonization for Lesion-aware Augmentation to
Improve Segmentation Performance [61.04246102067351]
本研究では,合成画像をよりリアルに見せるために,前景調和フレームワーク(ARHNet)を提案する。
実画像と合成画像を用いたセグメンテーション性能の向上に本手法の有効性を実証する。
論文 参考訳(メタデータ) (2023-07-02T10:39:29Z) - Accelerating Multiframe Blind Deconvolution via Deep Learning [0.0]
地上からの太陽画像の復元は計算に費用がかかる手続きである。
本稿では,アルゴリズムのアンロールに基づく復元を高速化する手法を提案する。
両手法が標準最適化法と比較して復元時間を大幅に短縮することを示した。
論文 参考訳(メタデータ) (2023-06-21T07:53:00Z) - Learning Deformable Image Registration from Optimization: Perspective,
Modules, Bilevel Training and Beyond [62.730497582218284]
マルチスケールの伝搬により微分同相モデルを最適化する,新しいディープラーニングベースのフレームワークを開発した。
我々は,脳MRIデータにおける画像-アトラス登録,肝CTデータにおける画像-画像登録を含む,3次元ボリュームデータセットにおける画像登録実験の2つのグループを実行する。
論文 参考訳(メタデータ) (2020-04-30T03:23:45Z) - Cascaded Deep Video Deblurring Using Temporal Sharpness Prior [88.98348546566675]
提案アルゴリズムは主に,中間潜水フレームと潜水フレームの復元ステップから光フローを推定する。
まず、中間潜伏フレームから光フローを推定し、推定した光フローに基づいて潜伏フレームを復元する深部CNNモデルを開発する。
ビデオデブロアリングのドメイン知識を探索することで、深層CNNモデルをよりコンパクトで効率的なものにすることができることを示す。
論文 参考訳(メタデータ) (2020-04-06T09:13:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。