論文の概要: UPLiFT: Efficient Pixel-Dense Feature Upsampling with Local Attenders
- arxiv url: http://arxiv.org/abs/2601.17950v1
- Date: Sun, 25 Jan 2026 18:59:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-27 15:23:08.5562
- Title: UPLiFT: Efficient Pixel-Dense Feature Upsampling with Local Attenders
- Title(参考訳): UPLiFT: ローカライズアテンダーによる効率的なPixel-Dense機能アップサンプリング
- Authors: Matthew Walmer, Saksham Suri, Anirud Aggarwal, Abhinav Shrivastava,
- Abstract要約: UPLiFTはUniversal Pixel-Dense Lightweight Feature Transformsのアーキテクチャである。
われわれのLocal AttenderはUPLiFTがアップサンプリングを通じて安定した機能を維持できることを示している。
また,VAE機能アップサンプリングのための最先端の結合フローマッチングモデルと競合する性能を示す。
- 参考スコア(独自算出の注目度): 50.099672495919975
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The space of task-agnostic feature upsampling has emerged as a promising area of research to efficiently create denser features from pre-trained visual backbones. These methods act as a shortcut to achieve dense features for a fraction of the cost by learning to map low-resolution features to high-resolution versions. While early works in this space used iterative upsampling approaches, more recent works have switched to cross-attention-based methods, which risk falling into the same efficiency scaling problems of the backbones they are upsampling. In this work, we demonstrate that iterative upsampling methods can still compete with cross-attention-based methods; moreover, they can achieve state-of-the-art performance with lower inference costs. We propose UPLiFT, an architecture for Universal Pixel-dense Lightweight Feature Transforms. We also propose an efficient Local Attender operator to overcome the limitations of prior iterative feature upsampling methods. This operator uses an alternative attentional pooling formulation defined fully locally. We show that our Local Attender allows UPLiFT to maintain stable features throughout upsampling, enabling state-of-the-art performance with lower inference costs than existing pixel-dense feature upsamplers. In addition, we apply UPLiFT to generative downstream tasks and show that it achieves competitive performance with state-of-the-art Coupled Flow Matching models for VAE feature upsampling. Altogether, UPLiFT offers a versatile and efficient approach to creating denser features.
- Abstract(参考訳): タスクに依存しない機能アップサンプリングの空間は、トレーニング済みの視覚的バックボーンからより高密度な特徴を効率的に作成するための、将来性のある研究領域として現れてきた。
これらの手法は、低解像度の特徴を高解像度バージョンにマッピングすることを学ぶことで、コストのごく一部で高密度な特徴を達成するためのショートカットとして機能する。
この分野の初期の研究は反復的なアップサンプリングアプローチを使用していたが、最近の研究はクロスアテンションベースの手法に切り替えられ、アップサンプリングしているバックボーンの同じ効率スケーリング問題に陥るリスクがある。
本研究は,反復的なアップサンプリング手法がいまだにクロスアテンションに基づく手法と競合できることを示す。
本稿では,Universal Pixel-Dense Lightweight Feature TransformsのアーキテクチャであるUPLiFTを提案する。
また,従来の反復的機能アップサンプリング手法の限界を克服する効率的なローカルアテンダ演算子を提案する。
この作用素は、完全に局所的に定義された別の注意プールの定式化を使用する。
われわれのLocal AttenderはUPLiFTがアップサンプリングを通じて安定した機能を維持でき、既存のピクセル密度機能アップサンプラーよりも推論コストの低い最先端のパフォーマンスを実現していることを示す。
さらに、UPLiFTを下流タスク生成に適用し、VAE機能アップサンプリングのための最先端の結合フローマッチングモデルとの競合性能を実現することを示す。
さらにUPLiFTは、より高密度な機能を作成するための汎用的で効率的なアプローチを提供する。
関連論文リスト
- Upsample Anything: A Simple and Hard to Beat Baseline for Feature Upsampling [38.24831571443335]
Upsample Anythingは、低解像度の機能をトレーニングなしで高解像度のピクセル単位の出力に復元する。
224x224イメージあたりの$approx0.419テキストのみで動作し、セマンティックセグメンテーション、深さ推定、深さと確率マップのアップサンプリングにおける最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-11-20T12:27:53Z) - AnyUp: Universal Feature Upsampling [90.67845351280933]
AnyUpはどんな視覚機能にもどんな解像度でも適用できる機能アップサンプリングのメソッドです。
DINOやCLIPのような既存の学習ベースのアップサンプラーは、すべての機能抽出器で再トレーニングする必要がある。
論文 参考訳(メタデータ) (2025-10-14T17:45:17Z) - LoftUp: Learning a Coordinate-Based Feature Upsampler for Vision Foundation Models [27.379438040350188]
機能アップサンプリングは、この問題に対処するための有望な方向を提供する。
本稿では,高分解能画像を座標と低分解能VFM特徴と統合した座標ベースのクロスアテンション変換器を提案する。
提案手法は, 細かな細部を効果的に捉え, 様々な入力や特徴の分解能に柔軟に適用する。
論文 参考訳(メタデータ) (2025-04-18T18:46:08Z) - A Refreshed Similarity-based Upsampler for Direct High-Ratio Feature Upsampling [54.05517338122698]
一般的な類似性に基づく機能アップサンプリングパイプラインが提案されている。
本稿では,セマンティック・アウェアとディテール・アウェアの両方の観点から,明示的に制御可能なクエリキー機能アライメントを提案する。
我々は,モーザイクアーティファクトを緩和する上ではシンプルだが有効であるHR特徴に対して,きめ細かな近傍選択戦略を開発する。
論文 参考訳(メタデータ) (2024-07-02T14:12:21Z) - BIMS-PU: Bi-Directional and Multi-Scale Point Cloud Upsampling [60.257912103351394]
我々はBIMS-PUと呼ばれる新しいポイント・クラウド・アップサンプリング・パイプラインを開発した。
対象のサンプリング因子を小さな因子に分解することにより,アップ/ダウンサンプリング手順をいくつかのアップ/ダウンサンプリングサブステップに分解する。
提案手法は最先端手法よりも優れた結果が得られることを示す。
論文 参考訳(メタデータ) (2022-06-25T13:13:37Z) - Hybrid Pixel-Unshuffled Network for Lightweight Image Super-Resolution [64.54162195322246]
畳み込みニューラルネットワーク(CNN)は画像超解像(SR)において大きな成功を収めた
ほとんどのディープCNNベースのSRモデルは、高い性能を得るために大量の計算を処理している。
SRタスクに効率的かつ効果的なダウンサンプリングモジュールを導入することで,HPUN(Hybrid Pixel-Unshuffled Network)を提案する。
論文 参考訳(メタデータ) (2022-03-16T20:10:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。