論文の概要: MC-MLP:Multiple Coordinate Frames in all-MLP Architecture for Vision
- arxiv url: http://arxiv.org/abs/2304.03917v1
- Date: Sat, 8 Apr 2023 05:23:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2023-04-11 19:02:35.005526
- Title: MC-MLP:Multiple Coordinate Frames in all-MLP Architecture for Vision
- Title(参考訳): MC-MLP:ビジョンのためのオールMLPアーキテクチャにおける複数座標フレーム
- Authors: Zhimin Zhu, Jianguo Zhao, Tong Mu, Yuliang Yang, Mengyu Zhu
- Abstract要約: 深層学習では、マルチコーディネート・パーセプトロン(MLP)が再び研究者から注目を集めている。
本稿では,コンピュータビジョンのための一般的な座標型バックボーンについて紹介する。
MC-MLPでは,特徴のフレームによって,同じ意味情報が学習の難易度が異なることが示唆された。
- 参考スコア(独自算出の注目度): 3.980814121685115
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In deep learning, Multi-Layer Perceptrons (MLPs) have once again garnered
attention from researchers. This paper introduces MC-MLP, a general MLP-like
backbone for computer vision that is composed of a series of fully-connected
(FC) layers. In MC-MLP, we propose that the same semantic information has
varying levels of difficulty in learning, depending on the coordinate frame of
features. To address this, we perform an orthogonal transform on the feature
information, equivalent to changing the coordinate frame of features. Through
this design, MC-MLP is equipped with multi-coordinate frame receptive fields
and the ability to learn information across different coordinate frames.
Experiments demonstrate that MC-MLP outperforms most MLPs in image
classification tasks, achieving better performance at the same parameter level.
The code will be available at: https://github.com/ZZM11/MC-MLP.
- Abstract(参考訳): ディープラーニングでは、MLP(Multi-Layer Perceptrons)が再び研究者から注目を集めている。
本稿では,コンピュータビジョンのための汎用MLPライクなバックボーンであるMC-MLPについて紹介する。
MC-MLPでは,特徴の座標フレームによって,同じ意味情報が学習の難易度が異なることが示唆された。
これに対処するために、特徴情報の直交変換を行い、特徴の座標フレームを変更することに相当する。
この設計により、mc-mlpは多重座標フレーム受容フィールドと異なる座標フレーム間で情報を学習する能力を備えている。
実験により、MC-MLPは画像分類タスクにおいてほとんどのMLPよりも優れており、同じパラメータレベルでより優れた性能が得られることが示された。
コードは、https://github.com/ZZM11/MC-MLP.comで入手できる。
関連論文リスト
- X-MLP: A Patch Embedding-Free MLP Architecture for Vision [4.493200639605705]
視覚のための多層パーセプトロン (MLP) アーキテクチャが再び人気となった。
X-MLPは、完全に接続された層上に完全に構築され、パッチの埋め込みが不要なアーキテクチャである。
X-MLPは10のベンチマークデータセットでテストされている。
論文 参考訳(メタデータ) (2023-07-02T15:20:25Z) - MLP-3D: A MLP-like 3D Architecture with Grouped Time Mixing [123.43419144051703]
ビデオ認識のための斬新な3Dアーキテクチャを提案する。
結果は、最先端の3D CNNやビデオに匹敵する。
論文 参考訳(メタデータ) (2022-06-13T16:21:33Z) - MDMLP: Image Classification from Scratch on Small Datasets with MLP [7.672827879118106]
近年,アテンション機構は自然言語処理やコンピュータビジョンタスクのゴーツーテクニックとなっている。
近年,マルチ層パーセプトロン(MLP)をベースとしたMixerなどのアーキテクチャも,CNNやアテンション技術と比較して強力である。
論文 参考訳(メタデータ) (2022-05-28T16:26:59Z) - RepMLPNet: Hierarchical Vision MLP with Re-parameterized Locality [113.1414517605892]
そこで本研究では,FC層に局所前処理を組み込む手法であるLocality Injectionを提案する。
RepMLPNetはCityscapesセマンティックセグメンテーションにシームレスに移行した最初の企業である。
論文 参考訳(メタデータ) (2021-12-21T10:28:17Z) - An Image Patch is a Wave: Phase-Aware Vision MLP [54.104040163690364]
マルチレイヤパーセプトロン(MLP)は、完全に接続されたレイヤのみを積み重ねた、非常に単純なアーキテクチャを持つ新しいタイプの視覚モデルである。
本稿では,各トークンを振幅と位相の2つの部分を持つ波動関数として表現することを提案する。
実験により、提案したWave-MLPは、様々な視覚タスクにおける最先端アーキテクチャよりも優れていることが示された。
論文 参考訳(メタデータ) (2021-11-24T06:25:49Z) - Hire-MLP: Vision MLP via Hierarchical Rearrangement [58.33383667626998]
Hire-MLPは、再配置によるシンプルだが競合する視覚アーキテクチャである。
提案したHire-MLPアーキテクチャは、単純なチャネル混合操作で構築されており、高い柔軟性と推論速度を享受できる。
実験の結果,Herre-MLPはImageNet-1Kベンチマークで最先端のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2021-08-30T16:11:04Z) - CycleMLP: A MLP-like Architecture for Dense Prediction [26.74203747156439]
CycleMLPは視覚認識と密度予測のための汎用的なバックボーンである。
様々な画像サイズに対処でき、ローカルウィンドウを使用することで、画像サイズに対する線形計算の複雑さを実現する。
CycleMLPは、モデルに対するオブジェクト検出、インスタンスセグメンテーション、セマンティックセグメンテーションの競合するベースラインを提供することを目的としている。
論文 参考訳(メタデータ) (2021-07-21T17:23:06Z) - AS-MLP: An Axial Shifted MLP Architecture for Vision [50.11765148947432]
本稿では,Axial Shifted Architecture (AS-MLP)を提案する。
特徴写像のチャネルを軸シフトすることにより、AS-MLPは異なる方向から情報の流れを得ることができる。
提案したAS-MLPアーキテクチャでは,ImageNet-1Kデータセット上の88Mパラメータと15.2GFLOPを用いて,83.3%のTop-1精度が得られる。
論文 参考訳(メタデータ) (2021-07-18T08:56:34Z) - MLP-Mixer: An all-MLP Architecture for Vision [93.16118698071993]
マルチ層パーセプトロン(MLP)を基盤としたアーキテクチャ「Mixer」を発表。
Mixerはイメージ分類ベンチマークで競合スコアを獲得し、事前トレーニングと推論は最先端のモデルに匹敵する。
論文 参考訳(メタデータ) (2021-05-04T16:17:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。