論文の概要: FourierMask: Instance Segmentation using Fourier Mapping in Implicit
Neural Networks
- arxiv url: http://arxiv.org/abs/2112.12535v1
- Date: Thu, 23 Dec 2021 13:42:32 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-24 19:41:07.672517
- Title: FourierMask: Instance Segmentation using Fourier Mapping in Implicit
Neural Networks
- Title(参考訳): FourierMask: ニューラルネットワークにおけるフーリエマッピングを用いたインスタンスセグメンテーション
- Authors: Hamd ul Moqeet Riaz, Nuri Benbarka, Timon Hoeffer, and Andreas Zell
- Abstract要約: 本稿では、Fourierシリーズと暗黙のニューラル表現を組み合わせてインスタンスセグメンテーションマスクを生成するFourierMaskを紹介する。
FourierMaskは同じ出力解像度でベースラインのMask R-CNNと比較してMSデータセット上での競合結果を示し、より高い解像度でそれを上回ります。
- 参考スコア(独自算出の注目度): 12.098176982535016
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present FourierMask, which employs Fourier series combined with implicit
neural representations to generate instance segmentation masks. We apply a
Fourier mapping (FM) to the coordinate locations and utilize the mapped
features as inputs to an implicit representation (coordinate-based multi-layer
perceptron (MLP)). FourierMask learns to predict the coefficients of the FM for
a particular instance, and therefore adapts the FM to a specific object. This
allows FourierMask to be generalized to predict instance segmentation masks
from natural images. Since implicit functions are continuous in the domain of
input coordinates, we illustrate that by sub-sampling the input pixel
coordinates, we can generate higher resolution masks during inference.
Furthermore, we train a renderer MLP (FourierRend) on the uncertain predictions
of FourierMask and illustrate that it significantly improves the quality of the
masks. FourierMask shows competitive results on the MS COCO dataset compared to
the baseline Mask R-CNN at the same output resolution and surpasses it on
higher resolution.
- Abstract(参考訳): 本稿では,フーリエ級数と暗黙のニューラル表現を組み合わせてインスタンス分割マスクを生成するフーリエマスクについて述べる。
座標位置にフーリエ写像(fm)を適用し,その特徴を暗黙的な表現(座標系多層パーセプトロン(mlp))への入力として利用する。
フーリエマスクは特定の場合のFMの係数を予測することを学び、したがって特定の対象にFMを適用する。
これにより、fouriermaskを一般化して、自然画像からインスタンスセグメンテーションマスクを予測することができる。
暗黙関数は入力座標の領域で連続であるため、入力画素座標をサブサンプリングすることで、推論中に高い解像度のマスクを生成することができる。
さらに,フーリエマスクの未知の予測に基づいてレンダラーmlp(fourierrend)を訓練し,マスクの品質を大幅に向上させることを示す。
FourierMaskは同じ出力解像度でベースラインのMask R-CNNと比較してMS COCOデータセットの競合結果を示し、より高い解像度でそれを上回る。
関連論文リスト
- DFormer: Diffusion-guided Transformer for Universal Image Segmentation [86.73405604947459]
提案したDFormerは,拡散モデルを用いて画像分割タスクをデノナイズプロセスとみなしている。
我々のDFormerは、ランダムに生成されたマスクの集合から、マスクとそれに対応するカテゴリを直接予測します。
我々のDFormerは、最近の拡散型汎光学分割法Pix2Seq-Dより優れており、MS COCO val 2017セットで3.6%向上している。
論文 参考訳(メタデータ) (2023-06-06T06:33:32Z) - QFF: Quantized Fourier Features for Neural Field Representations [28.82293263445964]
我々は、QFF(Quantized Fourier Features)を用いることで、モデルのサイズが小さくなり、トレーニングが速くなり、複数のアプリケーションの品質が向上することを示した。
QFFは簡単にコーディングでき、高速に計算でき、多くのニューラルネットワーク表現に加えてシンプルなドロップインとして機能する。
論文 参考訳(メタデータ) (2022-12-02T00:11:22Z) - Deep Fourier Up-Sampling [100.59885545206744]
フーリエ領域のアップサンプリングは、そのような局所的な性質に従わないため、より難しい。
これらの問題を解決するために理論的に健全なDeep Fourier Up-Sampling (FourierUp)を提案する。
論文 参考訳(メタデータ) (2022-10-11T06:17:31Z) - Masked Frequency Modeling for Self-Supervised Visual Pre-Training [102.89756957704138]
MFM(Masked Frequency Modeling)は、視覚モデルの自己教師付き事前学習のための統合周波数領域に基づくアプローチである。
MFMはまず入力画像の周波数成分の一部をマスクアウトし、周波数スペクトルの欠落周波数を予測する。
MFMは初めて、ViTとCNNの両方で、単純な非シームフレームワークは、以下のものを使って意味のある表現を学習できることを示した。
論文 参考訳(メタデータ) (2022-06-15T17:58:30Z) - Seeing Implicit Neural Representations as Fourier Series [13.216389226310987]
Inlicit Neural Representation (INR)は低次元問題領域における高周波関数を表現するために多層パーセプトロンを使用する。
これらの表現は、複雑な3Dオブジェクトやシーンに関連するタスクについて、最先端の結果を得た。
この研究は2つの方法間の接続を分析し、フーリエ写像されたパーセプトロンが構造的に1つの隠蔽層SIRENと似ていることを示す。
論文 参考訳(メタデータ) (2021-09-01T08:40:20Z) - Fourier Image Transformer [10.315102237565734]
自動回帰画像補完タスクは,低解像度入力による高分解能出力の予測と同等であることを示した。
CT(Computerd Tomography)画像再構成の文脈において,本手法の有用性を示す。
論文 参考訳(メタデータ) (2021-04-06T14:48:57Z) - DCT-Mask: Discrete Cosine Transform Mask Representation for Instance
Segmentation [50.70679435176346]
本稿では、離散コサイン変換(DCT)を用いて、高分解能二元格子マスクをコンパクトなベクトルに符号化することで、新しいマスク表現を提案する。
DCT-Maskと呼ばれるこの手法は、ほとんどのピクセルベースのインスタンスセグメンテーション手法に簡単に統合できる。
論文 参考訳(メタデータ) (2020-11-19T15:00:21Z) - Fourier Features Let Networks Learn High Frequency Functions in Low
Dimensional Domains [69.62456877209304]
単純なフーリエ特徴写像を通して入力点を渡すことで、多層パーセプトロンが高周波関数を学習できることを示す。
結果は、最先端の結果を達成するコンピュータビジョンとグラフィックの進歩に光を当てた。
論文 参考訳(メタデータ) (2020-06-18T17:59:11Z) - PointINS: Point-based Instance Segmentation [117.38579097923052]
POI(Point-of-Interest)機能によるインスタンスセグメンテーションにおけるマスク表現は、各インスタンスの高次元マスク機能を学ぶには、計算負荷が重いため、難しい。
本稿では、このマスク表現学習タスクを2つの抽出可能なモジュールに分解するインスタンス認識畳み込みを提案する。
インスタンス認識の畳み込みとともに、単純で実用的なインスタンスセグメンテーションアプローチであるPointINSを提案する。
論文 参考訳(メタデータ) (2020-03-13T08:24:58Z) - FourierNet: Compact mask representation for instance segmentation using
differentiable shape decoders [14.573513188682183]
形状ベクトルを予測する単一ショット・アンカーフリー・完全畳み込み型インスタンス分割法を提案する。
この形状ベクトルは高速な数値変換を用いてマスクの輪郭点に変換する。
形状ベクトル係数の自動重みバランスを管理する微分可能な形状デコーダを用いる。
論文 参考訳(メタデータ) (2020-02-07T10:54:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。