論文の概要: FourierNet: Compact mask representation for instance segmentation using
differentiable shape decoders
- arxiv url: http://arxiv.org/abs/2002.02709v2
- Date: Mon, 19 Oct 2020 11:46:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-03 05:13:27.283476
- Title: FourierNet: Compact mask representation for instance segmentation using
differentiable shape decoders
- Title(参考訳): FourierNet: 可変形状デコーダを用いたインスタンスセグメンテーションのためのコンパクトマスク表現
- Authors: Hamd ul Moqeet Riaz, Nuri Benbarka and Andreas Zell
- Abstract要約: 形状ベクトルを予測する単一ショット・アンカーフリー・完全畳み込み型インスタンス分割法を提案する。
この形状ベクトルは高速な数値変換を用いてマスクの輪郭点に変換する。
形状ベクトル係数の自動重みバランスを管理する微分可能な形状デコーダを用いる。
- 参考スコア(独自算出の注目度): 14.573513188682183
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present FourierNet, a single shot, anchor-free, fully convolutional
instance segmentation method that predicts a shape vector. Consequently, this
shape vector is converted into the masks' contour points using a fast numerical
transform. Compared to previous methods, we introduce a new training technique,
where we utilize a differentiable shape decoder, which manages the automatic
weight balancing of the shape vector's coefficients. We used the Fourier series
as a shape encoder because of its coefficient interpretability and fast
implementation. FourierNet shows promising results compared to polygon
representation methods, achieving 30.6 mAP on the MS COCO 2017 benchmark. At
lower image resolutions, it runs at 26.6 FPS with 24.3 mAP. It reaches 23.3 mAP
using just eight parameters to represent the mask (note that at least four
parameters are needed for bounding box prediction only). Qualitative analysis
shows that suppressing a reasonable proportion of higher frequencies of Fourier
series, still generates meaningful masks. These results validate our
understanding that lower frequency components hold higher information for the
segmentation task, and therefore, we can achieve a compressed representation.
Code is available at: github.com/cogsys-tuebingen/FourierNet.
- Abstract(参考訳): 形状ベクトルを予測する単一ショット・アンカーフリー・完全畳み込み型インスタンスセグメンテーション法であるFourierNetを提案する。
これにより、この形状ベクトルは高速数値変換によりマスクの輪郭点に変換される。
従来の手法と比較して,形状ベクトル係数の自動重みバランスを管理する微分可能な形状デコーダを用いた新しいトレーニング手法を提案する。
フーリエ級数はその係数解釈可能性と高速な実装のために形状エンコーダとして使用した。
FourierNetはポリゴン表現法と比較して有望な結果を示し、MS COCO 2017ベンチマークで30.6 mAPを達成した。
低解像度では26.6 FPS、24.3 mAPで動作する。
マスクを表すために8つのパラメータのみを使用して23.3 mAPに達する(ボックスの予測のみに最低4つのパラメータが必要であることに注意)。
定性的分析により、フーリエ級数の高次周波数の合理的な比率の抑制は依然として有意義なマスクを生み出すことが示されている。
これらの結果は,低周波成分がセグメンテーションタスクの高次情報を保持することの理解を検証し,圧縮表現を実現できることを示す。
コードはgithub.com/cogsys-tuebingen/fouriernetで入手できる。
関連論文リスト
- Variable-size Symmetry-based Graph Fourier Transforms for image compression [65.7352685872625]
可変サイズのグラフフーリエ変換を符号化フレームワークに導入する。
提案アルゴリズムは,ノード間の特定の対称接続を追加することにより,グリッド上の対称グラフを生成する。
実験により、SBGFTは、明示的な多重変換選択に統合された一次変換よりも優れていることが示された。
論文 参考訳(メタデータ) (2024-11-24T13:00:44Z) - Progressive Token Length Scaling in Transformer Encoders for Efficient Universal Segmentation [67.85309547416155]
ユニバーサルセグメンテーションのための強力なアーキテクチャは、マルチスケールの画像特徴を符号化し、オブジェクトクエリをマスク予測にデコードするトランスフォーマーに依存している。
Mask2Formerはその計算の50%をトランスフォーマーエンコーダでのみ使用する。
これは、エンコーダ層ごとにすべてのバックボーン機能スケールのトークンレベルの完全な表現が保持されているためである。
本稿では,パフォーマンスの犠牲を最小限に抑えながら,計算量を大幅に削減するPro-SCALEを提案する。
論文 参考訳(メタデータ) (2024-04-23T01:34:20Z) - FFPN: Fourier Feature Pyramid Network for Ultrasound Image Segmentation [15.011573950064424]
超音波(US)画像セグメンテーションは多くのシナリオにおいてリアルタイムかつ高精度な解析を必要とする活発な研究領域である。
既存のアプローチは、不適切な輪郭符号化に悩まされるか、エンコードされた結果の有効活用に失敗する可能性がある。
本稿では,Fourier Feature Pyramid Network (FFPN) と呼ばれる新しいFourier-anchor-based DTSフレームワークについて述べる。
論文 参考訳(メタデータ) (2023-08-26T07:28:09Z) - Fourier-Net+: Leveraging Band-Limited Representation for Efficient 3D
Medical Image Registration [62.53130123397081]
U-Netスタイルのネットワークは、高密度変位場を予測するために、教師なし画像登録に一般的に利用される。
まず,コストのかかるU-Netスタイルの拡張パスをパラメータフリーモデル駆動デコーダに置き換えるFourier-Netを提案する。
次に、Fourier-Net+を導入し、さらに画像の帯域制限空間表現を入力とし、U-Netスタイルのネットワークの収縮経路における畳み込み層の数を減少させる。
論文 参考訳(メタデータ) (2023-07-06T13:57:12Z) - Filter Pruning for Efficient CNNs via Knowledge-driven Differential
Filter Sampler [103.97487121678276]
フィルタプルーニングは同時に計算を加速し、CNNのメモリオーバーヘッドを低減する。
本稿では,MFM(Masked Filter Modeling)フレームワークを用いた知識駆動型微分フィルタサンプリング(KDFS)を提案する。
論文 参考訳(メタデータ) (2023-07-01T02:28:41Z) - Fourier-Net: Fast Image Registration with Band-limited Deformation [16.894559169947055]
教師なし画像登録では、全解像度空間領域における密度変位場を予測するためにU-Netスタイルのネットワークが一般的である。
本稿では,パラメータフリーモデル駆動デコーダを用いて,U-Netスタイルネットワークにおける拡張パスを置き換えるフーリエネットを提案する。
論文 参考訳(メタデータ) (2022-11-29T16:24:06Z) - Deep Fourier Up-Sampling [100.59885545206744]
フーリエ領域のアップサンプリングは、そのような局所的な性質に従わないため、より難しい。
これらの問題を解決するために理論的に健全なDeep Fourier Up-Sampling (FourierUp)を提案する。
論文 参考訳(メタデータ) (2022-10-11T06:17:31Z) - FourierMask: Instance Segmentation using Fourier Mapping in Implicit
Neural Networks [12.098176982535016]
本稿では、Fourierシリーズと暗黙のニューラル表現を組み合わせてインスタンスセグメンテーションマスクを生成するFourierMaskを紹介する。
FourierMaskは同じ出力解像度でベースラインのMask R-CNNと比較してMSデータセット上での競合結果を示し、より高い解像度でそれを上回ります。
論文 参考訳(メタデータ) (2021-12-23T13:42:32Z) - FNet: Mixing Tokens with Fourier Transforms [0.578717214982749]
Transformerエンコーダアーキテクチャは、限られた精度コストで大幅に高速化できることを示しています。
入力トークンを「混合」する単純な線形変換に自己着脱部分層を置き換える。
FNetと呼ばれる結果のモデルは、長い入力に対して非常に効率的にスケールします。
論文 参考訳(メタデータ) (2021-05-09T03:32:48Z) - PointINS: Point-based Instance Segmentation [117.38579097923052]
POI(Point-of-Interest)機能によるインスタンスセグメンテーションにおけるマスク表現は、各インスタンスの高次元マスク機能を学ぶには、計算負荷が重いため、難しい。
本稿では、このマスク表現学習タスクを2つの抽出可能なモジュールに分解するインスタンス認識畳み込みを提案する。
インスタンス認識の畳み込みとともに、単純で実用的なインスタンスセグメンテーションアプローチであるPointINSを提案する。
論文 参考訳(メタデータ) (2020-03-13T08:24:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。