論文の概要: Msmsfnet: a multi-stream and multi-scale fusion net for edge detection
- arxiv url: http://arxiv.org/abs/2404.04856v1
- Date: Sun, 7 Apr 2024 08:03:42 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-09 19:20:53.172509
- Title: Msmsfnet: a multi-stream and multi-scale fusion net for edge detection
- Title(参考訳): エッジ検出のためのマルチストリーム・マルチスケール融合ネットMsmsfnet
- Authors: Chenguang Liu, Chisheng Wang, Feifei Dong, Xin Su, Chuanhua Zhu, Dejin Zhang, Qingquan Li,
- Abstract要約: エッジ検出は、コンピュータビジョンにおける長年の課題である。
最近のディープラーニングベースのアルゴリズムは、公開データセットで最先端のパフォーマンスを実現する。
我々は、現在最先端のディープラーニングベースのエッジ検出器によって、スクラッチからトレーニングされたときに、公開データセットで達成できる性能について検討する。
- 参考スコア(独自算出の注目度): 6.4599872230835045
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Edge detection is a long standing problem in computer vision. Recent deep learning based algorithms achieve state of-the-art performance in publicly available datasets. Despite the efficiency of these algorithms, their performance, however, relies heavily on the pretrained weights of the backbone network on the ImageNet dataset. This limits heavily the design space of deep learning based edge detectors. Whenever we want to devise a new model, we have to train this new model on the ImageNet dataset first, and then fine tune the model using the edge detection datasets. The comparison would be unfair otherwise. However, it is usually not feasible for many researchers to train a model on the ImageNet dataset due to the limited computation resources. In this work, we study the performance that can be achieved by state-of-the-art deep learning based edge detectors in publicly available datasets when they are trained from scratch, and devise a new network architecture, the multi-stream and multi scale fusion net (msmsfnet), for edge detection. We show in our experiments that by training all models from scratch to ensure the fairness of comparison, out model outperforms state-of-the art deep learning based edge detectors in three publicly available datasets.
- Abstract(参考訳): エッジ検出は、コンピュータビジョンにおける長年の課題である。
近年のディープラーニングに基づくアルゴリズムは、公開データセットにおける最先端のパフォーマンスを実現する。
これらのアルゴリズムの効率にもかかわらず、その性能はImageNetデータセット上のバックボーンネットワークの事前訓練された重みに大きく依存している。
これにより、ディープラーニングベースのエッジ検出器の設計スペースが大幅に制限される。
新しいモデルを考案したいときは、まずImageNetデータセットでこの新しいモデルをトレーニングし、それからエッジ検出データセットを使用してモデルを微調整する必要があります。
この比較は、さもなくば不公平だろう。
しかし、多くの研究者が限られた計算資源のためにImageNetデータセットでモデルをトレーニングすることは不可能である。
本研究では,現在最先端のディープラーニングに基づくエッジ検出器を用いて,スクラッチからトレーニングしたデータセットを公開し,新たなネットワークアーキテクチャ,マルチストリームおよびマルチスケールフュージョンネット(msmsfnet)を考案し,エッジ検出を行う。
実験では、すべてのモデルをスクラッチからトレーニングすることで、比較の公正性を確保することで、最先端のディープラーニングベースのエッジ検出器を3つの公開データセットで上回ります。
関連論文リスト
- Transfer Learning with Point Transformers [3.678615604632945]
Point Transformerは、Point Cloudデータの分類、セグメンテーション、検出のための最先端モデルである。
モデルNet10データセットに基づくこれらの注目ネットワークの分類性能について検討し、3次元MNISTデータセットを微調整後に分類するためにトレーニングされたモデルを用いた。
論文 参考訳(メタデータ) (2024-04-01T01:23:58Z) - Dataset Quantization [72.61936019738076]
大規模データセットを小さなサブセットに圧縮する新しいフレームワークであるデータセット量子化(DQ)を提案する。
DQは、ImageNet-1kのような大規模データセットを最先端圧縮比で蒸留する最初の方法である。
論文 参考訳(メタデータ) (2023-08-21T07:24:29Z) - Tiny and Efficient Model for the Edge Detection Generalization [0.0]
提案するTiny and Efficient Edge Detector(TEED)は,パラメータが5,8Kドルの軽量畳み込みニューラルネットワークである。
BIPEDデータセットのトレーニングには30分以上かかり、各エポックは5分未満である。
提案したモデルは訓練が容易で,予測されたエッジマップはクオリティが高く,初期のごく一部のエポック内に急速に収束する。
論文 参考訳(メタデータ) (2023-08-12T05:23:36Z) - Dense Extreme Inception Network for Edge Detection [0.0]
エッジ検出は多くのコンピュータビジョンアプリケーションの基礎となっている。
公開されているデータセットのほとんどは、エッジ検出タスクのためにキュレーションされていない。
エッジの新しいデータセットを提示する。
エッジ検出のためのDense Extreme Inception Network (DexiNed) と呼ばれる新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-12-04T05:38:50Z) - Efficient deep learning models for land cover image classification [0.29748898344267777]
土地利用土地被覆(LULC)画像分類のためのBigEarthNetデータセットを用いて実験を行った。
コンボリューションニューラルネットワーク、マルチ層パーセプトロン、ビジュアルトランスフォーマー、効率的なネットワーク、ワイド残留ネットワーク(WRN)など、さまざまな最先端モデルをベンチマークする。
提案する軽量モデルは、訓練可能なパラメータが桁違いに小さく、平均的なFスコア分類精度が19のLULCクラスすべてに対して4.5%向上し、ベースラインとして使用するResNet50の2倍高速に訓練される。
論文 参考訳(メタデータ) (2021-11-18T00:03:14Z) - Pixel Difference Networks for Efficient Edge Detection [71.03915957914532]
本稿では,Pixel Difference Network (PiDiNet) という軽量かつ効率的なエッジ検出アーキテクチャを提案する。
BSDS500、NYUD、Multicueのデータセットに関する大規模な実験が、その効果を示すために提供されている。
0.1M未満のパラメータを持つPiDiNetのより高速なバージョンは、200FPSのアーティファクトで同等のパフォーマンスを達成できる。
論文 参考訳(メタデータ) (2021-08-16T10:42:59Z) - Self-supervised Audiovisual Representation Learning for Remote Sensing
Data [70.64030011999981]
遠隔センシングにおける深層ニューラルネットワークの事前学習のための自己教師型アプローチを提案する。
ジオタグ付きオーディオ記録とリモートセンシングの対応を利用して、これは完全にラベルなしの方法で行われる。
提案手法は,既存のリモートセンシング画像の事前学習方法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-08-02T07:50:50Z) - Edge-Detect: Edge-centric Network Intrusion Detection using Deep Neural
Network [0.0]
エッジノードは、Internet-of-Thingsエンドポイント上の複数のサイバー攻撃を検出するために不可欠である。
DLM技術を用いてエッジノードに対するDoS攻撃を検知する,軽量で高速かつ高精度なEdge-Detectモデルを開発した。
論文 参考訳(メタデータ) (2021-02-03T04:24:34Z) - Improving Deep Stereo Network Generalization with Geometric Priors [93.09496073476275]
地上の真実が密集した多様な現実世界のシーンの大規模なデータセットを得ることは困難である。
多くのアルゴリズムは、似たようなシーンや合成データセットの小さな実世界のデータセットに依存している。
本稿では,シーン幾何学の事前知識をエンド・ツー・エンドのステレオネットワークに統合し,ネットワークの一般化を支援することを提案する。
論文 参考訳(メタデータ) (2020-08-25T15:24:02Z) - Saliency Enhancement using Gradient Domain Edges Merging [65.90255950853674]
本研究では,エッジとサリエンシマップをマージして,サリエンシマップの性能を向上させる手法を開発した。
これにより、DUT-OMRONデータセットの少なくとも3.4倍の平均的な改善により、エッジ(SEE)を使用したサリエンシ向上が提案された。
SEEアルゴリズムは前処理のためのSEE-Preと後処理のためのSEE-Postの2つの部分に分けられる。
論文 参考訳(メタデータ) (2020-02-11T14:04:56Z) - Neural Data Server: A Large-Scale Search Engine for Transfer Learning
Data [78.74367441804183]
我々は,ターゲットドメインに最も有用な転送学習データを見つけるための大規模検索エンジンであるNeural Data Server (NDS)を紹介した。
NDSは、いくつかの人気のある画像データセットをインデックスするデータサーバで構成され、クライアントにデータを推奨することを目的としている。
我々は,NDSが様々な伝達学習シナリオにおいて有効であることを示し,複数のターゲットデータセットに対して最先端の性能を示す。
論文 参考訳(メタデータ) (2020-01-09T01:21:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。