論文の概要: NeurIPS 2019 Disentanglement Challenge: Improved Disentanglement through
Aggregated Convolutional Feature Maps
- arxiv url: http://arxiv.org/abs/2002.10003v1
- Date: Sun, 23 Feb 2020 22:35:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-29 09:00:19.112741
- Title: NeurIPS 2019 Disentanglement Challenge: Improved Disentanglement through
Aggregated Convolutional Feature Maps
- Title(参考訳): NeurIPS 2019 Disentanglement Challenge: Aggregated Convolutional Feature Mapsによるディスタングルの改善
- Authors: Maximilian Seitzer
- Abstract要約: 本稿では,VAEのトレーニングのための簡単な画像前処理手法を提案する。
特に,ImageNet 上で事前学習した CNN から抽出した領域集約型特徴写像を提案する。
提案手法は,NeurIPS 2019 disentanglement Challengeのステージ1で2位となった。
- 参考スコア(独自算出の注目度): 2.538209532048867
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This report to our stage 1 submission to the NeurIPS 2019 disentanglement
challenge presents a simple image preprocessing method for training VAEs
leading to improved disentanglement compared to directly using the images. In
particular, we propose to use regionally aggregated feature maps extracted from
CNNs pretrained on ImageNet. Our method achieved the 2nd place in stage 1 of
the challenge. Code is available at
https://github.com/mseitzer/neurips2019-disentanglement-challenge.
- Abstract(参考訳): 本報告は,NeurIPS 2019 disentanglement Challengeへのステージ1への提出で,VAEをトレーニングするための簡単な画像前処理手法を提案する。
特に,ImageNet 上で事前学習した CNN から抽出した領域集約型特徴写像を提案する。
本手法は,挑戦のステージ1で2位となった。
コードはhttps://github.com/mseitzer/neurips2019-disentanglement-challengeで入手できる。
関連論文リスト
- AIM 2024 Sparse Neural Rendering Challenge: Methods and Results [64.19942455360068]
本稿では,ECCV 2024と共同で開催されるAIM(Advanceds in Image Manipulation)ワークショップの一部であるスパースニューラルレンダリングの課題についてレビューする。
この課題は、スパース画像から多様なシーンを合成する新しいカメラビューを作ることである。
参加者は、Pak Signal-to-Noise Ratio (PSNR) 測定によって測定された地中真実像に対する客観的忠実度を最適化するよう依頼される。
論文 参考訳(メタデータ) (2024-09-23T14:17:40Z) - Enhanced Semantic Segmentation Pipeline for WeatherProof Dataset Challenge [2.722639169181398]
本報告では、WeatherProofデータセットチャレンジの勝利ソリューションについて述べる。
本稿では,この課題に対するセマンティックセグメンテーションパイプラインの強化を提案する。
我々は、より広い視角を持つ新しいデータセットであるWeatherProofExtraを導入し、データ拡張手法を採用した。
私たちのソリューションは、最終リーダーボードで1位にランクされています。
論文 参考訳(メタデータ) (2024-06-06T07:12:50Z) - Deblurring Photographs of Characters Using Deep Neural Networks [0.5156484100374059]
我々はヘルシンキ・デブロワー・チャレンジ(HDC 2021)へのアプローチを提示する。
課題は、ポイントスプレッド機能(PSF)を知らずに文字のイメージを損なうことである。
まず,鮮明な画像と鮮明な画像との整合性を推定し,第2に準ニュートン法を用いてPSFを推定し,第3に,鮮明な画像から鮮明な画像を再構成するための深部畳み込みニューラルネットワークを訓練する。
論文 参考訳(メタデータ) (2022-05-30T12:32:26Z) - 1st Place Solutions for UG2+ Challenge 2021 -- (Semi-)supervised Face
detection in the low light condition [13.241328369629453]
UG2+ Challenge in UG2+ Challenge in CVPR 2021
一般的な画像強調法と画像転送法を用いていくつかの実験を行い、より近い領域に低照度画像と正常画像を引き寄せた。
テストセットでmAP 74.89を達成し、最終リーダーボードで1位となったモデルをいくつかまとめる。
論文 参考訳(メタデータ) (2021-07-02T04:12:23Z) - Learning Semantic Person Image Generation by Region-Adaptive
Normalization [81.52223606284443]
ポーズと外観の翻訳を扱う新しい2段階フレームワークを提案する。
第1段階では,対象意味解析マップを予測し,ポーズ転送の難しさを解消する。
第2段階では,領域適応正規化を組み込んだ新たな人物画像生成手法を提案する。
論文 参考訳(メタデータ) (2021-04-14T06:51:37Z) - Image Restoration by Deep Projected GSURE [115.57142046076164]
Ill-posed inverse problem は、デブロアリングや超解像など、多くの画像処理アプリケーションに現れる。
本稿では,一般化されたSteinUnbiased Risk Estimator(GSURE)の「投影変換」とCNNによる潜在画像のパラメータ化を含む損失関数の最小化に基づく,新たな画像復元フレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-04T08:52:46Z) - 1st Place Solutions for OpenImage2019 -- Object Detection and Instance
Segmentation [116.25081559037872]
この記事では,2つのチャンピオンチーム,検出トラックのMMfruit'とセグメンテーショントラックのMMfruitSeg'のソリューションについて,OpenImage Challenge 2019で紹介する。
一般に、対象検出器の場合、バックボーンの端の共有特徴は分類と回帰の両方に適さないことが知られている。
自己学習型最適特徴抽出によりオブジェクトの分類と回帰を分離するデカップリングヘッド(DH)を提案する。
論文 参考訳(メタデータ) (2020-03-17T06:45:07Z) - Top-1 Solution of Multi-Moments in Time Challenge 2019 [56.15819266653481]
一般的な画像に基づく行動認識手法であるTRN, TSN, TSMを用いて, 実験を行った。
高速かつ正確な認識に向けて,新しい時間的インターレースネットワークを提案する。
我々は上記の全てのモデルをアンサンブルし、検証セットで67.22%、テストセットで60.77%を獲得し、最終リーダーボードで1位となった。
論文 参考訳(メタデータ) (2020-03-12T15:11:38Z) - NeurIPS 2019 Disentanglement Challenge: Improved Disentanglement through
Learned Aggregation of Convolutional Feature Maps [2.8360662552057323]
我々は,ImageNetデータベース上で事前学習したネットワークから得られた地域的に集約された特徴マップに基づいて,変分オートエンコーダを訓練することを提案する。
当社のアプローチは,2019年のNeurIPS Disentanglement Challengeのステージ2で2位を獲得しました。
論文 参考訳(メタデータ) (2020-02-27T08:46:17Z) - Lipreading using Temporal Convolutional Networks [57.41253104365274]
現在の単語認識モデルは,残差ネットワークと双方向Gated Recurrent Unit層で構成されている。
このモデルの限界に対処し、その性能をさらに向上させる変更を提案する。
提案モデルでは,これらのデータセットにおいてそれぞれ1.2%と3.2%の絶対的な改善が得られた。
論文 参考訳(メタデータ) (2020-01-23T17:49:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。