論文の概要: NeurIPS 2019 Disentanglement Challenge: Improved Disentanglement through
Learned Aggregation of Convolutional Feature Maps
- arxiv url: http://arxiv.org/abs/2002.12356v2
- Date: Tue, 17 Nov 2020 15:16:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-28 07:21:09.972823
- Title: NeurIPS 2019 Disentanglement Challenge: Improved Disentanglement through
Learned Aggregation of Convolutional Feature Maps
- Title(参考訳): NeurIPS 2019 Disentanglement Challenge: 畳み込み特徴マップの学習的集約による絡み合いの改善
- Authors: Maximilian Seitzer, Andreas Foltyn, Felix P. Kemeth
- Abstract要約: 我々は,ImageNetデータベース上で事前学習したネットワークから得られた地域的に集約された特徴マップに基づいて,変分オートエンコーダを訓練することを提案する。
当社のアプローチは,2019年のNeurIPS Disentanglement Challengeのステージ2で2位を獲得しました。
- 参考スコア(独自算出の注目度): 2.8360662552057323
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This report to our stage 2 submission to the NeurIPS 2019 disentanglement
challenge presents a simple image preprocessing method for learning
disentangled latent factors. We propose to train a variational autoencoder on
regionally aggregated feature maps obtained from networks pretrained on the
ImageNet database, utilizing the implicit inductive bias contained in those
features for disentanglement. This bias can be further enhanced by explicitly
fine-tuning the feature maps on auxiliary tasks useful for the challenge, such
as angle, position estimation, or color classification. Our approach achieved
the 2nd place in stage 2 of the challenge. Code is available at
https://github.com/mseitzer/neurips2019-disentanglement-challenge.
- Abstract(参考訳): 本報告は,NeurIPS 2019 disentanglement Challengeへのステージ2への提出であり,非絡み付き潜伏因子を学習するための簡単な画像前処理手法を提案する。
本稿では,これらの特徴に含まれる暗黙的帰納バイアスを利用して,ImageNetデータベース上で事前学習したネットワークから得られる地域集約特徴マップに基づいて,変分オートエンコーダを訓練することを提案する。
このバイアスは、角度、位置推定、色分類などの課題に有用な補助タスクに特徴マップを明示的に微調整することでさらに強化することができる。
私たちのアプローチは、チャレンジのステージ2で2位を獲得しました。
コードはhttps://github.com/mseitzer/neurips2019-disentanglement-challengeで入手できる。
関連論文リスト
- P2P-Bridge: Diffusion Bridges for 3D Point Cloud Denoising [81.92854168911704]
私たちは、Diffusion Schr"odingerブリッジをポイントクラウドに適応させる新しいフレームワークを通じて、ポイントクラウドを飾るタスクに取り組みます。
オブジェクトデータセットの実験では、P2P-Bridgeは既存のメソッドよりも大幅に改善されている。
論文 参考訳(メタデータ) (2024-08-29T08:00:07Z) - Learning to Search Feasible and Infeasible Regions of Routing Problems
with Flexible Neural k-Opt [30.510841880901655]
ルーティング問題に対する新しい学習探索(L2S)解法であるNeuOpt(NeuOpt)を提案する。
カスタマイズされたアクションファクター化法と、カスタマイズされたリカレントなデュアルストリームデコーダに基づいて、柔軟なk-opt交換を実行することを学ぶ。
論文 参考訳(メタデータ) (2023-10-27T16:51:41Z) - N2V2 -- Fixing Noise2Void Checkerboard Artifacts with Modified Sampling
Strategies and a Tweaked Network Architecture [66.03918859810022]
我々は,バニラN2V装置に2つの改良を加えて,不要なアーティファクトを大幅に削減する。
我々は、顕微鏡および自然画像データに基づいて、その修正を検証した。
論文 参考訳(メタデータ) (2022-11-15T21:12:09Z) - TSG: Target-Selective Gradient Backprop for Probing CNN Visual Saliency [72.9106103283475]
我々は、畳み込みニューラルネットワークを解釈するために視覚的サリエンシ、すなわち視覚的説明について研究する。
これらの観測に触発されて、我々はTSG(Target-Selective Gradient)バックプロップと呼ばれる新しいビジュアル・サリエンシ・フレームワークを提案する。
提案したTSGはTSG-ConvとTSG-FCの2つのコンポーネントから構成され、それぞれ畳み込み層と完全連結層の勾配を補正する。
論文 参考訳(メタデータ) (2021-10-11T12:00:20Z) - An audiovisual and contextual approach for categorical and continuous
emotion recognition in-the-wild [27.943550651941166]
第2回ワークショップおよびABAW(Affective Behavior Analysis in-wild)の会場における映像による視覚的感情認識の課題に取り組む。
顔の特徴の抽出にのみ依存する標準的な手法は、上記の感情情報のソースが、頭や身体の向き、解像度の低さ、照明不足によってアクセスできない場合に、正確な感情予測を欠くことが多い。
我々は、より広い感情認識フレームワークの一部として、身体的および文脈的特徴を活用することで、この問題を緩和したいと考えています。
論文 参考訳(メタデータ) (2021-07-07T20:13:17Z) - Learning Semantic Person Image Generation by Region-Adaptive
Normalization [81.52223606284443]
ポーズと外観の翻訳を扱う新しい2段階フレームワークを提案する。
第1段階では,対象意味解析マップを予測し,ポーズ転送の難しさを解消する。
第2段階では,領域適応正規化を組み込んだ新たな人物画像生成手法を提案する。
論文 参考訳(メタデータ) (2021-04-14T06:51:37Z) - Dual-Level Collaborative Transformer for Image Captioning [126.59298716978577]
2つの機能の補完的な利点を実現するために、新しいデュアルレベルコラボレーショントランス(DLCT)ネットワークを紹介します。
さらに,これらの2つの特徴の直接融合によって生じる意味的雑音に対処するために,局所性制約付きクロスアテンションモジュールを提案する。
論文 参考訳(メタデータ) (2021-01-16T15:43:17Z) - RESA: Recurrent Feature-Shift Aggregator for Lane Detection [32.246537653680484]
通常のCNNを用いた予備的特徴抽出の後,車線特徴量を高めるために,Recurrent Feature-Shift Aggregator (RESA) という新しいモジュールを提案する。
RESAは、スライスされた特徴写像を集約することで、外観の弱い難解なシナリオでレーンを正確に予測することができる。
提案手法は,2つの人気のある車線検出ベンチマーク(CULaneとTusimple)の最先端結果を実現する。
論文 参考訳(メタデータ) (2020-08-31T16:37:30Z) - 1st Place Solutions for OpenImage2019 -- Object Detection and Instance
Segmentation [116.25081559037872]
この記事では,2つのチャンピオンチーム,検出トラックのMMfruit'とセグメンテーショントラックのMMfruitSeg'のソリューションについて,OpenImage Challenge 2019で紹介する。
一般に、対象検出器の場合、バックボーンの端の共有特徴は分類と回帰の両方に適さないことが知られている。
自己学習型最適特徴抽出によりオブジェクトの分類と回帰を分離するデカップリングヘッド(DH)を提案する。
論文 参考訳(メタデータ) (2020-03-17T06:45:07Z) - NeurIPS 2019 Disentanglement Challenge: Improved Disentanglement through
Aggregated Convolutional Feature Maps [2.538209532048867]
本稿では,VAEのトレーニングのための簡単な画像前処理手法を提案する。
特に,ImageNet 上で事前学習した CNN から抽出した領域集約型特徴写像を提案する。
提案手法は,NeurIPS 2019 disentanglement Challengeのステージ1で2位となった。
論文 参考訳(メタデータ) (2020-02-23T22:35:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。