論文の概要: Adaptive Fractional Dilated Convolution Network for Image Aesthetics
Assessment
- arxiv url: http://arxiv.org/abs/2004.03015v1
- Date: Mon, 6 Apr 2020 21:56:29 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-16 07:12:19.069094
- Title: Adaptive Fractional Dilated Convolution Network for Image Aesthetics
Assessment
- Title(参考訳): 画像審美評価のための適応分数拡張畳み込みネットワーク
- Authors: Qiuyu Chen, Wei Zhang, Ning Zhou, Peng Lei, Yi Xu, Yu Zheng, Jianping
Fan
- Abstract要約: 適応型分数拡張畳み込み(AFDC)は、畳み込みカーネルレベルでこの問題に取り組むために開発された。
ミニバッチ学習のための簡潔な定式化を行い,グループ化戦略を用いて計算オーバーヘッドを削減する。
提案手法は,AVAデータセットを用いた画像美学評価において,最先端の性能を実現することを実証した。
- 参考スコア(独自算出の注目度): 33.945579916184364
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To leverage deep learning for image aesthetics assessment, one critical but
unsolved issue is how to seamlessly incorporate the information of image aspect
ratios to learn more robust models. In this paper, an adaptive fractional
dilated convolution (AFDC), which is aspect-ratio-embedded,
composition-preserving and parameter-free, is developed to tackle this issue
natively in convolutional kernel level. Specifically, the fractional dilated
kernel is adaptively constructed according to the image aspect ratios, where
the interpolation of nearest two integers dilated kernels is used to cope with
the misalignment of fractional sampling. Moreover, we provide a concise
formulation for mini-batch training and utilize a grouping strategy to reduce
computational overhead. As a result, it can be easily implemented by common
deep learning libraries and plugged into popular CNN architectures in a
computation-efficient manner. Our experimental results demonstrate that our
proposed method achieves state-of-the-art performance on image aesthetics
assessment over the AVA dataset.
- Abstract(参考訳): 画像美学評価にディープラーニングを活用するためには、画像アスペクト比の情報をシームレスに組み込んで、より堅牢なモデルを学ぶ方法が重要だが未解決の課題である。
本稿では,aspect-ratio-embedded, composition-preserving, parameter-freeである適応分数拡張畳み込み(afdc)を開発し,畳み込みカーネルレベルでこの問題をネイティブに解決する。
具体的には、画像アスペクト比に応じて分数拡張カーネルを適応的に構築し、最寄りの2つの整数拡張カーネルの補間を用いて分数サンプリングの誤りに対処する。
さらに,ミニバッチトレーニングのための簡潔な定式化とグループ化戦略を用いて計算オーバーヘッドを削減する。
その結果、一般的なディープラーニングライブラリで容易に実装でき、計算効率のよい方法で一般的なCNNアーキテクチャにプラグインできる。
提案手法は,AVAデータセットを用いた画像美学評価における最先端性能を実現する。
関連論文リスト
- Image-level Regression for Uncertainty-aware Retinal Image Segmentation [3.7141182051230914]
我々は,新たな不確実性認識変換(SAUNA)を導入する。
以上の結果から,SAUNA変換の統合とセグメント化損失は,異なるセグメンテーションモデルにおいて大きな性能向上をもたらすことが示唆された。
論文 参考訳(メタデータ) (2024-05-27T04:17:10Z) - Transformer-based Clipped Contrastive Quantization Learning for
Unsupervised Image Retrieval [15.982022297570108]
教師なし画像検索は、与えられたクエリ画像の類似画像を取得するために、任意のレベルなしに重要な視覚的特徴を学習することを目的としている。
本稿では,パッチベースの処理により局所的なコンテキストを持つTransformerを用いて,画像のグローバルコンテキストを符号化するTransClippedCLRモデルを提案する。
提案したクリップ付きコントラスト学習の結果は、バニラコントラスト学習と同一のバックボーンネットワークと比較して、すべてのデータセットで大幅に改善されている。
論文 参考訳(メタデータ) (2024-01-27T09:39:11Z) - PairingNet: A Learning-based Pair-searching and -matching Network for
Image Fragments [6.694162736590122]
本稿では,難解な修復問題を解決するために,学習に基づくイメージフラグメントのペア探索とマッチング手法を提案する。
提案するネットワークは,ペア探索の精度に優れ,マッチングエラーを低減し,計算時間を大幅に短縮する。
論文 参考訳(メタデータ) (2023-12-14T07:43:53Z) - DELAD: Deep Landweber-guided deconvolution with Hessian and sparse prior [0.22940141855172028]
本稿では,古典的反復法をディープラーニングアプリケーションに組み込んだ非盲検画像デコンボリューションモデルを提案する。
このアルゴリズムは、トレーニング可能な畳み込み層と統合され、復元された画像構造と詳細を強化する。
論文 参考訳(メタデータ) (2022-09-30T11:15:03Z) - Rank-Enhanced Low-Dimensional Convolution Set for Hyperspectral Image
Denoising [50.039949798156826]
本稿では,ハイパースペクトル(HS)画像の難解化問題に対処する。
ランク付き低次元畳み込み集合(Re-ConvSet)を提案する。
次に、Re-ConvSetを広く使われているU-Netアーキテクチャに組み込んで、HS画像復号法を構築する。
論文 参考訳(メタデータ) (2022-07-09T13:35:12Z) - Learning Discriminative Shrinkage Deep Networks for Image Deconvolution [122.79108159874426]
本稿では,これらの用語を暗黙的にモデル化する識別的縮小関数を学習することで,効果的に非盲検デコンボリューション手法を提案する。
実験結果から,提案手法は最先端の手法に対して,効率と精度の点で好適に動作することがわかった。
論文 参考訳(メタデータ) (2021-11-27T12:12:57Z) - Image-specific Convolutional Kernel Modulation for Single Image
Super-resolution [85.09413241502209]
本稿では,新しい画像特異的畳み込み変調カーネル(IKM)を提案する。
我々は、画像や特徴のグローバルな文脈情報を利用して、畳み込みカーネルを適応的に調整するための注意重みを生成する。
単一画像超解像実験により,提案手法は最先端手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2021-11-16T11:05:10Z) - A Flexible Framework for Designing Trainable Priors with Adaptive
Smoothing and Game Encoding [57.1077544780653]
我々は、前方通過を非滑らかな凸最適化問題として解釈できるニューラルネットワーク層の設計とトレーニングのための一般的なフレームワークを紹介する。
グラフのノードに代表されるローカルエージェントによって解決され、正規化関数を介して相互作用する凸ゲームに焦点を当てる。
このアプローチは、訓練可能なエンドツーエンドのディープモデル内で、古典的な画像の事前使用を可能にするため、画像の問題を解決するために魅力的である。
論文 参考訳(メタデータ) (2020-06-26T08:34:54Z) - Learning Deformable Image Registration from Optimization: Perspective,
Modules, Bilevel Training and Beyond [62.730497582218284]
マルチスケールの伝搬により微分同相モデルを最適化する,新しいディープラーニングベースのフレームワークを開発した。
我々は,脳MRIデータにおける画像-アトラス登録,肝CTデータにおける画像-画像登録を含む,3次元ボリュームデータセットにおける画像登録実験の2つのグループを実行する。
論文 参考訳(メタデータ) (2020-04-30T03:23:45Z) - High-Order Information Matters: Learning Relation and Topology for
Occluded Person Re-Identification [84.43394420267794]
本稿では,高次関係とトポロジ情報を識別的特徴とロバストなアライメントのために学習し,新しい枠組みを提案する。
我々のフレームワークはOccluded-Dukeデータセットで最先端の6.5%mAPスコアを大幅に上回っている。
論文 参考訳(メタデータ) (2020-03-18T12:18:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。