論文の概要: Exploring to establish an appropriate model for mage aesthetic
assessment via CNN-based RSRL: An empirical study
- arxiv url: http://arxiv.org/abs/2106.03316v1
- Date: Mon, 7 Jun 2021 03:20:00 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-09 13:34:34.673384
- Title: Exploring to establish an appropriate model for mage aesthetic
assessment via CNN-based RSRL: An empirical study
- Title(参考訳): CNNベースのRSRLによるマージ審美評価のための適切なモデルの構築:実証的研究
- Authors: Ying Dai
- Abstract要約: CNNの最終層FCノードの絡み合い度を反映したD尺度を導入する。
複数の写真スコア予測モデルから最適なモデルを決定するアルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 3.8073142980733
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: To establish an appropriate model for photo aesthetic assessment, in this
paper, a D-measure which reflects the disentanglement degree of the final layer
FC nodes of CNN is introduced. By combining F-measure with D-measure to obtain
a FD measure, an algorithm of determining the optimal model from the multiple
photo score prediction models generated by CNN-based repetitively self-revised
learning(RSRL) is proposed. Furthermore, the first fixation perspective(FFP)
and the assessment interest region(AIR) of the models are defined and
calculated. The experimental results show that the FD measure is effective for
establishing the appropriate model from the multiple score prediction models
with different CNN structures. Moreover, the FD-determined optimal models with
the comparatively high FD always have the FFP an AIR which are close to the
human's aesthetic perception when enjoying photos.
- Abstract(参考訳): フォト審美評価のための適切なモデルを確立するため、cnnの最終層fcノードの不等角度を反映するd測定器を導入する。
F測度とD測度を組み合わせてFD測度を求めることにより、CNNに基づく反復自己修正学習(RSRL)によって生成された複数光スコア予測モデルから最適なモデルを決定するアルゴリズムを提案する。
さらに、モデルの第一固定視点(FFP)と評価関心領域(AIR)を定義して算出する。
実験の結果、fd測度はcnn構造が異なる複数のスコア予測モデルから適切なモデルを確立するのに有効であることがわかった。
さらに、比較的高いFDを持つFD決定最適モデルは、写真を楽しむときに人間の審美的知覚に近いFFPとAIRを常に持っている。
関連論文リスト
- KFD-NeRF: Rethinking Dynamic NeRF with Kalman Filter [49.85369344101118]
KFD-NeRFは,Kalmanフィルタに基づく効率的かつ高品質な運動再構成フレームワークと統合された,新しい動的ニューラル放射場である。
我々のキーとなる考え方は、動的放射場を、観測と予測という2つの知識源に基づいて時間的に異なる状態が推定される動的システムとしてモデル化することである。
我々のKFD-NeRFは、同等の計算時間と最先端の視線合成性能で、徹底的な訓練を施した類似または優れた性能を示す。
論文 参考訳(メタデータ) (2024-07-18T05:48:24Z) - Opinion-Unaware Blind Image Quality Assessment using Multi-Scale Deep Feature Statistics [54.08757792080732]
我々は,事前学習された視覚モデルからの深い特徴を統計的解析モデルと統合して,意見認識のないBIQA(OU-BIQA)を実現することを提案する。
提案モデルは,最先端のBIQAモデルと比較して,人間の視覚的知覚との整合性に優れる。
論文 参考訳(メタデータ) (2024-05-29T06:09:34Z) - Latent Semantic Consensus For Deterministic Geometric Model Fitting [109.44565542031384]
我々はLSC(Latent Semantic Consensus)と呼ばれる効果的な方法を提案する。
LSCは、モデルフィッティング問題をデータポイントとモデル仮説に基づく2つの潜在意味空間に定式化する。
LSCは、一般的な多構造モデルフィッティングのために、数ミリ秒以内で一貫した、信頼性の高いソリューションを提供することができる。
論文 参考訳(メタデータ) (2024-03-11T05:35:38Z) - Diffusion Model Alignment Using Direct Preference Optimization [103.2238655827797]
拡散DPOは,ヒトの比較データを直接最適化することにより,拡散モデルを人間の嗜好に合わせる手法である。
拡散DPOを用いた最先端安定拡散XL(SDXL)-1.0モデルの基礎モデルを微調整する。
また、AIフィードバックを使用し、人間の好みのトレーニングに匹敵するパフォーマンスを持つ亜種も開発しています。
論文 参考訳(メタデータ) (2023-11-21T15:24:05Z) - ExposureDiffusion: Learning to Expose for Low-light Image Enhancement [87.08496758469835]
この研究は、拡散モデルと物理ベースの露光モデルとをシームレスに統合することで、この問題に対処する。
提案手法は,バニラ拡散モデルと比較して性能が大幅に向上し,推論時間を短縮する。
提案するフレームワークは、実際のペア付きデータセット、SOTAノイズモデル、および異なるバックボーンネットワークの両方で動作する。
論文 参考訳(メタデータ) (2023-07-15T04:48:35Z) - A positive feedback method based on F-measure value for Salient Object
Detection [1.9249287163937976]
本稿では,SODに対するF値に基づく正のフィードバック手法を提案する。
提案手法は,画像を検出して既存のモデルに入力し,それぞれの予測マップを取得する。
5つの公開データセットに対する実験結果から,提案手法の正のフィードバックは,5つの評価指標において最新の12の手法よりも優れていた。
論文 参考訳(メタデータ) (2023-04-28T04:05:13Z) - Exploring CNN-based models for image's aesthetic score prediction with
using ensemble [3.8073142980733]
我々は,CNNアーキテクチャの異なる2種類の自動画像美学評価モデルを構築する枠組みを提案した。
画像に対するモデルの注意領域を抽出し、画像中の被写体との整合性を分析する。
XiHeAAデータセットでトレーニングされたAS分類モデルは、潜在的な写真原理を学習しているように見えるが、美学を習得しているとは言えない。
論文 参考訳(メタデータ) (2022-10-11T03:23:07Z) - The Best of Both Worlds: Combining Model-based and Nonparametric
Approaches for 3D Human Body Estimation [20.797162096899154]
本稿では,グローバル画像特徴量からモデルパラメータを推定するフレームワークを提案する。
密度マップ予測モジュールは、画像証拠と身体モデルの各部分との間の密度UV対応を明確に確立する。
逆キネマティクスモジュールはキーポイント予測を洗練し、テンプレートメッシュを生成する。
紫外線塗布モジュールは、対応する特徴、予測、提案されたテンプレートに依存し、閉塞した身体形状の予測を完了させる。
論文 参考訳(メタデータ) (2022-05-01T16:39:09Z) - Prototype Guided Federated Learning of Visual Feature Representations [15.021124010665194]
Federated Learning(FL)は、分散モデルトレーニングを可能にするフレームワークである。
既存の手法は、内部表現を無視したモデルを集約する。
我々は、分散データ上で学習した表現のマージンを用いてクライアントの偏差を計算するFedProtoを紹介する。
論文 参考訳(メタデータ) (2021-05-19T08:29:12Z) - A Deep Drift-Diffusion Model for Image Aesthetic Score Distribution
Prediction [68.76594695163386]
画像から美的スコアの分布を予測するために,心理学者から着想を得たディープドリフト拡散モデルを提案する。
DDDモデルは、評価結果の伝統的なモデリングではなく、美的知覚の心理的プロセスを記述することができる。
私たちの新しいDDDモデルはシンプルだが効率的であり、美的スコア分布予測における最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2020-10-15T11:01:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。