論文の概要: Explaining Automatic Image Assessment
- arxiv url: http://arxiv.org/abs/2502.01873v1
- Date: Mon, 03 Feb 2025 22:55:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-05 14:59:09.281194
- Title: Explaining Automatic Image Assessment
- Title(参考訳): 自動画像アセスメントの解説
- Authors: Max Lisaius, Scott Wehrwein,
- Abstract要約: 提案手法は、データセットのトレンドを可視化し、視覚的美的特徴を自動分類することで、美的評価モデルを説明する。
既存のメトリクスと新しいメトリクスを使用して、各特定のモダリティに適応したモデルを評価することで、美的特徴とトレンドをキャプチャして視覚化することができる。
- 参考スコア(独自算出の注目度): 2.8084422332394428
- License:
- Abstract: Previous work in aesthetic categorization and explainability utilizes manual labeling and classification to explain aesthetic scores. These methods require a complex labeling process and are limited in size. Our proposed approach attempts to explain aesthetic assessment models through visualizing dataset trends and automatic categorization of visual aesthetic features through training neural networks on different versions of the same dataset. By evaluating the models adapted to each specific modality using existing and novel metrics, we can capture and visualize aesthetic features and trends.
- Abstract(参考訳): 審美的分類と説明可能性に関するこれまでの研究は、手動のラベリングと分類を利用して美的スコアを説明する。
これらの手法は複雑なラベリングプロセスを必要とし、サイズは限られている。
提案手法は、データセットのトレンドを可視化し、同じデータセットの異なるバージョンでニューラルネットワークをトレーニングすることで、視覚的美的特徴を自動分類することで、美的アセスメントモデルを説明する。
既存のメトリクスと新しいメトリクスを使用して、各特定のモダリティに適応したモデルを評価することで、美的特徴とトレンドをキャプチャして視覚化することができる。
関連論文リスト
- Reinforcing Pre-trained Models Using Counterfactual Images [54.26310919385808]
本稿では,言語誘導型生成対実画像を用いた分類モデル強化のための新しいフレームワークを提案する。
逆ファクト画像データセットを用いてモデルをテストすることにより、モデルの弱点を同定する。
我々は、分類モデルを微調整し強化するために、デファクトイメージを拡張データセットとして採用する。
論文 参考訳(メタデータ) (2024-06-19T08:07:14Z) - Aligning Vision Models with Human Aesthetics in Retrieval: Benchmarks and Algorithms [91.19304518033144]
検索システムにおける視覚モデルと人間の審美基準の整合を図る。
本研究では、視覚モデルと人間の美学をよりよく整合させるために、視覚モデルを微調整する嗜好に基づく強化学習手法を提案する。
論文 参考訳(メタデータ) (2024-06-13T17:59:20Z) - VILA: Learning Image Aesthetics from User Comments with Vision-Language
Pretraining [53.470662123170555]
ユーザからのコメントから画像美学を学習し、マルチモーダルな美学表現を学習するための視覚言語事前学習手法を提案する。
具体的には、コントラスト的および生成的目的を用いて、画像テキストエンコーダ-デコーダモデルを事前訓練し、人間のラベルなしでリッチで汎用的な美的意味学を学習する。
以上の結果から,AVA-Captionsデータセットを用いた画像の美的字幕化において,事前学習した美的視覚言語モデルよりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2023-03-24T23:57:28Z) - Exploring CNN-based models for image's aesthetic score prediction with
using ensemble [3.8073142980733]
我々は,CNNアーキテクチャの異なる2種類の自動画像美学評価モデルを構築する枠組みを提案した。
画像に対するモデルの注意領域を抽出し、画像中の被写体との整合性を分析する。
XiHeAAデータセットでトレーニングされたAS分類モデルは、潜在的な写真原理を学習しているように見えるが、美学を習得しているとは言えない。
論文 参考訳(メタデータ) (2022-10-11T03:23:07Z) - Enhancing efficiency of object recognition in different categorization
levels by reinforcement learning in modular spiking neural networks [1.392250707100996]
本稿では,異なる分類レベルにおける物体認識のための計算モデルを提案する。
強化学習規則を備えたスパイクニューラルネットワークは、各分類レベルでモジュールとして使用される。
各分類レベルで必要な情報に基づいて、関連する帯域通過フィルタ画像を利用する。
論文 参考訳(メタデータ) (2021-02-10T12:33:20Z) - A Diagnostic Study of Explainability Techniques for Text Classification [52.879658637466605]
既存の説明可能性技術を評価するための診断特性のリストを作成する。
そこで本研究では, モデルの性能と有理性との整合性の関係を明らかにするために, 説明可能性手法によって割り当てられた有理性スコアと有理性入力領域の人間のアノテーションを比較した。
論文 参考訳(メタデータ) (2020-09-25T12:01:53Z) - Semantic Sentiment Analysis Based on Probabilistic Graphical Models and
Recurrent Neural Network [0.0]
本研究の目的は,確率的グラフィカルモデルとリカレントニューラルネットワークに基づく感情分析を行うためのセマンティクスの利用を検討することである。
実験で使用されたデータセットは、IMDB映画レビュー、Amazon Consumer Product Review、Twitter Reviewデータセットである。
論文 参考訳(メタデータ) (2020-08-06T11:59:00Z) - Few-shot Classification via Adaptive Attention [93.06105498633492]
ごく少数の参照サンプルに基づいて,クエリサンプル表現を最適化し,高速に適応する新しい数ショット学習手法を提案する。
実験で実証したように,提案モデルでは,様々なベンチマーク数ショット分類と微粒化認識データセットを用いて,最先端の分類結果を達成している。
論文 参考訳(メタデータ) (2020-08-06T05:52:59Z) - Hierarchical Image Classification using Entailment Cone Embeddings [68.82490011036263]
まずラベル階層の知識を任意のCNNベースの分類器に注入する。
画像からの視覚的セマンティクスと組み合わせた外部セマンティクス情報の利用が全体的な性能を高めることを実証的に示す。
論文 参考訳(メタデータ) (2020-04-02T10:22:02Z) - Learning Representations For Images With Hierarchical Labels [1.3579420996461438]
クラスラベルによって誘導されるセマンティック階層に関する情報を活用するための一連の手法を提案する。
画像からの視覚的セマンティクスと組み合わせた外部セマンティクス情報の提供により、全体的な性能が向上することを示す。
しかし,CNN分類器には階層的な情報が注入され,組込みベースモデルでは,新たに提示された実世界ETHエコロジーコレクションイメージデータセットの階層非依存モデルよりも優れていた。
論文 参考訳(メタデータ) (2020-04-02T09:56:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。