Fugu-MT 論文翻訳(概要): Explaining Automatic Image Assessment

論文の概要: Explaining Automatic Image Assessment

arxiv url: http://arxiv.org/abs/2502.01873v1
Date: Mon, 03 Feb 2025 22:55:14 GMT
ステータス: 翻訳完了
システム内更新日: 2025-02-05 15:21:55.781223
Title: Explaining Automatic Image Assessment
Title（参考訳）: 自動画像アセスメントの解説
Authors: Max Lisaius, Scott Wehrwein,
Abstract要約: 提案手法は、データセットのトレンドを可視化し、視覚的美的特徴を自動分類することで、美的評価モデルを説明する。既存のメトリクスと新しいメトリクスを使用して、各特定のモダリティに適応したモデルを評価することで、美的特徴とトレンドをキャプチャして視覚化することができる。
参考スコア（独自算出の注目度）: 2.8084422332394428
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Previous work in aesthetic categorization and explainability utilizes manual labeling and classification to explain aesthetic scores. These methods require a complex labeling process and are limited in size. Our proposed approach attempts to explain aesthetic assessment models through visualizing dataset trends and automatic categorization of visual aesthetic features through training neural networks on different versions of the same dataset. By evaluating the models adapted to each specific modality using existing and novel metrics, we can capture and visualize aesthetic features and trends.
Abstract（参考訳）: 審美的分類と説明可能性に関するこれまでの研究は、手動のラベリングと分類を利用して美的スコアを説明する。これらの手法は複雑なラベリングプロセスを必要とし、サイズは限られている。提案手法は、データセットのトレンドを可視化し、同じデータセットの異なるバージョンでニューラルネットワークをトレーニングすることで、視覚的美的特徴を自動分類することで、美的アセスメントモデルを説明する。既存のメトリクスと新しいメトリクスを使用して、各特定のモダリティに適応したモデルを評価することで、美的特徴とトレンドをキャプチャして視覚化することができる。

関連論文リスト

Visual and Semantic Prompt Collaboration for Generalized Zero-Shot Learning [58.73625654718187]
一般化されたゼロショット学習は、異なるクラス間で共有される意味情報の助けを借りて、目に見えないクラスと見えないクラスの両方を認識することを目的としている。既存のアプローチでは、視覚的バックボーンをルッククラスのデータで微調整し、セマンティックな視覚的特徴を得る。本稿では,効率的な特徴適応のためのプロンプトチューニング技術を活用した,視覚的・意味的プロンプト協調フレームワークを提案する。
論文参考訳（メタデータ） (2025-03-29T10:17:57Z)
Advancing Comprehensive Aesthetic Insight with Multi-Scale Text-Guided Self-Supervised Learning [14.405750888492735]
Image Aesthetic Assessment (IAA) は、画像の美的価値を分析し評価する作業である。 IAAの伝統的な手法は、しばしば単一の美的タスクに集中し、ラベル付きデータセットが不十分である。審美的洞察をニュアンス化した総合的審美的MLLMを提案する。
論文参考訳（メタデータ） (2024-12-16T16:35:35Z)
Reinforcing Pre-trained Models Using Counterfactual Images [54.26310919385808]
本稿では,言語誘導型生成対実画像を用いた分類モデル強化のための新しいフレームワークを提案する。逆ファクト画像データセットを用いてモデルをテストすることにより、モデルの弱点を同定する。我々は、分類モデルを微調整し強化するために、デファクトイメージを拡張データセットとして採用する。
論文参考訳（メタデータ） (2024-06-19T08:07:14Z)
Aligning Vision Models with Human Aesthetics in Retrieval: Benchmarks and Algorithms [91.19304518033144]
検索システムにおける視覚モデルと人間の審美基準の整合を図る。本研究では、視覚モデルと人間の美学をよりよく整合させるために、視覚モデルを微調整する嗜好に基づく強化学習手法を提案する。
論文参考訳（メタデータ） (2024-06-13T17:59:20Z)
Saliency-Bench: A Comprehensive Benchmark for Evaluating Visual Explanations [14.09795099827903]
Saliency-Benchは、複数のデータセットにわたるSaliencyメソッドによって生成された視覚的説明を評価するために設計された、新しいベンチマークスイートである。ベンチマークには、視覚的説明の忠実さと整合性を評価するための標準化された統一された評価パイプラインが含まれている。
論文参考訳（メタデータ） (2023-10-12T17:26:16Z)
VILA: Learning Image Aesthetics from User Comments with Vision-Language Pretraining [53.470662123170555]
ユーザからのコメントから画像美学を学習し、マルチモーダルな美学表現を学習するための視覚言語事前学習手法を提案する。具体的には、コントラスト的および生成的目的を用いて、画像テキストエンコーダ-デコーダモデルを事前訓練し、人間のラベルなしでリッチで汎用的な美的意味学を学習する。以上の結果から,AVA-Captionsデータセットを用いた画像の美的字幕化において,事前学習した美的視覚言語モデルよりも優れていたことが示唆された。
論文参考訳（メタデータ） (2023-03-24T23:57:28Z)
Exploring CNN-based models for image's aesthetic score prediction with using ensemble [3.8073142980733]
我々は,CNNアーキテクチャの異なる2種類の自動画像美学評価モデルを構築する枠組みを提案した。画像に対するモデルの注意領域を抽出し、画像中の被写体との整合性を分析する。 XiHeAAデータセットでトレーニングされたAS分類モデルは、潜在的な写真原理を学習しているように見えるが、美学を習得しているとは言えない。
論文参考訳（メタデータ） (2022-10-11T03:23:07Z)
Enhancing efficiency of object recognition in different categorization levels by reinforcement learning in modular spiking neural networks [1.392250707100996]
本稿では,異なる分類レベルにおける物体認識のための計算モデルを提案する。強化学習規則を備えたスパイクニューラルネットワークは、各分類レベルでモジュールとして使用される。各分類レベルで必要な情報に基づいて、関連する帯域通過フィルタ画像を利用する。
論文参考訳（メタデータ） (2021-02-10T12:33:20Z)
A Diagnostic Study of Explainability Techniques for Text Classification [52.879658637466605]
既存の説明可能性技術を評価するための診断特性のリストを作成する。そこで本研究では, モデルの性能と有理性との整合性の関係を明らかにするために, 説明可能性手法によって割り当てられた有理性スコアと有理性入力領域の人間のアノテーションを比較した。
論文参考訳（メタデータ） (2020-09-25T12:01:53Z)
Few-shot Classification via Adaptive Attention [93.06105498633492]
ごく少数の参照サンプルに基づいて,クエリサンプル表現を最適化し,高速に適応する新しい数ショット学習手法を提案する。実験で実証したように,提案モデルでは,様々なベンチマーク数ショット分類と微粒化認識データセットを用いて,最先端の分類結果を達成している。
論文参考訳（メタデータ） (2020-08-06T05:52:59Z)
Learning Representations For Images With Hierarchical Labels [1.3579420996461438]
クラスラベルによって誘導されるセマンティック階層に関する情報を活用するための一連の手法を提案する。画像からの視覚的セマンティクスと組み合わせた外部セマンティクス情報の提供により、全体的な性能が向上することを示す。しかし,CNN分類器には階層的な情報が注入され,組込みベースモデルでは,新たに提示された実世界ETHエコロジーコレクションイメージデータセットの階層非依存モデルよりも優れていた。
論文参考訳（メタデータ） (2020-04-02T09:56:03Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。