論文の概要: Modeling Art Evaluations from Comparative Judgments: A Deep Learning Approach to Predicting Aesthetic Preferences
- arxiv url: http://arxiv.org/abs/2602.00394v1
- Date: Fri, 30 Jan 2026 23:13:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-03 19:28:33.156911
- Title: Modeling Art Evaluations from Comparative Judgments: A Deep Learning Approach to Predicting Aesthetic Preferences
- Title(参考訳): 比較判断による美術評価のモデル化:審美的嗜好を予測するための深層学習アプローチ
- Authors: Manoj Reddy Bethi, Sai Rupa Jhade, Pravallika Yaganti, Monoshiz Mahbub Khan, Zhe Yu,
- Abstract要約: 比較判断法は、相対的な選択は直接的な得点よりも認知的負担と認知的一貫性が低いことを示唆している。
我々は、ディープニューラルネットワーク回帰モデルとデュアルブランチペアワイズ比較モデルを開発する。
人間の被験者による実験では、比較判断はアイテムあたりのアノテーション時間に60ドルもかからないことがわかった。
- 参考スコア(独自算出の注目度): 1.839031891198526
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Modeling human aesthetic judgments in visual art presents significant challenges due to individual preference variability and the high cost of obtaining labeled data. To reduce cost of acquiring such labels, we propose to apply a comparative learning framework based on pairwise preference assessments rather than direct ratings. This approach leverages the Law of Comparative Judgment, which posits that relative choices exhibit less cognitive burden and greater cognitive consistency than direct scoring. We extract deep convolutional features from painting images using ResNet-50 and develop both a deep neural network regression model and a dual-branch pairwise comparison model. We explored four research questions: (RQ1) How does the proposed deep neural network regression model with CNN features compare to the baseline linear regression model using hand-crafted features? (RQ2) How does pairwise comparative learning compare to regression-based prediction when lacking access to direct rating values? (RQ3) Can we predict individual rater preferences through within-rater and cross-rater analysis? (RQ4) What is the annotation cost trade-off between direct ratings and comparative judgments in terms of human time and effort? Our results show that the deep regression model substantially outperforms the baseline, achieving up to $328\%$ improvement in $R^2$. The comparative model approaches regression performance despite having no access to direct rating values, validating the practical utility of pairwise comparisons. However, predicting individual preferences remains challenging, with both within-rater and cross-rater performance significantly lower than average rating prediction. Human subject experiments reveal that comparative judgments require $60\%$ less annotation time per item, demonstrating superior annotation efficiency for large-scale preference modeling.
- Abstract(参考訳): 視覚芸術における人間の美的判断のモデル化は、個人の嗜好の多様性とラベル付きデータを取得するコストが高いことによる重要な課題を提示する。
このようなラベルを取得するコストを低減するため、直接評価ではなく、ペアワイズな選好評価に基づく比較学習フレームワークを提案する。
このアプローチは、相対的な選択が直接スコアリングよりも認知的負担が少なく認知的一貫性が高いことを示唆する比較判断法(Law of Comparison Judgment)を活用する。
ResNet-50を用いて絵画画像から深部畳み込み特徴を抽出し、深部ニューラルネットワーク回帰モデルとデュアルブランチペアワイズ比較モデルの両方を開発する。
RQ1) 提案したCNN機能付きディープニューラルネットワーク回帰モデルは、手作り特徴を用いたベースライン線形回帰モデルと比較した場合、どうすればよいか?
(RQ2)
ペアワイズ比較学習は、直接評価値にアクセスできない場合の回帰に基づく予測と比較してどうか?
(RQ3)
イントラ・ラター分析とクロス・ラター分析により、個別のレーダ嗜好を予測できるか?
(RQ4)
人的時間と労力の観点から、直接評価と比較判断のトレードオフは、アノテーションのコストにどのように影響しますか?
その結果, 深部回帰モデルはベースラインを大幅に上回り, R^2$で最大328\%の改善が達成された。
比較モデルは、直接評価値にアクセスできないにもかかわらず回帰性能にアプローチし、ペア比較の実用性を検証する。
しかし、個々の選好を予測することは依然として困難であり、平均評価予測よりも、内部レータとクロスレータの両方のパフォーマンスが著しく低い。
人間の被験者による実験では、比較判断はアイテムあたり60\%$のアノテーション時間を必要とし、大規模な嗜好モデリングにおいて優れたアノテーション効率を示す。
関連論文リスト
- Modeling Image-Caption Rating from Comparative Judgments [8.460083530922931]
直接評価ではなく,このような比較判断をモデル化する機械学習フレームワークを提案する。
モデルを適用することで、直接評価に基づいてトレーニングされた回帰モデルと同じ方法で、目に見えない画像キャプチャペアをランク付けすることができる。
論文 参考訳(メタデータ) (2026-01-30T23:00:07Z) - How Many Human Judgments Are Enough? Feasibility Limits of Human Preference Evaluation [0.38991526486631006]
優先信号がプロンプト間で拡散している場合、比例アロケーションは最小値最適であることを示す。
以上の結果から,非決定的あるいは否定的な評価結果が,モデル等価性よりも低パワー評価を反映していることが示唆された。
論文 参考訳(メタデータ) (2026-01-14T02:34:58Z) - RewardBench 2: Advancing Reward Model Evaluation [71.65938693914153]
リワードモデルは、好みのデータからニュアンスされた信号をキャプチャするために、言語モデルの訓練後を通して使用される。
コミュニティは報酬モデルを評価するためのベストプラクティスを確立し始めている。
本稿では,新しいマルチスキル報酬モデルベンチマークであるRewardBench 2を紹介する。
論文 参考訳(メタデータ) (2025-06-02T17:54:04Z) - Learning Guarantee of Reward Modeling Using Deep Neural Networks [1.1088875073103415]
深層ニューラルネットワークを用いたペアワイズ比較データを用いた報酬モデリングの学習理論について検討する。
我々は、非パラメトリックな設定で、深い報酬推定を行うための新しい非漸近的後悔を確立する。
論文 参考訳(メタデータ) (2025-05-10T11:21:29Z) - Rethinking Relation Extraction: Beyond Shortcuts to Generalization with a Debiased Benchmark [53.876493664396506]
ベンチマークは、機械学習アルゴリズムのパフォーマンスの評価、比較の促進、優れたソリューションの特定に不可欠である。
本稿では,関係抽出タスクにおけるエンティティバイアスの問題に対処する。
本稿では,エンティティの代替によって,エンティティ参照と関係型との擬似相関を破る不偏関係抽出ベンチマークDREBを提案する。
DREBの新たなベースラインを確立するために,データレベルとモデルトレーニングレベルを組み合わせたデバイアス手法であるMixDebiasを導入する。
論文 参考訳(メタデータ) (2025-01-02T17:01:06Z) - Linked shrinkage to improve estimation of interaction effects in
regression models [0.0]
回帰モデルにおける双方向相互作用項によく適応する推定器を開発する。
我々は,選択戦略では難しい推論モデルの可能性を評価する。
私たちのモデルは、かなり大きなサンプルサイズであっても、ランダムな森林のような、より高度な機械学習者に対して非常に競争力があります。
論文 参考訳(メタデータ) (2023-09-25T10:03:39Z) - GREAT Score: Global Robustness Evaluation of Adversarial Perturbation using Generative Models [60.48306899271866]
GREATスコア(GREAT Score)と呼ばれる新しいフレームワークを提案する。
我々は,ロバストベンチにおける攻撃ベースモデルと比較し,高い相関性を示し,GREATスコアのコストを大幅に削減した。
GREAT Scoreは、プライバシーに敏感なブラックボックスモデルのリモート監査に使用することができる。
論文 参考訳(メタデータ) (2023-04-19T14:58:27Z) - Sparse MoEs meet Efficient Ensembles [49.313497379189315]
このようなモデルの2つの一般的なクラス、すなわちニューラルネットワークのアンサンブルと専門家のスパースミックス(スパースMoE)の相互作用について研究する。
Efficient Ensemble of Experts (E$3$)は、両モデルのクラスを最大限に活用するスケーラブルでシンプルなMoEのアンサンブルであり、深いアンサンブルよりも最大45%少ないFLOPを使用する。
論文 参考訳(メタデータ) (2021-10-07T11:58:35Z) - Group-aware Contrastive Regression for Action Quality Assessment [85.43203180953076]
ビデオ間の関係は、より正確な行動品質評価のための重要な手がかりとなることを示す。
提案手法は従来の手法よりも大きなマージンを達成し,3つのベンチマークで新たな最先端の手法を確立する。
論文 参考訳(メタデータ) (2021-08-17T17:59:39Z) - Learning Expectation of Label Distribution for Facial Age and
Attractiveness Estimation [65.5880700862751]
本稿では,2つの最先端手法(Ranking-CNNとDLDL)の本質的な関係を解析し,ランキング法が実際にラベル分布を暗黙的に学習していることを示す。
軽量なネットワークアーキテクチャを提案し、顔属性の分布と回帰属性の値を共同で学習できる統一的なフレームワークを提案する。
提案手法は,36$times$パラメータが小さく,3$times$が顔の年齢/魅力度推定における高速な推論速度を持つ単一モデルを用いて,新しい最先端結果を実現する。
論文 参考訳(メタデータ) (2020-07-03T15:46:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。