Fugu-MT 論文翻訳(概要): Multi-Modal Aesthetic Assessment for MObile Gaming Image

論文の概要: Multi-Modal Aesthetic Assessment for MObile Gaming Image

arxiv url: http://arxiv.org/abs/2101.11700v1
Date: Wed, 27 Jan 2021 21:48:31 GMT
ステータス: 翻訳完了
システム内更新日: 2021-02-01 19:46:04.547739
Title: Multi-Modal Aesthetic Assessment for MObile Gaming Image
Title（参考訳）: モビルゲーミング画像のマルチモーダル審美性評価
Authors: Zhenyu Lei, Yejing Xie, Suiyi Ling, Andreas Pastor, Junle Wang, Patrick Le Callet
Abstract要約: 提案モデルは,4つのゲーム美的次元の予測において,最先端の審美的指標を著しく上回る。我々の傾向は、様々な審美的関連次元間の相関を探求し、学習し、一般化性能をさらに向上させることである。
参考スコア（独自算出の注目度）: 30.962059154484912
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: With the proliferation of various gaming technology, services, game styles, and platforms, multi-dimensional aesthetic assessment of the gaming contents is becoming more and more important for the gaming industry. Depending on the diverse needs of diversified game players, game designers, graphical developers, etc. in particular conditions, multi-modal aesthetic assessment is required to consider different aesthetic dimensions/perspectives. Since there are different underlying relationships between different aesthetic dimensions, e.g., between the `Colorfulness' and `Color Harmony', it could be advantageous to leverage effective information attached in multiple relevant dimensions. To this end, we solve this problem via multi-task learning. Our inclination is to seek and learn the correlations between different aesthetic relevant dimensions to further boost the generalization performance in predicting all the aesthetic dimensions. Therefore, the `bottleneck' of obtaining good predictions with limited labeled data for one individual dimension could be unplugged by harnessing complementary sources of other dimensions, i.e., augment the training data indirectly by sharing training information across dimensions. According to experimental results, the proposed model outperforms state-of-the-art aesthetic metrics significantly in predicting four gaming aesthetic dimensions.
Abstract（参考訳）: 様々なゲーム技術、サービス、ゲームスタイル、プラットフォームの普及に伴い、ゲームコンテンツに対する多次元の美的評価がゲーム業界にとってますます重要になっている。多様なゲームプレーヤー、ゲームデザイナー、グラフィカル開発者などの多様なニーズに応じて。特に,マルチモーダル審美評価は,異なる審美的寸法・観察的要素を検討するために必要である。異なる美的次元、例えば「彩度」と「色彩調和」の間には異なる基礎的な関係があるため、複数の関連する次元に付随する効果的な情報を活用するのが有利である。そのためには、この問題をマルチタスク学習で解決します。我々の傾向は、異なる審美的関連次元間の相関を探求し、学習し、すべての審美的次元を予測する際の一般化性能をさらに向上させることである。したがって、1次元の制限されたラベル付きデータで良好な予測を得るための「ボトルネック」は、他の次元の補完的情報源、すなわち、次元間でトレーニング情報を共有して間接的にトレーニングデータを増強することで解くことができる。実験結果から,提案モデルは4つのゲーム美的次元を予測する上で,最先端の審美的指標を著しく上回る結果を得た。

関連論文リスト

Bridging Cognitive Gap: Hierarchical Description Learning for Artistic Image Aesthetics Assessment [51.40989269202702]
審美的品質評価タスクは,AIGCの定量的評価システムの開発に不可欠である。本研究では,記述生成による美的次元の分離を図った芸術的画像の美的評価フレームワークであるArtQuantを提案する。提案手法は,従来のトレーニングの33%しか必要とせず,いくつかのデータセット上での最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (2025-12-29T12:18:26Z)
VADB: A Large-Scale Video Aesthetic Database with Professional and Multi-Dimensional Annotations [65.0648741395158]
VADBは最大のビデオ美学データベースで、10,490の多様なビデオが、複数の審美次元の37人のプロによって注釈付けされている。 VADB-Netは2段階のトレーニング戦略を備えたデュアルモーダル事前トレーニングフレームワークであり、スコアリングタスクにおける既存のビデオ品質アセスメントモデルよりも優れている。
論文参考訳（メタデータ） (2025-10-29T07:37:08Z)
Expanding Horizons of Level Diversity via Multi-objective Evolutionary Learning [10.755666953578336]
本稿では,生成モデルの訓練において,多次元の多様性を考慮し,レベル多様性の地平を広げることを目的とする。モデルトレーニングを多目的学習問題として定式化し、各多様性指標を個別の目的として扱う。モデル学習プロセスを通して複数の多様性指標を同時に最適化する多目的進化学習フレームワークを提案する。
論文参考訳（メタデータ） (2025-09-29T06:43:33Z)
Modeling Aesthetic Preferences in 3D Shapes: A Large-Scale Paired Comparison Study Across Object Categories [0.0]
本研究では,Amazon Mechanical Turkを通じて,5つの対象カテゴリー(椅子,テーブル,マグカップ,ランプ,ダイニングチェア)にまたがる人間の嗜好を大規模に調査する。審美的嗜好の幾何学的要因を明らかにするために,新しい非線形モデリングとクロスカテゴリ分析を導入する。この研究は、人間中心のデータ駆動フレームワークを通じて、3D形状の美学の理解を深める。
論文参考訳（メタデータ） (2025-05-18T11:30:32Z)
Beyond Accuracy: What Matters in Designing Well-Behaved Models? [53.252827682118955]
視覚言語モデルでは,ImageNet-1k分類に高い公正性を示し,ドメイン変更に対して強い堅牢性を示す。 QUBAスコア(QUBA score)は、複数の品質の次元にまたがってモデルをランク付けする新しい指標である。
論文参考訳（メタデータ） (2025-03-21T12:54:18Z)
When Does Perceptual Alignment Benefit Vision Representations? [76.32336818860965]
視覚モデル表現と人間の知覚的判断との整合がユーザビリティに与える影響について検討する。モデルと知覚的判断を一致させることで、多くの下流タスクで元のバックボーンを改善する表現が得られることがわかった。その結果,人間の知覚的知識に関する帰納バイアスを視覚モデルに注入することは,より良い表現に寄与することが示唆された。
論文参考訳（メタデータ） (2024-10-14T17:59:58Z)
Perceptual Similarity for Measuring Decision-Making Style and Policy Diversity in Games [28.289135305943056]
プレイスタイルとして知られる意思決定スタイルの定義と測定は、ゲームにおいて不可欠である。本稿では,様々な状態心理学を用いたマルチスケール分析,粒度に根ざした知覚核,交差点対結合法を有効利用して精度を高めるための3つの拡張点を紹介する。そこで本研究では,エンド・ツー・エンドのゲーム分析と,多種多様なプレイスタイルのための人工知能の進化について検討した。
論文参考訳（メタデータ） (2024-08-12T10:55:42Z)
AesExpert: Towards Multi-modality Foundation Model for Image Aesthetics Perception [74.11069437400398]
我々は,21,904の多様なソースイメージと88Kの人間の自然言語フィードバックを備えたコーパスリッチな審美的批評データベースを開発した。 AesExpertと呼ばれる、マルチモダリティのAesthetic Expertモデルを実現するために、オープンソースの一般基盤モデルを微調整します。実験により、提案したAesExpertモデルは、最先端のMLLMよりもはるかに優れた審美的知覚性能を提供することが示された。
論文参考訳（メタデータ） (2024-04-15T09:56:20Z)
Measuring Diversity of Game Scenarios [15.100151112002235]
我々は,現在の文学と実践のギャップを埋めることを目指しており,ゲームシナリオにおける多様性の測定と統合のための効果的な戦略に関する洞察を提供する。この調査は、様々なゲームシナリオにおける将来の研究の道筋を示すだけでなく、多様性をゲームデザインと開発の重要な要素として活用しようとする業界の実践者のためのハンドブックとしても機能する。
論文参考訳（メタデータ） (2024-04-15T07:59:52Z)
UniAR: A Unified model for predicting human Attention and Responses on visual content [12.281060227170792]
多様な視覚コンテンツにまたがる人間の注意と嗜好行動の統一モデルUniARを提案する。自然画像、Webページ、グラフィックデザインにまたがる様々な公開データセットに基づいてUniARをトレーニングし、複数のベンチマークでSOTA性能を達成する。潜在的なアプリケーションには、UI/視覚コンテンツの有効性に関する即時フィードバックの提供や、デザイナとコンテンツ作成モデルによる人間中心の改善のための作成の最適化などが含まれる。
論文参考訳（メタデータ） (2023-12-15T19:57:07Z)
Impressions: Understanding Visual Semiotics and Aesthetic Impact [66.40617566253404]
画像のセミオティックスを調べるための新しいデータセットであるImpressionsを提示する。既存のマルチモーダル画像キャプションと条件付き生成モデルは、画像に対する可視的応答をシミュレートするのに苦労していることを示す。このデータセットは、微調整と少数ショット適応により、画像の印象や美的評価をモデル化する能力を大幅に改善する。
論文参考訳（メタデータ） (2023-10-27T04:30:18Z)
Towards General Game Representations: Decomposing Games Pixels into Content and Style [2.570570340104555]
ゲームのピクセル表現を学習することは、複数の下流タスクにまたがる人工知能の恩恵を受けることができる。本稿では,コンピュータビジョンエンコーダの汎用化について検討する。我々は、ゲームジャンルに基づく事前学習されたビジョントランスフォーマーエンコーダと分解技術を用いて、個別のコンテンツとスタイルの埋め込みを得る。
論文参考訳（メタデータ） (2023-07-20T17:53:04Z)
Perceiver: General Perception with Iterative Attention [85.65927856589613]
我々は,トランスフォーマーを基盤とするモデルであるperceiverを紹介する。このアーキテクチャは、分類タスクにおいて、競争的、または強固な、専門的なモデル以上のパフォーマンスを示す。また、AudioSetのすべてのモダリティの最先端の結果を超えています。
論文参考訳（メタデータ） (2021-03-04T18:20:50Z)
Individualized Context-Aware Tensor Factorization for Online Games Predictions [6.602875221541352]
ユーザパフォーマンスとゲーム結果を予測するために,Neural Individualized Context-aware Embeddings(NICE)モデルを提案する。提案手法は,ユーザとコンテキストの潜在表現を学習することで,異なるコンテキストにおける個人行動の違いを識別する。我々は,MOBAゲームLeague of Legendsのデータセットを用いて,勝利の予測,個々のユーザパフォーマンス,ユーザエンゲージメントを大幅に改善することを示した。
論文参考訳（メタデータ） (2021-02-22T20:46:02Z)
Embedded Deep Bilinear Interactive Information and Selective Fusion for Multi-view Learning [70.67092105994598]
本稿では,上記の2つの側面に着目した,新しい多視点学習フレームワークを提案する。特に、さまざまな深層ニューラルネットワークをトレーニングして、様々なビュー内表現を学習する。 6つの公開データセットの実験により,提案手法の有効性が示された。
論文参考訳（メタデータ） (2020-07-13T01:13:23Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。