論文の概要: Can we detect harmony in artistic compositions? A machine learning
approach
- arxiv url: http://arxiv.org/abs/2012.05633v1
- Date: Thu, 10 Dec 2020 12:31:12 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-15 06:34:47.215057
- Title: Can we detect harmony in artistic compositions? A machine learning
approach
- Title(参考訳): 芸術作品の調和を検知できるのか?
機械学習のアプローチ
- Authors: Adam Vandor, Marie van Vollenhoven, Gerhard Weiss, Gerasimos Spanakis
- Abstract要約: 視覚構成における調和は、人間でも数学的に定義または容易に表現できない概念である。
我々は人間に、伝達する調和に基づいて、グレースケール画像のコレクションを評価するよう依頼する。
画像を表現するため、一連の特殊特徴を設計・抽出した。
- 参考スコア(独自算出の注目度): 2.2749157557381245
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Harmony in visual compositions is a concept that cannot be defined or easily
expressed mathematically, even by humans. The goal of the research described in
this paper was to find a numerical representation of artistic compositions with
different levels of harmony. We ask humans to rate a collection of grayscale
images based on the harmony they convey. To represent the images, a set of
special features were designed and extracted. By doing so, it became possible
to assign objective measures to subjectively judged compositions. Given the
ratings and the extracted features, we utilized machine learning algorithms to
evaluate the efficiency of such representations in a harmony classification
problem. The best performing model (SVM) achieved 80% accuracy in
distinguishing between harmonic and disharmonic images, which reinforces the
assumption that concept of harmony can be expressed in a mathematical way that
can be assessed by humans.
- Abstract(参考訳): 視覚構成における調和は、人間でも数学的に定義または容易に表現できない概念である。
本研究の目的は,異なるレベルの調和を持つ芸術作品の数値表現を見出すことであった。
我々は人間に、伝達する調和に基づいて、グレースケール画像のコレクションを評価するよう依頼する。
画像を表現するため、一連の特殊特徴を設計・抽出した。
これにより、主観的に判断された構成に客観的な措置を割り当てることが可能となった。
評価と抽出された特徴から,調和分類問題において,これらの表現の効率を評価するために機械学習アルゴリズムを用いた。
最高の演奏モデル(SVM)は、調和の概念を人間によって評価できる数学的方法で表現できるという仮定を補強し、調和画像と不規則画像の区別において80%の精度を達成した。
関連論文リスト
- A Complexity-Based Theory of Compositionality [53.025566128892066]
AIでは、構成表現は配布外一般化の強力な形式を可能にすることができる。
ここでは、構成性に関する直観を考慮し、拡張する構成性の公式な定義を提案する。
この定義は概念的には単純で量的であり、アルゴリズム情報理論に基礎を置いており、あらゆる表現に適用できる。
論文 参考訳(メタデータ) (2024-10-18T18:37:27Z) - When Does Perceptual Alignment Benefit Vision Representations? [76.32336818860965]
視覚モデル表現と人間の知覚的判断との整合がユーザビリティに与える影響について検討する。
モデルと知覚的判断を一致させることで、多くの下流タスクで元のバックボーンを改善する表現が得られることがわかった。
その結果,人間の知覚的知識に関する帰納バイアスを視覚モデルに注入することは,より良い表現に寄与することが示唆された。
論文 参考訳(メタデータ) (2024-10-14T17:59:58Z) - Interpretable Measures of Conceptual Similarity by
Complexity-Constrained Descriptive Auto-Encoding [112.0878081944858]
画像間の類似度を定量化することは、画像ベースの機械学習にとって重要な著作権問題である。
我々は,高次関係を捉えた画像間での「概念的類似性」の概念を定義し,計算することを目指している。
2つの非常に異種な画像は、その記述の早い段階で識別できるが、概念的に異種な画像は、より詳細を区別する必要がある。
論文 参考訳(メタデータ) (2024-02-14T03:31:17Z) - Towards a Universal Understanding of Color Harmony: Fuzzy Approach [0.0]
ファジィに基づく色モデルを用いて色調和を探求し,その普遍性の問題に対処する。
実験結果から,色調和は概ね普遍的であることが示唆された。
調和度の高いパレットでは、飽和度と強度の適度なレベルを維持しながら、カラーホイールの原理に順応する傾向が観察された。
論文 参考訳(メタデータ) (2023-10-01T21:06:26Z) - Zero-Shot Image Harmonization with Generative Model Prior [22.984119094424056]
画像調和のためのゼロショットアプローチを提案し, 大量の合成合成画像への依存を克服することを目的とした。
人間の振る舞いにインスパイアされた、完全にモジュール化されたフレームワークを導入します。
さまざまなシーンやオブジェクトにまたがる説得力のある視覚的結果と、アプローチを検証するユーザスタディを提示します。
論文 参考訳(メタデータ) (2023-07-17T00:56:21Z) - Minimum Description Length Clustering to Measure Meaningful Image
Complexity [65.268245109828]
本稿では,階層的なパッチクラスタリングによる画像複雑性の指標を提案する。
最小記述長の原理を用いて、クラスタ数を決定し、特定の点を外れ値として指定し、ホワイトノイズを低いスコアに正しく割り当てる。
論文 参考訳(メタデータ) (2023-06-26T15:37:04Z) - Compositionally Equivariant Representation Learning [22.741376970643973]
人間は、MRIやCTスキャンなどの医療画像で重要な解剖学を素早く学べる。
この認識機能は、異なる医療施設からの新しい画像や、異なる設定で新しいタスクに容易に一般化する。
医用画像のセグメンテーションにおいて,より解釈可能で一般化可能な表現の学習における構成性の活用について検討した。
論文 参考訳(メタデータ) (2023-06-13T14:06:55Z) - Measuring uncertainty in human visual segmentation [1.2289361708127877]
本稿では,知覚的セグメンテーションマップを計測するための新しい統合的アプローチを提案する。
画素に基づく等差判定を計測し,下層のセグメンテーションマップをモデルベースで再構成する。
画像の不確実性は測定された人間の変動に影響を及ぼし、被験者が異なる視覚的特徴の量に影響を及ぼすことを示す。
論文 参考訳(メタデータ) (2023-01-18T22:38:03Z) - OccluMix: Towards De-Occlusion Virtual Try-on by Semantically-Guided
Mixup [79.3118064406151]
Image Virtual try-onは、個人画像上の布を衣服画像(ホップ内服)に置き換えることを目的としている。
以前の方法では, 衣服のイメージの保存に成功していた。
隠蔽は、現実的なバーチャル試行に悪影響を及ぼす。
論文 参考訳(メタデータ) (2023-01-03T06:29:11Z) - Contrastive Learning with Positive-Negative Frame Mask for Music
Representation [91.44187939465948]
本稿では,PEMRと略記したコントラッシブラーニングフレームワークに基づく,音楽表現のための正負負のフレームマスクを提案する。
我々は,同じ音楽からサンプリングした自己増強陽性/陰性の両方に対応するために,新しいコントラスト学習目標を考案した。
論文 参考訳(メタデータ) (2022-03-17T07:11:42Z) - Objective, Probabilistic, and Generalized Noise Level Dependent
Classifications of sets of more or less 2D Periodic Images into Plane
Symmetry Groups [0.0]
2次元の周期性を持つ実世界の画像からの結晶対称性の分類は、結晶学者やコンピュータビジョン研究の実践者にも関心がある。
金谷健一の幾何学的赤池情報基準とそれに関連する幾何的赤池情報量によって実現された平面対称性群分類に対する新しいアプローチを実証する。
合成2次元周期画像の平面対称性と擬似対称性を,赤緑色および広帯域雑音で客観的に推定する能力を示す。
論文 参考訳(メタデータ) (2020-09-17T21:28:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。