論文の概要: Simplicity in Complexity
- arxiv url: http://arxiv.org/abs/2403.03134v1
- Date: Tue, 5 Mar 2024 17:21:31 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-06 13:59:12.270658
- Title: Simplicity in Complexity
- Title(参考訳): 複雑さの単純さ
- Authors: Kevin Shen, Surabhi S Nath, Aenne Brielmann, Peter Dayan
- Abstract要約: 画像のセグメントベース表現を用いた複雑性のモデル化を提案する。
この2つの特徴を6つの多様な画像集合にまたがる単純な線形モデルにより,複雑性がよく説明できることがわかった。
- 参考スコア(独自算出の注目度): 6.363158395541767
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The complexity of visual stimuli plays an important role in many cognitive
phenomena, including attention, engagement, memorability, time perception and
aesthetic evaluation. Despite its importance, complexity is poorly understood
and ironically, previous models of image complexity have been quite
\textit{complex}. There have been many attempts to find handcrafted features
that explain complexity, but these features are usually dataset specific, and
hence fail to generalise. On the other hand, more recent work has employed deep
neural networks to predict complexity, but these models remain difficult to
interpret, and do not guide a theoretical understanding of the problem. Here we
propose to model complexity using segment-based representations of images. We
use state-of-the-art segmentation models, SAM and FC-CLIP, to quantify the
number of segments at multiple granularities, and the number of classes in an
image respectively. We find that complexity is well-explained by a simple
linear model with these two features across six diverse image-sets of
naturalistic scene and art images. This suggests that the complexity of images
can be surprisingly simple.
- Abstract(参考訳): 視覚刺激の複雑さは、注意、エンゲージメント、記憶力、時間知覚、美的評価など多くの認知現象において重要な役割を果たす。
その重要性にもかかわらず、複雑さはよく理解されておらず皮肉なことに、以前の画像複雑性のモデルは、かなり \textit{complex} である。
複雑さを説明する手作りの機能を見つけようとする試みは数多くあったが、これらの機能は一般的にデータセット固有のものであるため、一般化に失敗している。
一方で、より最近の研究では、複雑な予測にディープニューラルネットワークを用いたが、これらのモデルは解釈が困難であり、問題の理論的理解を導くものではない。
本稿では,画像のセグメントベース表現を用いた複雑性のモデル化を提案する。
我々は,複数の粒度のセグメント数と画像中のクラス数を定量化するために,最先端のセグメンテーションモデルSAMとFC-CLIPを用いている。
この2つの特徴は、自然主義的なシーンとアートイメージの6つの多様なイメージセットにまたがる。
これは、画像の複雑さが驚くほど単純であることを示している。
関連論文リスト
- Multi-scale structural complexity as a quantitative measure of visual complexity [1.3499500088995464]
マルチスケール構造複雑性尺度(MSSC)は,物体の構造的複雑性を,その階層構造における異なるスケール間の相違点の量として定義する手法である。
我々は、MSSCが他の計算複雑性尺度と同等の主観的複雑性と相関し、より直感的であり、画像のカテゴリ間で一貫性があり、計算が容易であることを示した。
論文 参考訳(メタデータ) (2024-08-07T20:26:35Z) - Understanding Visual Feature Reliance through the Lens of Complexity [14.282243225622093]
我々は$mathscrV$-informationに基づいて,特徴量の定量化のための新しい指標を提案する。
我々は、標準画像ネット学習視覚モデルから抽出した1万個の特徴の複雑さを、垂直層内の方向として表現する。
論文 参考訳(メタデータ) (2024-07-08T16:21:53Z) - What makes Models Compositional? A Theoretical View: With Supplement [60.284698521569936]
本稿では,構成関数の一般神経-記号的定義とその構成複雑性について述べる。
既存の汎用および特殊目的のシーケンス処理モデルがこの定義にどのように適合しているかを示し、それらを用いて構成複雑性を分析する。
論文 参考訳(メタデータ) (2024-05-02T20:10:27Z) - Inferring Local Structure from Pairwise Correlations [0.0]
相関関係が局所関係を回復するのに十分な情報を提供することを示す。
これは、我々のデータに高次相互作用構造が存在するにもかかわらず、成功することを証明している。
論文 参考訳(メタデータ) (2023-05-07T22:38:29Z) - The No Free Lunch Theorem, Kolmogorov Complexity, and the Role of Inductive Biases in Machine Learning [80.1018596899899]
ニューラルネットワークモデルは、Kolmogorov複雑性を使って形式化された、同じ好みを共有している、と我々は主張する。
実験の結果、事前訓練された言語モデルでも、低複雑さのシーケンスを生成するのが好まれることがわかった。
これらの観察は、ますます小さな機械学習モデルで異なるように見える問題を統一する深層学習の傾向を正当化する。
論文 参考訳(メタデータ) (2023-04-11T17:22:22Z) - On the Complexity of Bayesian Generalization [141.21610899086392]
我々は、多様かつ自然な視覚スペクトルにおいて、概念一般化を大規模に考える。
問題空間が大きくなると、2つのモードが研究され、$complexity$が多様になる。
論文 参考訳(メタデータ) (2022-11-20T17:21:37Z) - Dist2Cycle: A Simplicial Neural Network for Homology Localization [66.15805004725809]
単純複体は多方向順序関係を明示的にエンコードするグラフの高次元一般化と見なすことができる。
単体錯体の$k$-homological特徴によってパラメータ化された関数のグラフ畳み込みモデルを提案する。
論文 参考訳(メタデータ) (2021-10-28T14:59:41Z) - Model Complexity of Deep Learning: A Survey [79.20117679251766]
深層学習におけるモデル複雑性に関する最新の研究を体系的に概観します。
本稿では,これら2つのカテゴリに関する既存研究について,モデルフレームワーク,モデルサイズ,最適化プロセス,データ複雑性の4つの重要な要因について概説する。
論文 参考訳(メタデータ) (2021-03-08T22:39:32Z) - Simplicial Complex Representation Learning [0.7734726150561088]
単純複体は、コンピュータ支援設計、コンピュータグラフィックス、シミュレーションでよく使用される位相空間の重要なクラスを形成する。
本稿では,単純複体を普遍埋め込み空間に埋め込む,単純複素レベル表現学習の手法を提案する。
本手法は,事前学習した簡易オートエンコーダによって誘導される単純xレベル埋め込みを用いて,単純化された複合表現全体を学習する。
論文 参考訳(メタデータ) (2021-03-06T06:33:04Z) - Structural Landmarking and Interaction Modelling: on Resolution Dilemmas
in Graph Classification [50.83222170524406]
解法ジレンマの統一概念に基づくグラフ分類における本質的難易度の研究」
構造ランドマークと相互作用モデリングのためのインダクティブニューラルネットワークモデルSLIM'を提案する。
論文 参考訳(メタデータ) (2020-06-29T01:01:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。