論文の概要: Exploring Kolmogorov-Arnold networks for realistic image sharpness assessment
- arxiv url: http://arxiv.org/abs/2409.07762v2
- Date: Sat, 14 Sep 2024 09:01:08 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-17 12:21:17.136201
- Title: Exploring Kolmogorov-Arnold networks for realistic image sharpness assessment
- Title(参考訳): リアルな画像シャープネス評価のためのコルモゴロフ・アルノルドネットワークの探索
- Authors: Shaode Yu, Ze Chen, Zhimu Yang, Jiacheng Gu, Bizu Feng,
- Abstract要約: Kolmogorov-Arnoldネットワーク(KAN)が開発され、データフィッティングにおいて顕著な成功を収めた。
本研究では,テイラー級数に基づくKAN(TaylorKAN)を用いてスコア予測を行う。
関連するタスクでkanを選択して改善する方法に光を当てている。
- 参考スコア(独自算出の注目度): 0.7402155503097928
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Score prediction is crucial in realistic image sharpness assessment after informative features are collected. Recently, Kolmogorov-Arnold networks (KANs) have been developed and witnessed remarkable success in data fitting. This study presents Taylor series based KAN (TaylorKAN). Then, different KANs are explored on four realistic image databases (BID2011, CID2013, CLIVE, and KonIQ-10k) for score prediction by using 15 mid-level features and 2048 high-level features. When setting support vector regression as the baseline, experimental results indicate KANs are generally better or competitive, TaylorKAN is the best on three databases using mid-level feature input, while KANs are inferior on CLIVE when high-level features are used. This is the first study that explores KANs for image quality assessment. It sheds lights on how to select and improve KANs on related tasks.
- Abstract(参考訳): 情報的特徴が収集された後の現実的な画像のシャープネス評価にはスコア予測が不可欠である。
近年、コルモゴロフ・アルノルドネットワーク(KAN)が開発され、データフィッティングにおいて顕著な成功を収めた。
本研究はテイラー級数に基づくカン(テイラーカン)について述べる。
次に,4つの実写画像データベース(BID2011,CID2013,CLIVE,KonIQ-10k)上で,中間レベル特徴15と高レベル特徴2048を用いてスコア予測を行う。
ベースラインとしてサポートベクター回帰を設定する場合、実験結果から、kansは一般的に優れているか、競争的であることが示され、TaylorKANは中レベルの特徴入力を使用して3つのデータベースで最高であるのに対し、kansは高レベルの特徴を使用する場合、CLIVEより劣っている。
これは、画像品質評価のためのKansを探求する最初の研究である。
関連するタスクでkanを選択して改善する方法に光を当てている。
関連論文リスト
- KAN we improve on HEP classification tasks? Kolmogorov-Arnold Networks applied to an LHC physics example [0.08192907805418582]
Kolmogorov-Arnold Networks (KAN) は多層パーセプトロンの代替として提案されている。
高エネルギー物理における二項イベント分類の典型的な課題について検討する。
1層カンの学習活性化関数は入力特徴の対数類似度に類似していることが判明した。
論文 参考訳(メタデータ) (2024-08-05T18:01:07Z) - How to Learn More? Exploring Kolmogorov-Arnold Networks for Hyperspectral Image Classification [26.37105279142761]
Kolmogorov-Arnold Networks (KANs) は視覚変換器 (ViTs) の代替として提案された。
本研究では,複雑なハイパースペクトル画像(HSI)データ分類におけるkansの有効性を評価する。
そこで我々は,1D,2D,3Dkanを用いたハイブリッドアーキテクチャを開発し,提案する。
論文 参考訳(メタデータ) (2024-06-22T03:31:02Z) - Demonstrating the Efficacy of Kolmogorov-Arnold Networks in Vision Tasks [4.8951183832371]
Kolmogorov-Arnold Network (KAN) は多層投影(MLP)の代替として出現している。
本研究は,MNIST, CIFAR10, CIFAR100の複数試行を通して, 視覚タスクにおけるkanの有効性を実証した。
これらの結果から,kanはビジョンタスクに有意な可能性を秘めており,今後の評価においてさらなる改善が期待できると考えられる。
論文 参考訳(メタデータ) (2024-06-21T07:20:34Z) - Kolmogorov-Arnold Network for Satellite Image Classification in Remote Sensing [4.8951183832371]
本稿では,コンボリューションニューラルネットワーク(CNN)モデルとKAN(Kolmogorov-Arnold Network)を統合したリモートセンシングシーン分類タスクを提案する。
KCNと呼ばれる新しい手法は、従来のマルチ層パーセプトロン(MLP)をKANに置き換えて、分類性能を向上させることを目的としている。
我々はVGG16, MobileNetV2, EfficientNet, ConvNeXt, ResNet101, Vision Transformer (ViT) など,複数のCNNベースのモデルを用いて, Kanと組み合わせて性能評価を行った。
論文 参考訳(メタデータ) (2024-06-02T03:11:37Z) - OOD-CV-v2: An extended Benchmark for Robustness to Out-of-Distribution
Shifts of Individual Nuisances in Natural Images [59.51657161097337]
OOD-CV-v2は、ポーズ、形状、テクスチャ、コンテキスト、気象条件の10のオブジェクトカテゴリのアウト・オブ・ディストリビューションの例を含むベンチマークデータセットである。
この新たなデータセットに加えて、一般的なベースライン手法を用いた広範な実験にも貢献する。
論文 参考訳(メタデータ) (2023-04-17T20:39:25Z) - Revisiting the Evaluation of Image Synthesis with GANs [55.72247435112475]
本研究では, 合成性能の評価に関する実証的研究を行い, 生成モデルの代表としてGAN(Generative Adversarial Network)を用いた。
特に、表現空間におけるデータポイントの表現方法、選択したサンプルを用いた公平距離の計算方法、各集合から使用可能なインスタンス数など、さまざまな要素の詳細な分析を行う。
論文 参考訳(メタデータ) (2023-04-04T17:54:32Z) - DeepDC: Deep Distance Correlation as a Perceptual Image Quality
Evaluator [53.57431705309919]
ImageNet Pre-trained Deep Neural Network (DNN)は、効果的な画像品質評価(IQA)モデルを構築するための顕著な転送性を示す。
我々は,事前学習DNN機能のみに基づく新しいフル参照IQA(FR-IQA)モデルを開発した。
5つの標準IQAデータセット上で,提案した品質モデルの優位性を示すため,包括的実験を行った。
論文 参考訳(メタデータ) (2022-11-09T14:57:27Z) - Core Risk Minimization using Salient ImageNet [53.616101711801484]
私たちは、1000のImagenetクラスのコアとスプリアス機能をローカライズする100万人以上のソフトマスクを備えたSalient Imagenetデータセットを紹介します。
このデータセットを用いて、まず、いくつかのImagenet事前訓練されたモデル(総計42件)の素早い特徴に対する依存度を評価する。
次に、コアリスク最小化(CoRM)と呼ばれる新しい学習パラダイムを導入する。
論文 参考訳(メタデータ) (2022-03-28T01:53:34Z) - Learning Transformer Features for Image Quality Assessment [53.51379676690971]
本稿では,CNNバックボーンとトランスフォーマーエンコーダを用いて特徴抽出を行うIQAフレームワークを提案する。
提案するフレームワークはFRモードとNRモードの両方と互換性があり、共同トレーニング方式が可能である。
論文 参考訳(メタデータ) (2021-12-01T13:23:00Z) - Reliable Evaluations for Natural Language Inference based on a Unified
Cross-dataset Benchmark [54.782397511033345]
クラウドソースの自然言語推論(NLI)データセットは、アノテーションアーティファクトのような重大なバイアスに悩まされる可能性がある。
14のNLIデータセットと9つの広く使用されているニューラルネットワークベースのNLIモデルを再評価した、新しいクロスデータセットベンチマークを提案する。
提案した評価手法と実験ベースラインは,将来信頼性の高いNLI研究を刺激する基盤となる可能性がある。
論文 参考訳(メタデータ) (2020-10-15T11:50:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。