Fugu-MT 論文翻訳(概要): Hyperparameter Analysis for Image Captioning

関連論文リスト

Cross-Task Benchmarking of CNN Architectures [0.0]
このプロジェクトは、様々なタスクに対する動的畳み込みニューラルネットワーク(CNN)の比較研究を提供する。我々は、バニラCNN、ハードアテンションベースCNN、ソフトアテンションベースCNN、ローカル(ピクセルワイド)、グローバル(画像ワイド)機能アテンション、全方向CNN(ODConv)の5種類のCNNを比較した。 Tiny ImageNet、Pascal VOC、UCR Time Series Classification Archiveの実験では、注意機構と動的畳み込み手法が精度、効率、計算性能において従来のCNNを一貫して上回っていることが示されている。
論文参考訳（メタデータ） (2026-02-25T15:20:21Z)
Performance Analysis of Image Classification on Bangladeshi Datasets [0.0]
畳み込みニューラルネットワーク(CNN)は画像分類タスクにおいて顕著な成功を収めている。本稿では、カスタム設計のCNNと、画像分類タスクに広く使われているディープラーニングアーキテクチャの比較分析を行う。
論文参考訳（メタデータ） (2026-01-07T21:15:16Z)
Application of convolutional neural networks in image super-resolution [99.25287909319401]
畳み込みニューラルネットワーク(CNN)は、画像超解像の主流の手法となっている。異なるタイプの深層学習方法には大きな違いがある。本稿では,まず画像超解像におけるCNNの原理を紹介し,次にCNNをベースとしたバイキュビック,近傍,双線形,変換畳み込み,サブピクセル層,画像超解像のためのメタアップサンプリングを紹介する。最後に, 画像超解像におけるCNNの発展を促進するため, 研究の潜在的なポイントと欠点を概説し, 論文全体を要約する。
論文参考訳（メタデータ） (2025-06-03T08:28:08Z)
An evaluation of CNN models and data augmentation techniques in hierarchical localization of mobile robots [0.0]
本研究では,移動ロボットの階層的位置決めを行うために,CNNモデルの評価とデータ拡張を行う。この意味では、バックボーンとして使用される様々な最先端CNNモデルのアブレーション研究を示す。ロボットの視覚的ローカライゼーションに対処するために,様々なデータ拡張視覚効果を提案する。
論文参考訳（メタデータ） (2024-07-15T10:20:00Z)
Understanding and Improving CNNs with Complex Structure Tensor: A Biometrics Study [47.03015281370405]
本研究では,コンパクトな配向特徴を持つ複合構造を用いることで,グレースケール入力のみを使用する場合と比較して,識別精度が向上することを示す。このことは、哺乳類の視界で見られる戦略であるCNNにおける配向機能の事前利用が、それらの制限を緩和するだけでなく、その説明可能性や細い自転車との関連性を高めることを示唆している。
論文参考訳（メタデータ） (2024-04-24T02:51:13Z)
Transfer Learning for Microstructure Segmentation with CS-UNet: A Hybrid Algorithm with Transformer and CNN Encoders [0.2353157426758003]
顕微鏡画像上で事前学習したTransformerモデルとCNNモデルのセグメンテーション性能を、自然画像上で事前学習したモデルと比較する。また,画像セグメンテーションにおいて,事前学習したトランスフォーマーとCNNエンコーダの組み合わせは,事前学習したCNNエンコーダ単独よりも一貫して優れていることがわかった。
論文参考訳（メタデータ） (2023-08-26T16:56:15Z)
Unifying Two-Stream Encoders with Transformers for Cross-Modal Retrieval [68.61855682218298]
クロスモーダル検索法では、画像とテキストの異なるアーキテクチャを持つ2ストリームエンコーダを用いる。視覚タスクにおけるトランスフォーマーの最近の進歩に触発されて,トランスフォーマーとエンコーダアーキテクチャを両モードで統一することを提案する。我々は、画像変換器、テキスト変換器、階層アライメントモジュールからなる2ストリーム変換器(textbfHierarchical Alignment Transformers, HAT)を純粋にベースとしたクロスモーダル検索フレームワークを設計する。
論文参考訳（メタデータ） (2023-08-08T15:43:59Z)
Classification of diffraction patterns using a convolutional neural network in single particle imaging experiments performed at X-ray free-electron lasers [53.65540150901678]
X線自由電子レーザー(XFEL)における単一粒子イメージング(SPI)は、その自然環境における粒子の3次元構造を決定するのに特に適している。再建を成功させるためには、単一のヒットに由来する回折パターンを多数の取得パターンから分離する必要がある。本稿では,この課題を画像分類問題として定式化し,畳み込みニューラルネットワーク(CNN)アーキテクチャを用いて解決することを提案する。
論文参考訳（メタデータ） (2021-12-16T17:03:14Z)
Empirical Analysis of Image Caption Generation using Deep Learning [0.0]
我々は,マルチモーダル画像キャプションネットワークの様々なフレーバーを実装し,実験した。目標は、さまざまな評価指標を使用して、各アプローチのパフォーマンスを分析することである。
論文参考訳（メタデータ） (2021-05-14T05:38:13Z)
Deep ensembles based on Stochastic Activation Selection for Polyp Segmentation [82.61182037130406]
本研究は,大腸内視鏡検査における画像分割,特に正確なポリープ検出とセグメンテーションを扱う。イメージセグメンテーションの基本アーキテクチャはエンコーダとデコーダで構成されている。我々はデコーダのバックボーンを変更することで得られるDeepLabアーキテクチャのバリエーションを比較した。
論文参考訳（メタデータ） (2021-04-02T02:07:37Z)
The Mind's Eye: Visualizing Class-Agnostic Features of CNNs [92.39082696657874]
本稿では,特定のレイヤの最も情報性の高い特徴を表現した対応する画像を作成することにより,画像の集合を視覚的に解釈する手法を提案する。本手法では, 生成ネットワークを必要とせず, 元のモデルに変更を加えることなく, デュアルオブジェクトのアクティベーションと距離損失を利用する。
論文参考訳（メタデータ） (2021-01-29T07:46:39Z)
Combining pretrained CNN feature extractors to enhance clustering of complex natural images [27.784346095205358]
本稿では,画像クラスタリング(IC)における事前学習CNN機能の利用に関する知見を提供することを目的とする。そこで本研究では,IC問題をマルチビュークラスタリング(MVC)問題として再構成することを提案する。次に、MVC問題を効果的に解くためにエンドツーエンドに訓練されたマルチインプットニューラルネットワークアーキテクチャを提案する。
論文参考訳（メタデータ） (2021-01-07T21:23:04Z)
Exploring Deep Hybrid Tensor-to-Vector Network Architectures for Regression Based Speech Enhancement [53.47564132861866]
我々は、CNN-TTというハイブリッドアーキテクチャが、モデルパラメータを小さくして高品質な性能を維持することができることを見出した。 CNN-TTは、音声品質を改善するために、特徴抽出のために下部に複数の畳み込み層で構成されている。
論文参考訳（メタデータ） (2020-07-25T22:21:05Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

論文の概要: Hyperparameter Analysis for Image Captioning

関連論文リスト