Fugu-MT 論文翻訳(概要): Ablation study of self-supervised learning for image classification

論文の概要: Ablation study of self-supervised learning for image classification

arxiv url: http://arxiv.org/abs/2112.02297v1
Date: Sat, 4 Dec 2021 09:59:01 GMT
ステータス: 翻訳完了
システム内更新日: 2021-12-10 05:57:20.469589
Title: Ablation study of self-supervised learning for image classification
Title（参考訳）: 画像分類のための自己教師付き学習のアブレーション研究
Authors: Ilias Papastratis
Abstract要約: このプロジェクトは、画像認識のタスクのための畳み込みニューラルネットワーク(CNN)とトランスフォーマーネットワークの自己教師型トレーニングに焦点を当てている。同じソース画像からの2つの拡張変換画像の類似性を最大化するために、異なるバックボーンを持つ単純なシアムネットワークを使用する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: This project focuses on the self-supervised training of convolutional neural networks (CNNs) and transformer networks for the task of image recognition. A simple siamese network with different backbones is used in order to maximize the similarity of two augmented transformed images from the same source image. In this way, the backbone is able to learn visual information without supervision. Finally, the method is evaluated on three image recognition datasets.
Abstract（参考訳）: このプロジェクトは、画像認識のタスクのための畳み込みニューラルネットワーク(CNN)とトランスフォーマーネットワークの自己教師型トレーニングに焦点を当てている。同じソース画像からの2つの拡張変換画像の類似性を最大化するために、異なるバックボーンを持つ単純なシアムネットワークを使用する。このようにして、バックボーンは、監督なしで視覚情報を学ぶことができる。最後に,この手法を3つの画像認識データセットで評価する。

関連論文リスト

On knot detection via picture recognition [0.0]
本稿では、現代の機械学習手法と従来のアルゴリズムを組み合わせて、この目標を近似する戦略を説明する。画像から直接交差数を予測する単純なベースラインを提示し、軽量CNNやトランスフォーマーアーキテクチャでさえ意味のある構造情報を復元できることを示す。長期的な目的は、これらの知覚モジュールと記号的再構成をプラナー量子ダイアグラム(PD)コードに組み合わせ、ロバスト結び目分類のための下流不変計算を可能にすることである。
論文参考訳（メタデータ） (2025-10-06T22:36:10Z)
Visual Pre-Training on Unlabeled Images using Reinforcement Learning [62.66487459225838]
強化学習(RL)において、価値に基づくアルゴリズムは、それぞれの観察と状態とそれから到達しそうな報酬を関連付けることを学習する。この定式化に類似した自己教師付き画像事前学習法が多数存在することが観察された。 RL問題として,Webクロールやビデオフレームなどのラベル付けされていない画像データに事前学習を直接キャストする手法を提案する。
論文参考訳（メタデータ） (2025-06-13T17:25:27Z)
HVDistill: Transferring Knowledge from Images to Point Clouds via Unsupervised Hybrid-View Distillation [106.09886920774002]
本稿では,HVDistillと呼ばれるハイブリッドビューに基づく知識蒸留フレームワークを提案する。提案手法は,スクラッチからトレーニングしたベースラインに対して一貫した改善を実現し,既存のスキームを大幅に上回っている。
論文参考訳（メタデータ） (2024-03-18T14:18:08Z)
Cross-domain and Cross-dimension Learning for Image-to-Graph Transformers [48.74331852418905]
直接画像からグラフへの変換は、1つのモデルで物体の検出と関係予測を解くことを伴う課題である。このタスクの複雑さのため、多くのドメインで大規模なトレーニングデータセットはまれであり、ディープラーニングメソッドのトレーニングを困難にしている。画像-グラフ変換器のクロスドメインおよびクロス次元学習を可能にする一連の手法を提案する。
論文参考訳（メタデータ） (2024-03-11T10:48:56Z)
AbHE: All Attention-based Homography Estimation [0.0]
本研究では,局所的な特徴を持つ畳み込みニューラルネットワークとグローバルな特徴を持つトランスフォーマーモジュールを組み合わせた,Swin Transformerに基づく強力なベースラインモデルを提案する。ホモグラフィ回帰段階では、相関ボリュームのチャネルに注意層を導入し、いくつかの弱い相関特徴点を排除できる。実験の結果,8自由度(DOF)ホモグラフィーでは,我々の手法が最先端の手法をオーバーパフォーマンスすることがわかった。
論文参考訳（メタデータ） (2022-12-06T15:00:00Z)
Prune and distill: similar reformatting of image information along rat visual cortex and deep neural networks [61.60177890353585]
深部畳み込み神経ネットワーク(CNN)は、脳の機能的類似、視覚野の腹側流の優れたモデルを提供することが示されている。ここでは、CNNまたは視覚野の内部表現で知られているいくつかの顕著な統計的パターンについて考察する。我々は、CNNと視覚野が、オブジェクト表現の次元展開/縮小と画像情報の再構成と、同様の密接な関係を持っていることを示す。
論文参考訳（メタデータ） (2022-05-27T08:06:40Z)
LEAD: Self-Supervised Landmark Estimation by Aligning Distributions of Feature Similarity [49.84167231111667]
自己監督型ランドマーク検出における既存の研究は、画像から高密度(ピクセルレベルの)特徴表現を学習することに基づいている。自己教師付き方式で高密度同変表現の学習を強化するアプローチを提案する。機能抽出器にそのような先行性があることは,アノテーションの数が大幅に制限されている場合でも,ランドマーク検出に役立ちます。
論文参考訳（メタデータ） (2022-04-06T17:48:18Z)
Fusion of evidential CNN classifiers for image classification [6.230751621285322]
本稿では,畳み込みニューラルネットワークを結合する信念関数に基づく情報融合手法を提案する。このアプローチでは、事前訓練されたDSベースのCNNアーキテクチャが入力画像から特徴を抽出し、識別の異なるフレーム上のマス関数に変換する。
論文参考訳（メタデータ） (2021-08-23T15:12:26Z)
Comparative evaluation of CNN architectures for Image Caption Generation [1.2183405753834562]
2つの人気のある画像キャプチャ生成フレームワークで17種類の畳み込みニューラルネットワークを評価した。我々は、畳み込みニューラルネットワークのモデルの複雑さをパラメータ数で測定し、オブジェクト認識タスクにおけるモデルの精度は、必ずしも画像キャプション生成タスクの機能抽出に対する効果と相関するとは限らないことを観察する。
論文参考訳（メタデータ） (2021-02-23T05:43:54Z)
Mutual Information Maximization on Disentangled Representations for Differential Morph Detection [29.51265709271036]
ランドマークと外観のゆがみを利用した新しい微分形態検出フレームワークを提案する。提案するフレームワークは、最先端の微分形態検出性能を提供する。
論文参考訳（メタデータ） (2020-12-02T21:31:02Z)
NAS-DIP: Learning Deep Image Prior with Neural Architecture Search [65.79109790446257]
近年の研究では、深部畳み込みニューラルネットワークの構造が、以前に構造化された画像として利用できることが示されている。我々は,より強い画像の先行を捉えるニューラルネットワークの探索を提案する。既存のニューラルネットワーク探索アルゴリズムを利用して,改良されたネットワークを探索する。
論文参考訳（メタデータ） (2020-08-26T17:59:36Z)
Ventral-Dorsal Neural Networks: Object Detection via Selective Attention [51.79577908317031]
我々はVDNet(Ventral-Dorsal Networks)と呼ばれる新しいフレームワークを提案する。人間の視覚システムの構造にインスパイアされた我々は「Ventral Network」と「Dorsal Network」の統合を提案する。実験の結果,提案手法は最先端の物体検出手法よりも優れていることがわかった。
論文参考訳（メタデータ） (2020-05-15T23:57:36Z)
Image Retrieval using Multi-scale CNN Features Pooling [26.811290793232313]
本稿では,NetVLADに基づく新しいマルチスケールローカルプールと,サンプルの難易度に基づくトリプルトマイニング手法を利用して,効率的な画像表現を実現するエンド・ツー・エンドのトレーニング可能なネットワークアーキテクチャを提案する。
論文参考訳（メタデータ） (2020-04-21T00:57:52Z)
Distilling Localization for Self-Supervised Representation Learning [82.79808902674282]
コントラスト学習は教師なし表現学習に革命をもたらした。現在のコントラストモデルでは、前景オブジェクトのローカライズには効果がない。本稿では,背景変化を学習するためのデータ駆動型手法を提案する。
論文参考訳（メタデータ） (2020-04-14T16:29:42Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。