論文の概要: Visual DNA: Representing and Comparing Images using Distributions of
Neuron Activations
- arxiv url: http://arxiv.org/abs/2304.10036v1
- Date: Thu, 20 Apr 2023 01:23:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-21 14:47:35.316492
- Title: Visual DNA: Representing and Comparing Images using Distributions of
Neuron Activations
- Title(参考訳): 視覚DNA:ニューロン活性化分布を用いた画像の表現と比較
- Authors: Benjamin Ramtoula, Matthew Gadd, Paul Newman, Daniele De Martini
- Abstract要約: ニューロン活性化の分布(DNA)を用いた画像および拡張データセットの表現を提案する。
DNAは、ヒストグラムやガウスアンなどの分布を、事前に訓練された特徴抽出器内のニューロンの活性化に適合し、画像(s)を渡して表現する。
2つのDNAを比較することで、2つのデータセットがどの程度異なるかを評価することができる。
- 参考スコア(独自算出の注目度): 23.929435472676325
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Selecting appropriate datasets is critical in modern computer vision.
However, no general-purpose tools exist to evaluate the extent to which two
datasets differ. For this, we propose representing images - and by extension
datasets - using Distributions of Neuron Activations (DNAs). DNAs fit
distributions, such as histograms or Gaussians, to activations of neurons in a
pre-trained feature extractor through which we pass the image(s) to represent.
This extractor is frozen for all datasets, and we rely on its generally
expressive power in feature space. By comparing two DNAs, we can evaluate the
extent to which two datasets differ with granular control over the comparison
attributes of interest, providing the ability to customise the way distances
are measured to suit the requirements of the task at hand. Furthermore, DNAs
are compact, representing datasets of any size with less than 15 megabytes. We
demonstrate the value of DNAs by evaluating their applicability on several
tasks, including conditional dataset comparison, synthetic image evaluation,
and transfer learning, and across diverse datasets, ranging from synthetic cat
images to celebrity faces and urban driving scenes.
- Abstract(参考訳): 現代のコンピュータビジョンでは、適切なデータセットの選択が不可欠である。
しかし、2つのデータセットがどの程度異なるかを評価する汎用ツールは存在しない。
そこで我々は,ニューロン活性化の分布(DNA)を用いた画像および拡張データセットの表現を提案する。
DNAは、ヒストグラムやガウスアンなどの分布を、事前に訓練された特徴抽出器内のニューロンの活性化に適合し、画像(s)を渡して表現する。
この抽出器は、すべてのデータセットで凍結され、機能空間におけるその一般的な表現力に依存しています。
2つのdnaを比較することで、2つのデータセットが関心のある比較属性に対する粒度制御によってどの程度異なるかを評価することができ、目の前のタスクの要求に合致するように距離を測定する方法をカスタマイズできる。
さらに、DNAはコンパクトで、15メガバイト未満の任意のサイズのデータセットを表す。
本研究では, 条件付きデータセット比較, 合成画像評価, 移動学習, および, 合成猫画像から有名人の顔, 都市運転シーンに至るまで, さまざまなデータセットにまたがって, それらの適用性を評価することでDNAの価値を実証する。
関連論文リスト
- Rethinking Transformers Pre-training for Multi-Spectral Satellite
Imagery [78.43828998065071]
教師なし学習の最近の進歩は、下流タスクにおける有望な結果を達成するための大きな視覚モデルの可能性を示している。
このような事前学習技術は、大量の未学習データが利用可能であることから、リモートセンシング領域でも最近研究されている。
本稿では,マルチモーダルで効果的に活用されるマルチスケール情報の事前学習と活用について述べる。
論文 参考訳(メタデータ) (2024-03-08T16:18:04Z) - Self-supervised Visualisation of Medical Image Datasets [13.05427848112207]
自己教師付き学習法である$t$-SimCNEは、コントラスト学習を用いて、視覚化に適した2D表現を直接訓練する。
本研究では、皮膚科学、組織学、血液顕微鏡などの医療画像データセットの可視化に$t$-SimCNEを使用しました。
論文 参考訳(メタデータ) (2024-02-22T14:04:41Z) - Learning Multimodal Volumetric Features for Large-Scale Neuron Tracing [72.45257414889478]
オーバーセグメントニューロン間の接続を予測し,人間の作業量を削減することを目的としている。
最初はFlyTracingという名前のデータセットを構築しました。
本稿では,高密度なボリュームEM画像の埋め込みを生成するための,新しい接続性を考慮したコントラスト学習手法を提案する。
論文 参考訳(メタデータ) (2024-01-05T19:45:12Z) - Diffusion-based Data Augmentation for Nuclei Image Segmentation [68.28350341833526]
核セグメンテーションのための拡散法を初めて導入する。
このアイデアは、多数のラベル付き画像を合成し、セグメンテーションモデルを訓練することを目的としている。
実験の結果,10%のラベル付き実データセットを合成サンプルで拡張することにより,同等のセグメンテーション結果が得られることがわかった。
論文 参考訳(メタデータ) (2023-10-22T06:16:16Z) - AMIGO: Sparse Multi-Modal Graph Transformer with Shared-Context
Processing for Representation Learning of Giga-pixel Images [53.29794593104923]
本稿では,スライド病理像全体に対する共有コンテキスト処理の新たな概念を提案する。
AMIGOは、組織内のセルラーグラフを使用して、患者に単一の表現を提供する。
我々のモデルは、データの20%以下で同じ性能を達成できる程度に、欠落した情報に対して強い堅牢性を示す。
論文 参考訳(メタデータ) (2023-03-01T23:37:45Z) - MTNeuro: A Benchmark for Evaluating Representations of Brain Structure
Across Multiple Levels of Abstraction [0.0]
脳のマッピングでは、画像を自動的に解析して、小さな特徴とグローバルな特性の両方の表現を構築することは、決定的かつオープンな課題である。
我々のベンチマーク(MTNeuro)は、マウス脳の広い領域にまたがる体積分解能X線マイクロトモグラフィー画像に基づいている。
我々は様々な予測課題を生み出し、脳領域予測と画素レベルの微構造セマンティックセマンティックセグメンテーションのための教師付きおよび自己教師型モデルを評価した。
論文 参考訳(メタデータ) (2023-01-01T04:54:03Z) - Two-Stream Graph Convolutional Network for Intra-oral Scanner Image
Segmentation [133.02190910009384]
本稿では,2ストリームグラフ畳み込みネットワーク(TSGCN)を提案する。
TSGCNは3次元歯(表面)セグメンテーションにおいて最先端の方法よりも優れています。
論文 参考訳(メタデータ) (2022-04-19T10:41:09Z) - Generation of microbial colonies dataset with deep learning style
transfer [0.0]
深層学習モデルの学習に使用できるペトリ料理の微生物学的画像の合成データセットを作成するための戦略を導入する。
本手法は, 5種類の微生物の局在, セグメンテーション, 分類が可能なニューラルネットワークモデルのトレーニングに使用できる, リアルな画像のデータセットを合成できることを示す。
論文 参考訳(メタデータ) (2021-11-06T03:11:01Z) - Adaptive Context-Aware Multi-Modal Network for Depth Completion [107.15344488719322]
我々は,観測された空間コンテキストを捉えるために,グラフ伝搬を採用することを提案する。
次に、注意機構を伝搬に適用し、ネットワークが文脈情報を適応的にモデル化することを奨励する。
最後に、抽出したマルチモーダル特徴を効果的に活用するための対称ゲート融合戦略を導入する。
本稿では,Adaptive Context-Aware Multi-Modal Network (ACMNet) を2つのベンチマークで評価した。
論文 参考訳(メタデータ) (2020-08-25T06:00:06Z) - Towards Improved Human Action Recognition Using Convolutional Neural
Networks and Multimodal Fusion of Depth and Inertial Sensor Data [1.52292571922932]
本稿では,深度と慣性センサデータの融合によるヒューマンアクション認識(HAR)の精度向上を試みる。
我々は、深度データを逐次フロントビューイメージ(SFI)に変換し、これらの画像上でトレーニング済みのAlexNetを微調整する。
慣性データを信号画像(SI)に変換し、これらの画像上で別の畳み込みニューラルネットワーク(CNN)を訓練する。
論文 参考訳(メタデータ) (2020-08-22T03:41:34Z) - Sparse data to structured imageset transformation [0.0]
スパースデータセットを含む機械学習の問題は、サンプルと特徴の数が非常に大きい場合、畳み込みニューラルネットワークの使用の恩恵を受ける可能性がある。
このようなデータセットをイメージセットに変換し、畳み込みニューラルネットワークで使用可能な各イメージ構造を与えようとする。
論文 参考訳(メタデータ) (2020-05-07T20:36:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。