論文の概要: DeepDiffusion: Unsupervised Learning of Retrieval-adapted
Representations via Diffusion-based Ranking on Latent Feature Manifold
- arxiv url: http://arxiv.org/abs/2112.07082v1
- Date: Tue, 14 Dec 2021 00:43:35 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-15 16:57:40.696873
- Title: DeepDiffusion: Unsupervised Learning of Retrieval-adapted
Representations via Diffusion-based Ranking on Latent Feature Manifold
- Title(参考訳): Deep Diffusion:潜在特徴多様体上の拡散に基づく検索適応表現の教師なし学習
- Authors: Takahiko Furuya and Ryutarou Ohbuchi
- Abstract要約: 特徴表現の教師なし学習は、大量のマルチメディアデータを分析する上で、難しいが重要な問題である。
本稿では,特徴多様体上の拡散距離とニューラルネットワークに基づく教師なし特徴学習を組み合わせることを提案する。
このアイデアはDeepDiffusion(DD)と呼ばれる新しいアルゴリズムとして実現されている
- 参考スコア(独自算出の注目度): 6.548580592686076
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Unsupervised learning of feature representations is a challenging yet
important problem for analyzing a large collection of multimedia data that do
not have semantic labels. Recently proposed neural network-based unsupervised
learning approaches have succeeded in obtaining features appropriate for
classification of multimedia data. However, unsupervised learning of feature
representations adapted to content-based matching, comparison, or retrieval of
multimedia data has not been explored well. To obtain such retrieval-adapted
features, we introduce the idea of combining diffusion distance on a feature
manifold with neural network-based unsupervised feature learning. This idea is
realized as a novel algorithm called DeepDiffusion (DD). DD simultaneously
optimizes two components, a feature embedding by a deep neural network and a
distance metric that leverages diffusion on a latent feature manifold,
together. DD relies on its loss function but not encoder architecture. It can
thus be applied to diverse multimedia data types with their respective encoder
architectures. Experimental evaluation using 3D shapes and 2D images
demonstrates versatility as well as high accuracy of the DD algorithm. Code is
available at https://github.com/takahikof/DeepDiffusion
- Abstract(参考訳): 特徴表現の教師なし学習は、意味ラベルを持たない大量のマルチメディアデータを解析する上で、難しいが重要な問題である。
近年,ニューラルネットワークに基づく教師なし学習手法が,マルチメディアデータの分類に適した特徴の獲得に成功している。
しかし,マルチメディアデータのマッチング,比較,検索に適応した特徴表現の教師なし学習はよく研究されていない。
このような検索適応特徴を得るために,特徴多様体上の拡散距離とニューラルネットワークに基づく教師なし特徴学習を併用する手法を提案する。
このアイデアはDeepDiffusion (DD)と呼ばれる新しいアルゴリズムとして実現されている。
ddは、ディープニューラルネットワークによる機能埋め込みと、潜在特徴多様体上の拡散を利用する距離メトリックの2つのコンポーネントを同時に最適化する。
DDは損失関数に依存しているがエンコーダアーキテクチャには依存していない。
したがって、それぞれのエンコーダアーキテクチャを持つ多様なマルチメディアデータ型に適用することができる。
3次元形状と2次元画像を用いた実験的評価により,DDアルゴリズムの汎用性と高精度性を示す。
コードはhttps://github.com/takahikof/DeepDiffusionで入手できる。
関連論文リスト
- ESDMR-Net: A Lightweight Network With Expand-Squeeze and Dual Multiscale
Residual Connections for Medical Image Segmentation [7.921517156237902]
本稿では,拡張型マルチスケール残差ネットワーク(ESDMR-Net)を提案する。
完全な畳み込みネットワークであり、モバイルデバイスのようなリソースに制約のあるコンピューティングハードウェアに適している。
5つの異なる応用例から7つのデータセットについて実験を行った。
論文 参考訳(メタデータ) (2023-12-17T02:15:49Z) - Assessing Neural Network Representations During Training Using
Noise-Resilient Diffusion Spectral Entropy [55.014926694758195]
ニューラルネットワークにおけるエントロピーと相互情報は、学習プロセスに関する豊富な情報を提供する。
データ幾何を利用して基礎となる多様体にアクセスし、これらの情報理論測度を確実に計算する。
本研究は,高次元シミュレーションデータにおける固有次元と関係強度の耐雑音性の測定結果である。
論文 参考訳(メタデータ) (2023-12-04T01:32:42Z) - DiffusionEngine: Diffusion Model is Scalable Data Engine for Object
Detection [41.436817746749384]
Diffusion Modelはオブジェクト検出のためのスケーラブルなデータエンジンである。
DiffusionEngine(DE)は、高品質な検出指向のトレーニングペアを単一のステージで提供する。
論文 参考訳(メタデータ) (2023-09-07T17:55:01Z) - HiDAnet: RGB-D Salient Object Detection via Hierarchical Depth Awareness [2.341385717236931]
本稿では,RGB-Dサリエンシ検出のための階層的深度認識ネットワーク(HiDAnet)を提案する。
我々のモチベーションは、幾何学的先行の多粒性特性がニューラルネットワーク階層とよく相関しているという観察から来ています。
当社のHiDAnetは最先端の手法よりも大きなマージンで良好に動作します。
論文 参考訳(メタデータ) (2023-01-18T10:00:59Z) - ALSO: Automotive Lidar Self-supervision by Occupancy estimation [70.70557577874155]
本稿では,ポイントクラウド上で動作している深層知覚モデルのバックボーンを事前学習するための自己教師型手法を提案する。
中心となる考え方は、3Dポイントがサンプリングされる表面の再構成であるプリテキストタスクでモデルをトレーニングすることである。
直感的には、もしネットワークがわずかな入力ポイントのみを考慮し、シーン表面を再構築できるなら、おそらく意味情報の断片をキャプチャする。
論文 参考訳(メタデータ) (2022-12-12T13:10:19Z) - Dual Multi-scale Mean Teacher Network for Semi-supervised Infection
Segmentation in Chest CT Volume for COVID-19 [76.51091445670596]
CT(Computed tomography)データから肺感染症を自動的に検出することは、COVID-19と戦う上で重要な役割を担っている。
現在の新型コロナウイルス感染症のセグメンテーションのほとんどは、主に3Dシーケンシャルな制約を欠いた2D CT画像に依存している。
既存の3次元CTセグメンテーション法では,3次元ボリュームにおける複数レベルの受容場サイズを達成できない単一スケールの表現に焦点が当てられている。
論文 参考訳(メタデータ) (2022-11-10T13:11:21Z) - PointMCD: Boosting Deep Point Cloud Encoders via Multi-view Cross-modal
Distillation for 3D Shape Recognition [55.38462937452363]
本稿では,教師として事前訓練されたディープイメージエンコーダ,学生としてディープポイントエンコーダを含む多視点クロスモーダル蒸留アーキテクチャを提案する。
複数ビューの視覚的および幾何学的記述子をペアワイズにアライメントすることで、より強力なディープポイントエンコーダを、疲労や複雑なネットワーク修正を伴わずに得ることができる。
論文 参考訳(メタデータ) (2022-07-07T07:23:20Z) - DetMatch: Two Teachers are Better Than One for Joint 2D and 3D
Semi-Supervised Object Detection [29.722784254501768]
DetMatchは、2Dおよび3Dモダリティに関する共同半教師付き学習のための柔軟なフレームワークである。
両方のセンサーで検出された物体を識別することで、パイプラインはよりクリーンで堅牢な擬似ラベルを生成する。
我々はRGB画像のよりリッチなセマンティクスを活用して、誤った3Dクラスの予測を修正し、3Dボックスのローカライズを改善する。
論文 参考訳(メタデータ) (2022-03-17T17:58:00Z) - Rotation-Equivariant Deep Learning for Diffusion MRI [49.321304988619865]
畳み込みネットワークは成功しているが、最近は回転や翻訳で等価である新しいニューラルネットワークによってパフォーマンスが上がっている。
ここでは、6次元拡散MRIデータに一般化し、画像空間における3次元ロト変換と一致する3次元回転を$q$-スペースで保証する。
提案するニューラルネットワークは,非回転同変深層学習と比較して,より優れた結果を得るとともに,トレーニングのためのスキャンを少なくする。
論文 参考訳(メタデータ) (2021-02-13T15:18:34Z) - Improving Point Cloud Semantic Segmentation by Learning 3D Object
Detection [102.62963605429508]
ポイントクラウドセマンティックセグメンテーションは、自動運転において重要な役割を果たす。
現在の3Dセマンティックセグメンテーションネットワークは、よく表現されたクラスに対して優れた性能を発揮する畳み込みアーキテクチャに焦点を当てている。
Aware 3D Semantic Detection (DASS) フレームワークを提案する。
論文 参考訳(メタデータ) (2020-09-22T14:17:40Z) - MSDPN: Monocular Depth Prediction with Partial Laser Observation using
Multi-stage Neural Networks [1.1602089225841632]
深層学習に基づくマルチステージネットワークアーキテクチャであるMulti-Stage Depth Prediction Network (MSDPN)を提案する。
MSDPNは2次元LiDARと単眼カメラを用いて深度マップを予測する。
実験により,本ネットワークは最先端手法に対して有望な性能を示す。
論文 参考訳(メタデータ) (2020-08-04T08:27:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。