Fugu-MT 論文翻訳(概要): DeepDiffusion: Unsupervised Learning of Retrieval-adapted Representations via Diffusion-based Ranking on Latent Feature Manifold

論文の概要: DeepDiffusion: Unsupervised Learning of Retrieval-adapted Representations via Diffusion-based Ranking on Latent Feature Manifold

arxiv url: http://arxiv.org/abs/2112.07082v1
Date: Tue, 14 Dec 2021 00:43:35 GMT
ステータス: 翻訳完了
システム内更新日: 2021-12-15 16:57:40.696873
Title: DeepDiffusion: Unsupervised Learning of Retrieval-adapted Representations via Diffusion-based Ranking on Latent Feature Manifold
Title（参考訳）: Deep Diffusion:潜在特徴多様体上の拡散に基づく検索適応表現の教師なし学習
Authors: Takahiko Furuya and Ryutarou Ohbuchi
Abstract要約: 特徴表現の教師なし学習は、大量のマルチメディアデータを分析する上で、難しいが重要な問題である。本稿では,特徴多様体上の拡散距離とニューラルネットワークに基づく教師なし特徴学習を組み合わせることを提案する。このアイデアはDeepDiffusion(DD)と呼ばれる新しいアルゴリズムとして実現されている
参考スコア（独自算出の注目度）: 6.548580592686076
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Unsupervised learning of feature representations is a challenging yet important problem for analyzing a large collection of multimedia data that do not have semantic labels. Recently proposed neural network-based unsupervised learning approaches have succeeded in obtaining features appropriate for classification of multimedia data. However, unsupervised learning of feature representations adapted to content-based matching, comparison, or retrieval of multimedia data has not been explored well. To obtain such retrieval-adapted features, we introduce the idea of combining diffusion distance on a feature manifold with neural network-based unsupervised feature learning. This idea is realized as a novel algorithm called DeepDiffusion (DD). DD simultaneously optimizes two components, a feature embedding by a deep neural network and a distance metric that leverages diffusion on a latent feature manifold, together. DD relies on its loss function but not encoder architecture. It can thus be applied to diverse multimedia data types with their respective encoder architectures. Experimental evaluation using 3D shapes and 2D images demonstrates versatility as well as high accuracy of the DD algorithm. Code is available at https://github.com/takahikof/DeepDiffusion
Abstract（参考訳）: 特徴表現の教師なし学習は、意味ラベルを持たない大量のマルチメディアデータを解析する上で、難しいが重要な問題である。近年,ニューラルネットワークに基づく教師なし学習手法が,マルチメディアデータの分類に適した特徴の獲得に成功している。しかし,マルチメディアデータのマッチング,比較,検索に適応した特徴表現の教師なし学習はよく研究されていない。このような検索適応特徴を得るために,特徴多様体上の拡散距離とニューラルネットワークに基づく教師なし特徴学習を併用する手法を提案する。このアイデアはDeepDiffusion (DD)と呼ばれる新しいアルゴリズムとして実現されている。 ddは、ディープニューラルネットワークによる機能埋め込みと、潜在特徴多様体上の拡散を利用する距離メトリックの2つのコンポーネントを同時に最適化する。 DDは損失関数に依存しているがエンコーダアーキテクチャには依存していない。したがって、それぞれのエンコーダアーキテクチャを持つ多様なマルチメディアデータ型に適用することができる。 3次元形状と2次元画像を用いた実験的評価により,DDアルゴリズムの汎用性と高精度性を示す。コードはhttps://github.com/takahikof/DeepDiffusionで入手できる。

関連論文リスト

Binary Code Similarity Detection via Graph Contrastive Learning on Intermediate Representations [52.34030226129628]
バイナリコード類似度検出(BCSD)は、脆弱性検出、マルウェア分析、コードの再利用識別など、多くの分野で重要な役割を果たしている。本稿では,LLVM-IRと高レベルのセマンティック抽象化を利用して,コンパイル差を緩和するIRBinDiffを提案する。 IRBinDiffは1対1の比較と1対多の検索シナリオにおいて,他の主要なBCSD手法よりも優れていることを示す。
論文参考訳（メタデータ） (2024-10-24T09:09:20Z)
AMFD: Distillation via Adaptive Multimodal Fusion for Multispectral Pedestrian Detection [23.91870504363899]
マルチスペクトル検出におけるダブルストリームネットワークは、マルチモーダルデータに2つの異なる特徴抽出枝を用いる。これにより、組み込みデバイスにおける多スペクトル歩行者検出が自律システムに広く採用されるのを妨げている。本稿では,教師ネットワークの本来のモーダル特徴を完全に活用できる適応型モーダル核融合蒸留(AMFD)フレームワークについて紹介する。
論文参考訳（メタデータ） (2024-05-21T17:17:17Z)
DmADs-Net: Dense multiscale attention and depth-supervised network for medical image segmentation [10.85494240952418]
我々はDmAD-Net(Multiscale Attention and Depth-Supervised Network)を開発した。異なる深さで機能抽出にResNetを使用し、マルチスケールの畳み込み機能注意ブロックを作成します。ローカル・フィーチャー・アテンション・ブロックは、高レベルのセマンティック情報に対するローカル・フィーチャー・アテンションを強化するために作成される。フィーチャーフュージョンフェーズでは、異なるセマンティック情報の融合を強化するために、フィーチャーリファインメントとフュージョンブロックが作成される。
論文参考訳（メタデータ） (2024-05-01T12:15:58Z)
OV-Uni3DETR: Towards Unified Open-Vocabulary 3D Object Detection via Cycle-Modality Propagation [67.56268991234371]
OV-Uni3DETRは、様々なシナリオにおける最先端のパフォーマンスを達成し、既存のメソッドを平均6%以上上回っている。コードと事前訓練されたモデルは、後にリリースされる。
論文参考訳（メタデータ） (2024-03-28T17:05:04Z)
Assessing Neural Network Representations During Training Using Noise-Resilient Diffusion Spectral Entropy [55.014926694758195]
ニューラルネットワークにおけるエントロピーと相互情報は、学習プロセスに関する豊富な情報を提供する。データ幾何を利用して基礎となる多様体にアクセスし、これらの情報理論測度を確実に計算する。本研究は,高次元シミュレーションデータにおける固有次元と関係強度の耐雑音性の測定結果である。
論文参考訳（メタデータ） (2023-12-04T01:32:42Z)
HiDAnet: RGB-D Salient Object Detection via Hierarchical Depth Awareness [2.341385717236931]
本稿では,RGB-Dサリエンシ検出のための階層的深度認識ネットワーク(HiDAnet)を提案する。我々のモチベーションは、幾何学的先行の多粒性特性がニューラルネットワーク階層とよく相関しているという観察から来ています。当社のHiDAnetは最先端の手法よりも大きなマージンで良好に動作します。
論文参考訳（メタデータ） (2023-01-18T10:00:59Z)
ALSO: Automotive Lidar Self-supervision by Occupancy estimation [70.70557577874155]
本稿では,ポイントクラウド上で動作している深層知覚モデルのバックボーンを事前学習するための自己教師型手法を提案する。中心となる考え方は、3Dポイントがサンプリングされる表面の再構成であるプリテキストタスクでモデルをトレーニングすることである。直感的には、もしネットワークがわずかな入力ポイントのみを考慮し、シーン表面を再構築できるなら、おそらく意味情報の断片をキャプチャする。
論文参考訳（メタデータ） (2022-12-12T13:10:19Z)
PointMCD: Boosting Deep Point Cloud Encoders via Multi-view Cross-modal Distillation for 3D Shape Recognition [55.38462937452363]
本稿では,教師として事前訓練されたディープイメージエンコーダ,学生としてディープポイントエンコーダを含む多視点クロスモーダル蒸留アーキテクチャを提案する。複数ビューの視覚的および幾何学的記述子をペアワイズにアライメントすることで、より強力なディープポイントエンコーダを、疲労や複雑なネットワーク修正を伴わずに得ることができる。
論文参考訳（メタデータ） (2022-07-07T07:23:20Z)
DetMatch: Two Teachers are Better Than One for Joint 2D and 3D Semi-Supervised Object Detection [29.722784254501768]
DetMatchは、2Dおよび3Dモダリティに関する共同半教師付き学習のための柔軟なフレームワークである。両方のセンサーで検出された物体を識別することで、パイプラインはよりクリーンで堅牢な擬似ラベルを生成する。我々はRGB画像のよりリッチなセマンティクスを活用して、誤った3Dクラスの予測を修正し、3Dボックスのローカライズを改善する。
論文参考訳（メタデータ） (2022-03-17T17:58:00Z)
Improving Point Cloud Semantic Segmentation by Learning 3D Object Detection [102.62963605429508]
ポイントクラウドセマンティックセグメンテーションは、自動運転において重要な役割を果たす。現在の3Dセマンティックセグメンテーションネットワークは、よく表現されたクラスに対して優れた性能を発揮する畳み込みアーキテクチャに焦点を当てている。 Aware 3D Semantic Detection (DASS) フレームワークを提案する。
論文参考訳（メタデータ） (2020-09-22T14:17:40Z)
MSDPN: Monocular Depth Prediction with Partial Laser Observation using Multi-stage Neural Networks [1.1602089225841632]
深層学習に基づくマルチステージネットワークアーキテクチャであるMulti-Stage Depth Prediction Network (MSDPN)を提案する。 MSDPNは2次元LiDARと単眼カメラを用いて深度マップを予測する。実験により,本ネットワークは最先端手法に対して有望な性能を示す。
論文参考訳（メタデータ） (2020-08-04T08:27:40Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。