論文の概要: Deep Learning Techniques for Future Intelligent Cross-Media Retrieval
- arxiv url: http://arxiv.org/abs/2008.01191v1
- Date: Tue, 21 Jul 2020 09:49:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-08 04:48:56.611346
- Title: Deep Learning Techniques for Future Intelligent Cross-Media Retrieval
- Title(参考訳): 未来の知的クロスメディア検索のための深層学習技術
- Authors: Sadaqat ur Rehman, Muhammad Waqas, Shanshan Tu, Anis Koubaa, Obaid ur
Rehman, Jawad Ahmad, Muhammad Hanif, Zhu Han
- Abstract要約: マルチメディア検索は、ビッグデータアプリケーションにおいて重要な役割を果たす。
マルチモーダルなディープラーニングアプローチが直面する課題に応じて,新しい分類法を提供する。
検索によく知られたクロスメディアデータセットを提示する。
- 参考スコア(独自算出の注目度): 58.20547387332133
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With the advancement in technology and the expansion of broadcasting,
cross-media retrieval has gained much attention. It plays a significant role in
big data applications and consists in searching and finding data from different
types of media. In this paper, we provide a novel taxonomy according to the
challenges faced by multi-modal deep learning approaches in solving cross-media
retrieval, namely: representation, alignment, and translation. These challenges
are evaluated on deep learning (DL) based methods, which are categorized into
four main groups: 1) unsupervised methods, 2) supervised methods, 3) pairwise
based methods, and 4) rank based methods. Then, we present some well-known
cross-media datasets used for retrieval, considering the importance of these
datasets in the context in of deep learning based cross-media retrieval
approaches. Moreover, we also present an extensive review of the
state-of-the-art problems and its corresponding solutions for encouraging deep
learning in cross-media retrieval. The fundamental objective of this work is to
exploit Deep Neural Networks (DNNs) for bridging the "media gap", and provide
researchers and developers with a better understanding of the underlying
problems and the potential solutions of deep learning assisted cross-media
retrieval. To the best of our knowledge, this is the first comprehensive survey
to address cross-media retrieval under deep learning methods.
- Abstract(参考訳): 技術の発展と放送の拡大により、メディア横断検索が注目されるようになった。
ビッグデータアプリケーションでは重要な役割を担っており、さまざまな種類のメディアからデータを探し、発見する。
本稿では,マルチメディア検索におけるマルチモーダルな深層学習アプローチ,すなわち表現,アライメント,翻訳の課題に対応する新しい分類法を提案する。
これらの課題は,4つのグループに分類される深層学習(DL)に基づく手法に基づいて評価される。
1) 教師なしの方法,
2)監督方法
3)対関係に基づく方法、及び
4) ランクに基づく方法。
そこで我々は,深層学習に基づくクロスメディア検索手法において,これらのデータセットの重要性を考慮し,検索に使用されるよく知られたクロスメディアデータセットを提案する。
さらに,メディア間検索における深層学習を促進するための最先端問題とその対応ソリューションについて,広範なレビューを行う。
この研究の基本的な目的は、ディープニューラルネットワーク(dnn)を"メディアギャップ"の橋渡しに利用し、研究者や開発者に対して、深層学習支援クロスメディア検索の基盤となる問題や潜在的な解決策をより深く理解することにある。
我々の知る限りでは、ディープラーニング手法によるマルチメディア検索に対処するための総合的な調査としては、これが初めてである。
関連論文リスト
- Datasets, Clues and State-of-the-Arts for Multimedia Forensics: An
Extensive Review [19.30075248247771]
本調査は,ディープラーニングモデルを用いたマルチメディアデータにおける検出の改ざん手法に焦点をあてる。
悪質な操作検出のためのベンチマークデータセットの詳細な分析を公開している。
また、タグ付けヒントの包括的なリストや、一般的に使用されているディープラーニングアーキテクチャも提供する。
論文 参考訳(メタデータ) (2024-01-13T07:03:58Z) - Guided Depth Map Super-resolution: A Survey [88.54731860957804]
誘導深度マップ超解像(GDSR)は、高分解能(HR)深度マップを低分解能(LR)観測から2枚のHRカラー画像の助けを借りて再構成することを目的としている。
近年,特に強力な深層学習技術を用いて,斬新で効果的なアプローチが多数提案されている。
この調査は、GDSRの最近の進歩に関する包括的調査を提示する試みである。
論文 参考訳(メタデータ) (2023-02-19T15:43:54Z) - Cross-Media Scientific Research Achievements Retrieval Based on Deep
Language Model [2.900289363118179]
本稿では,深層言語モデル(CARDL)に基づくマルチメディア科学研究成果検索手法を提案する。
異なるモーダルデータ間のセマンティックアソシエーションを学習することにより、統合されたメディア間セマンティック表現を実現する。
異なるモーダルデータ間のセマンティックな類似性マッチングにより、クロスメディア検索を実現する。
論文 参考訳(メタデータ) (2022-03-29T14:04:53Z) - Scientific and Technological Information Oriented Semantics-adversarial and Media-adversarial Cross-media Retrieval [21.630525836722036]
クロスメディア科学・技術情報検索は、クロスメディア研究における重要な課題の1つである。
本稿では,科学技術情報指向のセマンティックス・アドバイサル・メディア・クロスメディア検索手法(SMCR)を提案する。
SMCRは、メディア間のセマンティックな一貫性の喪失を最小化し、メディア間のセマンティックな識別をモデル化し、マッピング前後のセマンティックな類似性を維持する。
論文 参考訳(メタデータ) (2022-03-16T13:31:48Z) - Weakly Supervised Object Localization and Detection: A Survey [145.5041117184952]
オブジェクトのローカライゼーションと検出は、新しい世代のコンピュータビジョンシステムを開発する上で重要な役割を果たす。
本稿では,(1)古典的モデル,(2)既成の深層ネットワークの特徴表現を用いたアプローチ,(3)ディープラーニングのみに基づくアプローチ,(4)この分野で広く利用されている公開データセットと標準評価指標についてレビューする。
この分野における重要な課題、この分野の開発履歴、各カテゴリーの手法の利点/欠点、異なるカテゴリーの方法間の関係、弱い監督対象のローカリゼーションおよび検出方法の適用、およびこの研究分野の開発をさらに促進するための潜在的な将来の方向性について議論します。
論文 参考訳(メタデータ) (2021-04-16T06:44:50Z) - Continual learning in cross-modal retrieval [47.73014647702813]
新しいタスクによる干渉が埋め込み空間に与える影響と、効果的な検索に必要な相互モーダルアライメントについて検討する。
トレーニング、インデクシング、クエリの段階を分離する一般的なフレームワークを提案します。
また、忘れてしまう可能性のあるさまざまな要因を特定し、研究し、緩和するためのツールを提案します。
論文 参考訳(メタデータ) (2021-04-14T12:13:39Z) - A Survey on Deep Semi-supervised Learning [51.26862262550445]
まず,既存の手法を分類した深層半指導学習の分類法を提案する。
次に、損失の種類、貢献度、アーキテクチャの違いの観点から、これらのメソッドを詳細に比較します。
論文 参考訳(メタデータ) (2021-02-28T16:22:58Z) - A Survey of Community Detection Approaches: From Statistical Modeling to
Deep Learning [95.27249880156256]
ネットワークコミュニティファイリング手法の統一アーキテクチャを開発し,提案する。
既存の手法を確率的グラフィカルモデルとディープラーニングという2つのカテゴリに分けた新しい分類法を提案する。
フィールドの課題の議論と今後の研究の方向性の提案を締めくくります。
論文 参考訳(メタデータ) (2021-01-03T02:32:45Z) - A Survey of Deep Meta-Learning [1.2891210250935143]
ディープニューラルネットワークは、巨大なデータセットと十分な計算リソースを提示することで、大きな成功を収めることができる。
しかし、新しい概念を素早く習得する能力は限られている。
ディープメタラーニング(Deep Meta-Learning)は、ネットワークが学習方法を学ぶことを可能にすることでこの問題に対処するアプローチのひとつだ。
論文 参考訳(メタデータ) (2020-10-07T17:09:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。