論文の概要: A survey of manifold learning and its applications for multimedia
- arxiv url: http://arxiv.org/abs/2310.12986v1
- Date: Fri, 8 Sep 2023 07:16:45 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-15 16:42:38.035324
- Title: A survey of manifold learning and its applications for multimedia
- Title(参考訳): 多様体学習とそのマルチメディアへの応用に関する調査
- Authors: Hannes Fassold
- Abstract要約: 多様体学習は、機械学習の新たな研究領域です。
本稿では,マルチメディアにおける多様体学習とその重要な応用分野への応用について紹介する。
- 参考スコア(独自算出の注目度): 1.0878040851637998
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Manifold learning is an emerging research domain of machine learning. In this
work, we give an introduction into manifold learning and how it is employed for
important application fields in multimedia.
- Abstract(参考訳): Manifold Learningは、機械学習の新たな研究領域である。
本稿では,マルチメディアにおける多様体学習とその重要な応用分野への応用について紹介する。
関連論文リスト
- Application-Driven Innovation in Machine Learning [56.85396167616353]
機械学習におけるアプリケーション駆動研究のパラダイムについて述べる。
このアプローチがメソッド駆動の作業と生産的に相乗効果を示す。
このようなメリットにもかかわらず、マシンラーニングにおけるレビュー、採用、教育のプラクティスが、アプリケーション主導のイノベーションを後押しすることが多いことに気付きます。
論文 参考訳(メタデータ) (2024-03-26T04:59:27Z) - Learning on Multimodal Graphs: A Survey [6.362513821299131]
マルチモーダルデータは医療、ソーシャルメディア、交通など様々な領域に及んでいる。
マルチモーダルグラフ学習(MGL)は、人工知能(AI)アプリケーションの成功に不可欠である。
論文 参考訳(メタデータ) (2024-02-07T23:50:00Z) - Multimodal Foundation Models: From Specialists to General-Purpose
Assistants [187.72038587829223]
研究のランドスケープには5つの中核的なトピックが含まれており、2つのクラスに分類されている。
対象読者は、コンピュータビジョンの研究者、大学院生、およびビジョン言語によるマルチモーダルコミュニティの専門家である。
論文 参考訳(メタデータ) (2023-09-18T17:56:28Z) - Vision+X: A Survey on Multimodal Learning in the Light of Data [71.07658443380264]
様々なモダリティのデータを組み込んだマルチモーダル機械学習は、ますます人気のある研究分野になりつつある。
我々は、視覚、音声、テキストなど、各データフォーマットの共通点と特異点を分析し、Vision+Xの組み合わせによって分類された技術開発を提示する。
論文 参考訳(メタデータ) (2022-10-05T13:14:57Z) - Foundations and Recent Trends in Multimodal Machine Learning:
Principles, Challenges, and Open Questions [68.6358773622615]
本稿では,マルチモーダル機械学習の計算的基礎と理論的基礎について概説する。
本稿では,表現,アライメント,推論,生成,伝達,定量化という,6つの技術課題の分類法を提案する。
最近の技術的成果は、この分類のレンズを通して示され、研究者は新しいアプローチの類似点と相違点を理解することができる。
論文 参考訳(メタデータ) (2022-09-07T19:21:19Z) - Self-Supervised Learning for Videos: A Survey [70.37277191524755]
自己教師型学習は、画像ドメインとビデオドメインの両方で有望である。
本稿では,ビデオ領域に着目した自己教師型学習における既存のアプローチについて概観する。
論文 参考訳(メタデータ) (2022-06-18T00:26:52Z) - A Review on Methods and Applications in Multimodal Deep Learning [8.152125331009389]
マルチモーダル深層学習は、様々な感覚が情報処理に携わっているときに、よりよく理解し、分析するのに役立つ。
本稿では,画像,ビデオ,テキスト,音声,身体ジェスチャー,表情,生理的信号など,多種類のモダリティに焦点を当てる。
様々なマルチモーダル深層学習手法のきめ細かい分類法を提案し,様々な応用をより深く研究した。
論文 参考訳(メタデータ) (2022-02-18T13:50:44Z) - Multimodality in Meta-Learning: A Comprehensive Survey [34.69292359136745]
このサーベイは、マルチモーダリティに基づくメタラーニングの展望を概観する。
我々はまず,メタラーニングとマルチモーダリティの定義と,この成長分野における研究課題を定式化する。
そこで我々は,マルチモーダルタスクと組み合わせた典型的なメタ学習アルゴリズムを体系的に議論する新しい分類法を提案する。
論文 参考訳(メタデータ) (2021-09-28T09:16:12Z) - Recent Advances and Trends in Multimodal Deep Learning: A Review [9.11022096530605]
マルチモーダルディープラーニングは、様々なモーダルを使って情報を処理およびリンクできるモデルを作成することを目的としている。
本稿では,画像,ビデオ,テキスト,音声,身体ジェスチャー,表情,生理的信号など,多種類のモダリティに焦点を当てる。
様々なマルチモーダル深層学習応用のきめ細かい分類法が提案され、様々な応用をより深く研究している。
論文 参考訳(メタデータ) (2021-05-24T04:20:45Z) - A Survey of Multimedia Technologies and Robust Algorithms [0.0]
本調査は,マルチメディアデータ処理,医療マルチメディア処理,顔表情追跡とポーズ認識,教育と教育におけるマルチメディアにおけるマルチメディア技術と頑健なアルゴリズムの概要を提供する。
私たちは、今後の研究のインスピレーションと出発点であるアルバータ大学マルチメディア研究センター(MRC)に感謝したいと思います。
論文 参考訳(メタデータ) (2021-03-24T20:52:23Z) - Deep Learning Techniques for Future Intelligent Cross-Media Retrieval [58.20547387332133]
マルチメディア検索は、ビッグデータアプリケーションにおいて重要な役割を果たす。
マルチモーダルなディープラーニングアプローチが直面する課題に応じて,新しい分類法を提供する。
検索によく知られたクロスメディアデータセットを提示する。
論文 参考訳(メタデータ) (2020-07-21T09:49:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。