論文の概要: Multimedia Technology Applications and Algorithms: A Survey
- arxiv url: http://arxiv.org/abs/2104.01301v1
- Date: Sat, 3 Apr 2021 03:23:06 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-06 14:23:50.865400
- Title: Multimedia Technology Applications and Algorithms: A Survey
- Title(参考訳): マルチメディア技術の応用とアルゴリズム:調査
- Authors: Palak Tiwary and Sanjida Ahmed
- Abstract要約: 本調査では,先述の領域で開発されたマルチメディア技術とアルゴリズムについて概説する。
その結果、マルチメディアはヘルスケアおよび医学、人間の顔の特徴の抽出および追跡、ポーズの認識、相違の推定、等のような分野に統合されました。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multimedia related research and development has evolved rapidly in the last
few years with advancements in hardware, software and network infrastructures.
As a result, multimedia has been integrated into domains like Healthcare and
Medicine, Human facial feature extraction and tracking, pose recognition,
disparity estimation, etc. This survey gives an overview of the various
multimedia technologies and algorithms developed in the domains mentioned.
- Abstract(参考訳): マルチメディア関連の研究と開発はここ数年で急速に進化し、ハードウェア、ソフトウェア、ネットワークインフラが進歩した。
その結果、マルチメディアは、ヘルスケアや医療、人間の顔の特徴抽出と追跡、ポーズ認識、不一致推定などの分野に統合された。
本調査では,先述の領域で開発されたマルチメディア技術とアルゴリズムについて概説する。
関連論文リスト
- Multimodal Alignment and Fusion: A Survey [7.250878248686215]
マルチモーダル統合により、モデルの精度と適用性が改善される。
我々は既存のアライメントと融合の手法を体系的に分類し分析する。
この調査は、ソーシャルメディア分析、医療画像、感情認識といった分野の応用に焦点を当てている。
論文 参考訳(メタデータ) (2024-11-26T02:10:27Z) - A Comprehensive Survey on Underwater Image Enhancement Based on Deep Learning [51.7818820745221]
水中画像強調(UIE)はコンピュータビジョン研究において重要な課題である。
多数のUIEアルゴリズムが開発されているにもかかわらず、網羅的で体系的なレビューはいまだに欠落している。
論文 参考訳(メタデータ) (2024-05-30T04:46:40Z) - LLMs Meet Multimodal Generation and Editing: A Survey [89.76691959033323]
本調査では,画像,ビデオ,3D,オーディオなど,さまざまな領域にわたるマルチモーダル生成と編集について詳述する。
これらの分野でのマイルストーンの成果を要約し、これらの研究をLLM法とCLIP/T5法に分類する。
我々は、既存の生成モデルを人間とコンピュータの相互作用に活用できるツール強化マルチモーダルエージェントを掘り下げる。
論文 参考訳(メタデータ) (2024-05-29T17:59:20Z) - Detecting Multimedia Generated by Large AI Models: A Survey [26.84095559297626]
この調査の目的は、学術的なギャップを埋め、グローバルなAIセキュリティ努力に貢献することである。
メディアモダリティによって分類された検出手法のための新しい分類法を提案する。
本稿では,生成機構,公開データセット,オンライン検出ツールの概要を紹介する。
論文 参考訳(メタデータ) (2024-01-22T15:08:19Z) - Study and Survey on Gesture Recognition Systems [0.0]
本稿では,ゲーム,医療,家電,産業用ロボット,バーチャルリアリティといった多分野におけるジェスチャー認識システムの実装について論じる。
手話におけるジェスチャーの役割が研究され、既存のアプローチがレビューされている。
ジェスチャー認識システムを構築する際に直面する共通の課題も検討されている。
論文 参考訳(メタデータ) (2023-12-01T07:29:30Z) - Vision+X: A Survey on Multimodal Learning in the Light of Data [64.03266872103835]
様々なソースからのデータを組み込んだマルチモーダル機械学習が,ますます普及している研究分野となっている。
我々は、視覚、音声、テキスト、動きなど、各データフォーマットの共通点と特異点を分析する。
本稿では,表現学習と下流アプリケーションレベルの両方から,マルチモーダル学習に関する既存の文献を考察する。
論文 参考訳(メタデータ) (2022-10-05T13:14:57Z) - Foundations and Recent Trends in Multimodal Machine Learning:
Principles, Challenges, and Open Questions [68.6358773622615]
本稿では,マルチモーダル機械学習の計算的基礎と理論的基礎について概説する。
本稿では,表現,アライメント,推論,生成,伝達,定量化という,6つの技術課題の分類法を提案する。
最近の技術的成果は、この分類のレンズを通して示され、研究者は新しいアプローチの類似点と相違点を理解することができる。
論文 参考訳(メタデータ) (2022-09-07T19:21:19Z) - A Survey of Multimedia Technologies and Robust Algorithms [0.0]
本調査は,マルチメディアデータ処理,医療マルチメディア処理,顔表情追跡とポーズ認識,教育と教育におけるマルチメディアにおけるマルチメディア技術と頑健なアルゴリズムの概要を提供する。
私たちは、今後の研究のインスピレーションと出発点であるアルバータ大学マルチメディア研究センター(MRC)に感謝したいと思います。
論文 参考訳(メタデータ) (2021-03-24T20:52:23Z) - Deep Image Retrieval: A Survey [21.209884703192735]
深層学習による画像検索に焦点をあて, 深層ネットワーク構造の種類に応じて, 最先端の手法を整理する。
本調査は,カテゴリベースCBIR分野のグローバルな展望を促進することを目的とした,近年の多種多様な手法について考察する。
論文 参考訳(メタデータ) (2021-01-27T09:32:58Z) - Domain Shift in Computer Vision models for MRI data analysis: An
Overview [64.69150970967524]
機械学習とコンピュータビジョン手法は、医用画像解析において優れた性能を示している。
しかし、現在臨床応用はごくわずかである。
異なるソースや取得ドメインのデータへのモデルの不適切な転送性は、その理由の1つです。
論文 参考訳(メタデータ) (2020-10-14T16:34:21Z) - Image Segmentation Using Deep Learning: A Survey [58.37211170954998]
イメージセグメンテーションは、画像処理とコンピュータビジョンにおいて重要なトピックである。
深層学習モデルを用いた画像セグメンテーション手法の開発を目的とした研究が,これまでに数多く行われている。
論文 参考訳(メタデータ) (2020-01-15T21:37:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。