論文の概要: Multimodal Classification: Current Landscape, Taxonomy and Future
Directions
- arxiv url: http://arxiv.org/abs/2109.09020v1
- Date: Sat, 18 Sep 2021 22:01:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-23 08:51:24.422686
- Title: Multimodal Classification: Current Landscape, Taxonomy and Future
Directions
- Title(参考訳): マルチモーダル分類 : 現在の景観, 分類, 今後の方向性
- Authors: William C. Sleeman IV, Rishabh Kapoor and Preetam Ghosh
- Abstract要約: マルチモーダル分類の研究は、衛星画像、バイオメトリックス、医学を含む複数の情報源からより多くのデータを収集する多くの領域で人気を集めている。
一貫性のある用語やアーキテクチャ記述の欠如は、既存のソリューションを比較するのを困難にしている。
本稿では,近年のマルチモーダル分類における傾向に基づいて,このようなシステムを記述するための新しい分類法を提案する。
- 参考スコア(独自算出の注目度): 0.09668407688201358
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multimodal classification research has been gaining popularity in many
domains that collect more data from multiple sources including satellite
imagery, biometrics, and medicine. However, the lack of consistent terminology
and architectural descriptions makes it difficult to compare different existing
solutions. We address these challenges by proposing a new taxonomy for
describing such systems based on trends found in recent publications on
multimodal classification. Many of the most difficult aspects of unimodal
classification have not yet been fully addressed for multimodal datasets
including big data, class imbalance, and instance level difficulty. We also
provide a discussion of these challenges and future directions.
- Abstract(参考訳): マルチモーダル分類研究は、衛星画像、バイオメトリックス、医学など複数のソースからより多くのデータを収集する多くのドメインで人気を集めている。
しかし、一貫した用語やアーキテクチャ記述がないため、既存のソリューションを比較することは困難である。
本稿では,近年のマルチモーダル分類の動向に基づいて,このようなシステムを記述するための新しい分類法を提案する。
ユニモーダル分類の最も難しい側面の多くは、ビッグデータ、クラス不均衡、インスタンスレベルの難易度を含むマルチモーダルデータセットに対して、まだ完全に対処されていない。
これらの課題と今後の方向性についても議論する。
関連論文リスト
- Online Model-based Anomaly Detection in Multivariate Time Series: Taxonomy, Survey, Research Challenges and Future Directions [0.017476232824732776]
時系列異常検出は、エンジニアリングプロセスにおいて重要な役割を果たす。
この調査では、オンラインとオフラインの区別とトレーニングと推論を行う新しい分類法を紹介した。
文献で使用される最も一般的なデータセットと評価指標、および詳細な分析を示す。
論文 参考訳(メタデータ) (2024-08-07T13:01:10Z) - Multimodal Fusion on Low-quality Data: A Comprehensive Survey [110.22752954128738]
本稿では,野生におけるマルチモーダル核融合の共通課題と最近の進歩について考察する。
低品質データ上でのマルチモーダル融合で直面する4つの主な課題を同定する。
この新たな分類によって、研究者はフィールドの状態を理解し、いくつかの潜在的な方向を特定することができる。
論文 参考訳(メタデータ) (2024-04-27T07:22:28Z) - A Survey of Deep Long-Tail Classification Advancements [1.6233132273470656]
実世界の多くのデータ分布は、ほとんど均一ではない。代わりに、様々な種類の歪んだ、長い尾の分布がよく見られる。
これは機械学習にとって興味深い問題であり、ほとんどのアルゴリズムが均一に分散されたデータを想定したり、うまく機能する。
この問題は、大量のトレーニングデータを必要とする現在の最先端のディープラーニングモデルによってさらに悪化している。
論文 参考訳(メタデータ) (2024-04-24T01:59:02Z) - Multimodal Large Language Models: A Survey [36.06016060015404]
マルチモーダル言語モデルは、画像、テキスト、言語、音声、その他の異種性など、複数のデータタイプを統合する。
本稿では、マルチモーダルの概念を定義し、マルチモーダルアルゴリズムの歴史的展開を検討することから始める。
実用的なガイドが提供され、マルチモーダルモデルの技術的な側面に関する洞察を提供する。
最後に,マルチモーダルモデルの適用について検討し,開発に伴う課題について考察する。
論文 参考訳(メタデータ) (2023-11-22T05:15:12Z) - Enhancing Human-like Multi-Modal Reasoning: A New Challenging Dataset
and Comprehensive Framework [51.44863255495668]
マルチモーダル推論は、人間のような知性を示す人工知能システムの追求において重要な要素である。
提案するマルチモーダル推論(COCO-MMR)データセットは,オープンエンド質問の集合を包含する新しいデータセットである。
画像とテキストエンコーダを強化するために,マルチホップ・クロスモーダル・アテンションや文レベルのコントラスト学習などの革新的な手法を提案する。
論文 参考訳(メタデータ) (2023-07-24T08:58:25Z) - How Many Answers Should I Give? An Empirical Study of Multi-Answer
Reading Comprehension [64.76737510530184]
我々は、一般的に見られるマルチアンサーMRCインスタンスを分類するために分類を設計する。
我々は、現在のマルチ・アンサー・MCCモデルのパラダイムが、異なるタイプのマルチ・アンサー・インスタンスをどのように扱うかを分析する。
論文 参考訳(メタデータ) (2023-06-01T08:22:21Z) - Geo-Spatiotemporal Features and Shape-Based Prior Knowledge for
Fine-grained Imbalanced Data Classification [63.916371837696396]
細粒度分類は、類似のグローバル知覚とパターンを持つ項目を区別することを目的としているが、細部によって異なる。
私たちの主な課題は、小さなクラス間バリエーションと大きなクラス内バリエーションの両方から来ています。
我々は,野生生物の利用事例における細粒度分類を改善するため,いくつかの革新を組み合わせることを提案する。
論文 参考訳(メタデータ) (2021-03-21T02:01:38Z) - Multi-label Ranking: Mining Multi-label and Label Ranking Data [1.8275108630751844]
従来のトランスフォーメーションと適応のカテゴリにはもはや当てはまらないので、ユニークな課題を強調し、メソッドを再分類します。
本研究は, 深層学習型マルチラベルマイニング, 極度なマルチラベル分類, ラベルランキングにおける最先端の手法に着目して, 過去10年間の開発状況を調査した。
論文 参考訳(メタデータ) (2021-01-03T08:36:45Z) - A Multi-Semantic Metapath Model for Large Scale Heterogeneous Network
Representation Learning [52.83948119677194]
大規模不均一表現学習のためのマルチセマンティックメタパス(MSM)モデルを提案する。
具体的には,マルチセマンティックなメタパスに基づくランダムウォークを生成し,不均衡な分布を扱うヘテロジニアスな近傍を構築する。
提案するフレームワークに対して,AmazonとAlibabaの2つの挑戦的なデータセットに対して,体系的な評価を行う。
論文 参考訳(メタデータ) (2020-07-19T22:50:20Z) - Multi-source Domain Adaptation in the Deep Learning Era: A Systematic
Survey [53.656086832255944]
マルチソースドメイン適応(MDA)は、ラベル付きデータを複数のソースから収集できる強力な拡張である。
MDAは学術と産業の両方で注目を集めている。
論文 参考訳(メタデータ) (2020-02-26T08:07:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。