論文の概要: Multimodal Classification: Current Landscape, Taxonomy and Future
Directions
- arxiv url: http://arxiv.org/abs/2109.09020v1
- Date: Sat, 18 Sep 2021 22:01:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-23 08:51:24.422686
- Title: Multimodal Classification: Current Landscape, Taxonomy and Future
Directions
- Title(参考訳): マルチモーダル分類 : 現在の景観, 分類, 今後の方向性
- Authors: William C. Sleeman IV, Rishabh Kapoor and Preetam Ghosh
- Abstract要約: マルチモーダル分類の研究は、衛星画像、バイオメトリックス、医学を含む複数の情報源からより多くのデータを収集する多くの領域で人気を集めている。
一貫性のある用語やアーキテクチャ記述の欠如は、既存のソリューションを比較するのを困難にしている。
本稿では,近年のマルチモーダル分類における傾向に基づいて,このようなシステムを記述するための新しい分類法を提案する。
- 参考スコア(独自算出の注目度): 0.09668407688201358
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multimodal classification research has been gaining popularity in many
domains that collect more data from multiple sources including satellite
imagery, biometrics, and medicine. However, the lack of consistent terminology
and architectural descriptions makes it difficult to compare different existing
solutions. We address these challenges by proposing a new taxonomy for
describing such systems based on trends found in recent publications on
multimodal classification. Many of the most difficult aspects of unimodal
classification have not yet been fully addressed for multimodal datasets
including big data, class imbalance, and instance level difficulty. We also
provide a discussion of these challenges and future directions.
- Abstract(参考訳): マルチモーダル分類研究は、衛星画像、バイオメトリックス、医学など複数のソースからより多くのデータを収集する多くのドメインで人気を集めている。
しかし、一貫した用語やアーキテクチャ記述がないため、既存のソリューションを比較することは困難である。
本稿では,近年のマルチモーダル分類の動向に基づいて,このようなシステムを記述するための新しい分類法を提案する。
ユニモーダル分類の最も難しい側面の多くは、ビッグデータ、クラス不均衡、インスタンスレベルの難易度を含むマルチモーダルデータセットに対して、まだ完全に対処されていない。
これらの課題と今後の方向性についても議論する。
関連論文リスト
- Multimodal Large Language Models: A Survey [36.06016060015404]
マルチモーダル言語モデルは、画像、テキスト、言語、音声、その他の異種性など、複数のデータタイプを統合する。
本稿では、マルチモーダルの概念を定義し、マルチモーダルアルゴリズムの歴史的展開を検討することから始める。
実用的なガイドが提供され、マルチモーダルモデルの技術的な側面に関する洞察を提供する。
最後に,マルチモーダルモデルの適用について検討し,開発に伴う課題について考察する。
論文 参考訳(メタデータ) (2023-11-22T05:15:12Z) - Recent Advances in Hierarchical Multi-label Text Classification: A
Survey [11.709847202580505]
階層的マルチラベルテキスト分類は、入力されたテキストを複数のラベルに分類することを目的としており、その中にラベルが構造化され階層的である。
これは、科学文献のアーカイブなど、多くの現実世界の応用において重要なタスクである。
論文 参考訳(メタデータ) (2023-07-30T16:13:00Z) - Enhancing Human-like Multi-Modal Reasoning: A New Challenging Dataset
and Comprehensive Framework [51.44863255495668]
マルチモーダル推論は、人間のような知性を示す人工知能システムの追求において重要な要素である。
提案するマルチモーダル推論(COCO-MMR)データセットは,オープンエンド質問の集合を包含する新しいデータセットである。
画像とテキストエンコーダを強化するために,マルチホップ・クロスモーダル・アテンションや文レベルのコントラスト学習などの革新的な手法を提案する。
論文 参考訳(メタデータ) (2023-07-24T08:58:25Z) - How Many Answers Should I Give? An Empirical Study of Multi-Answer
Reading Comprehension [64.76737510530184]
我々は、一般的に見られるマルチアンサーMRCインスタンスを分類するために分類を設計する。
我々は、現在のマルチ・アンサー・MCCモデルのパラダイムが、異なるタイプのマルチ・アンサー・インスタンスをどのように扱うかを分析する。
論文 参考訳(メタデータ) (2023-06-01T08:22:21Z) - Learning Reliable Representations for Incomplete Multi-View Partial
Multi-Label Classification [65.95823612309356]
本稿ではRANKという不完全なマルチビュー部分的マルチラベル分類ネットワークを提案する。
既存の手法に固有のビューレベルの重みを分解し、各サンプルのビューに品質スコアを動的に割り当てる品質対応サブネットワークを提案する。
我々のモデルは、完全なマルチビューマルチラベルデータセットを処理できるだけでなく、欠落したインスタンスやラベルを持つデータセットでも機能する。
論文 参考訳(メタデータ) (2023-03-30T03:09:25Z) - Grow and Merge: A Unified Framework for Continuous Categories Discovery [44.28297337872006]
我々は、ラベルのないデータがカテゴリ発見システムに継続的に供給されるアプリケーションシナリオに焦点を当てる。
bf成長とマージ(bf GM)のフレームワークを開発し、成長相と融合相を交互に行う。
成長段階において、効果的なカテゴリマイニングのための継続的自己教師付き学習を通じて、特徴の多様性を高める。
マージフェーズでは、成長したモデルを静的モデルとマージして、既知のクラスのパフォーマンスを確実にします。
論文 参考訳(メタデータ) (2022-10-09T05:49:03Z) - A survey of multimodal deep generative models [20.717591403306287]
マルチモーダル学習は、様々なタイプのモダリティに基づいて予測を行うモデルを構築するためのフレームワークである。
ディープニューラルネットワークによって分布がパラメータ化されるディープジェネレーティブモデルが注目されている。
論文 参考訳(メタデータ) (2022-07-05T15:48:51Z) - Geo-Spatiotemporal Features and Shape-Based Prior Knowledge for
Fine-grained Imbalanced Data Classification [63.916371837696396]
細粒度分類は、類似のグローバル知覚とパターンを持つ項目を区別することを目的としているが、細部によって異なる。
私たちの主な課題は、小さなクラス間バリエーションと大きなクラス内バリエーションの両方から来ています。
我々は,野生生物の利用事例における細粒度分類を改善するため,いくつかの革新を組み合わせることを提案する。
論文 参考訳(メタデータ) (2021-03-21T02:01:38Z) - Multi-label Ranking: Mining Multi-label and Label Ranking Data [1.8275108630751844]
従来のトランスフォーメーションと適応のカテゴリにはもはや当てはまらないので、ユニークな課題を強調し、メソッドを再分類します。
本研究は, 深層学習型マルチラベルマイニング, 極度なマルチラベル分類, ラベルランキングにおける最先端の手法に着目して, 過去10年間の開発状況を調査した。
論文 参考訳(メタデータ) (2021-01-03T08:36:45Z) - A Multi-Semantic Metapath Model for Large Scale Heterogeneous Network
Representation Learning [52.83948119677194]
大規模不均一表現学習のためのマルチセマンティックメタパス(MSM)モデルを提案する。
具体的には,マルチセマンティックなメタパスに基づくランダムウォークを生成し,不均衡な分布を扱うヘテロジニアスな近傍を構築する。
提案するフレームワークに対して,AmazonとAlibabaの2つの挑戦的なデータセットに対して,体系的な評価を行う。
論文 参考訳(メタデータ) (2020-07-19T22:50:20Z) - Multi-source Domain Adaptation in the Deep Learning Era: A Systematic
Survey [53.656086832255944]
マルチソースドメイン適応(MDA)は、ラベル付きデータを複数のソースから収集できる強力な拡張である。
MDAは学術と産業の両方で注目を集めている。
論文 参考訳(メタデータ) (2020-02-26T08:07:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。