Fugu-MT 論文翻訳(概要): Multimodal Classification: Current Landscape, Taxonomy and Future Directions

論文の概要: Multimodal Classification: Current Landscape, Taxonomy and Future Directions

arxiv url: http://arxiv.org/abs/2109.09020v1
Date: Sat, 18 Sep 2021 22:01:31 GMT
ステータス: 翻訳完了
システム内更新日: 2021-09-23 08:51:24.422686
Title: Multimodal Classification: Current Landscape, Taxonomy and Future Directions
Title（参考訳）: マルチモーダル分類 : 現在の景観, 分類, 今後の方向性
Authors: William C. Sleeman IV, Rishabh Kapoor and Preetam Ghosh
Abstract要約: マルチモーダル分類の研究は、衛星画像、バイオメトリックス、医学を含む複数の情報源からより多くのデータを収集する多くの領域で人気を集めている。一貫性のある用語やアーキテクチャ記述の欠如は、既存のソリューションを比較するのを困難にしている。本稿では,近年のマルチモーダル分類における傾向に基づいて,このようなシステムを記述するための新しい分類法を提案する。
参考スコア（独自算出の注目度）: 0.09668407688201358
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Multimodal classification research has been gaining popularity in many domains that collect more data from multiple sources including satellite imagery, biometrics, and medicine. However, the lack of consistent terminology and architectural descriptions makes it difficult to compare different existing solutions. We address these challenges by proposing a new taxonomy for describing such systems based on trends found in recent publications on multimodal classification. Many of the most difficult aspects of unimodal classification have not yet been fully addressed for multimodal datasets including big data, class imbalance, and instance level difficulty. We also provide a discussion of these challenges and future directions.
Abstract（参考訳）: マルチモーダル分類研究は、衛星画像、バイオメトリックス、医学など複数のソースからより多くのデータを収集する多くのドメインで人気を集めている。しかし、一貫した用語やアーキテクチャ記述がないため、既存のソリューションを比較することは困難である。本稿では,近年のマルチモーダル分類の動向に基づいて,このようなシステムを記述するための新しい分類法を提案する。ユニモーダル分類の最も難しい側面の多くは、ビッグデータ、クラス不均衡、インスタンスレベルの難易度を含むマルチモーダルデータセットに対して、まだ完全に対処されていない。これらの課題と今後の方向性についても議論する。

関連論文リスト

A Systematic Literature Review on Multi-label Data Stream Classification [0.0]
本稿では,マルチラベルデータストリーム分類の提案を詳細に分析する。文献における最新の手法を特徴付け、包括的概要を提供し、徹底的な階層を構築し、アプローチが各問題にどのようにアプローチするかについて議論する。我々は,主要なギャップを特定し,今後の研究の方向性を推奨する。
論文参考訳（メタデータ） (2025-08-24T17:17:15Z)
Multimodal Chain-of-Thought Reasoning: A Comprehensive Survey [124.23247710880008]
マルチモーダルCoT (MCoT) 推論は近年大きな研究の注目を集めている。既存のMCoT研究は、画像、ビデオ、音声、オーディオ、3D、構造化データの課題に対処する様々な手法を設計している。我々はMCoT推論に関する最初の体系的な調査を行い、関連する基礎概念と定義を解明する。
論文参考訳（メタデータ） (2025-03-16T18:39:13Z)
MultiConIR: Towards multi-condition Information Retrieval [57.6405602406446]
我々は,マルチコンディションシナリオにおける検索モデルの評価を目的とした,最初のベンチマークであるMultiConIRを紹介する。本稿では,マルチコンディションのロバスト性,モノトニック関連性ランキング,クエリフォーマットの感度に基づいて,検索とリランクモデルの評価を行う3つのタスクを提案する。
論文参考訳（メタデータ） (2025-03-11T05:02:03Z)
Advances in Multimodal Adaptation and Generalization: From Traditional Approaches to Foundation Models [54.196385799229006]
この調査は、従来のアプローチから基礎モデルへの進歩に関する、初めての包括的なレビューを提供する。 1)マルチモーダルドメイン適応,(2)マルチモーダルテスト時間適応,(3)マルチモーダルドメイン一般化,(4)マルチモーダルファンデーションモデルの助けを借りたドメイン適応と一般化,(5)マルチモーダルファンデーションモデルの適応。
論文参考訳（メタデータ） (2025-01-30T18:59:36Z)
Online Model-based Anomaly Detection in Multivariate Time Series: Taxonomy, Survey, Research Challenges and Future Directions [0.017476232824732776]
時系列異常検出は、エンジニアリングプロセスにおいて重要な役割を果たす。この調査では、オンラインとオフラインの区別とトレーニングと推論を行う新しい分類法を紹介した。文献で使用される最も一般的なデータセットと評価指標、および詳細な分析を示す。
論文参考訳（メタデータ） (2024-08-07T13:01:10Z)
Multimodal Fusion on Low-quality Data: A Comprehensive Survey [110.22752954128738]
本稿では,野生におけるマルチモーダル核融合の共通課題と最近の進歩について考察する。低品質データ上でのマルチモーダル融合で直面する4つの主な課題を同定する。この新たな分類によって、研究者はフィールドの状態を理解し、いくつかの潜在的な方向を特定することができる。
論文参考訳（メタデータ） (2024-04-27T07:22:28Z)
A Survey of Deep Long-Tail Classification Advancements [1.6233132273470656]
実世界の多くのデータ分布は、ほとんど均一ではない。代わりに、様々な種類の歪んだ、長い尾の分布がよく見られる。これは機械学習にとって興味深い問題であり、ほとんどのアルゴリズムが均一に分散されたデータを想定したり、うまく機能する。この問題は、大量のトレーニングデータを必要とする現在の最先端のディープラーニングモデルによってさらに悪化している。
論文参考訳（メタデータ） (2024-04-24T01:59:02Z)
Multimodal Large Language Models: A Survey [36.06016060015404]
マルチモーダル言語モデルは、画像、テキスト、言語、音声、その他の異種性など、複数のデータタイプを統合する。本稿では、マルチモーダルの概念を定義し、マルチモーダルアルゴリズムの歴史的展開を検討することから始める。実用的なガイドが提供され、マルチモーダルモデルの技術的な側面に関する洞察を提供する。最後に,マルチモーダルモデルの適用について検討し,開発に伴う課題について考察する。
論文参考訳（メタデータ） (2023-11-22T05:15:12Z)
Enhancing Human-like Multi-Modal Reasoning: A New Challenging Dataset and Comprehensive Framework [51.44863255495668]
マルチモーダル推論は、人間のような知性を示す人工知能システムの追求において重要な要素である。提案するマルチモーダル推論(COCO-MMR)データセットは,オープンエンド質問の集合を包含する新しいデータセットである。画像とテキストエンコーダを強化するために,マルチホップ・クロスモーダル・アテンションや文レベルのコントラスト学習などの革新的な手法を提案する。
論文参考訳（メタデータ） (2023-07-24T08:58:25Z)
How Many Answers Should I Give? An Empirical Study of Multi-Answer Reading Comprehension [64.76737510530184]
我々は、一般的に見られるマルチアンサーMRCインスタンスを分類するために分類を設計する。我々は、現在のマルチ・アンサー・MCCモデルのパラダイムが、異なるタイプのマルチ・アンサー・インスタンスをどのように扱うかを分析する。
論文参考訳（メタデータ） (2023-06-01T08:22:21Z)
Geo-Spatiotemporal Features and Shape-Based Prior Knowledge for Fine-grained Imbalanced Data Classification [63.916371837696396]
細粒度分類は、類似のグローバル知覚とパターンを持つ項目を区別することを目的としているが、細部によって異なる。私たちの主な課題は、小さなクラス間バリエーションと大きなクラス内バリエーションの両方から来ています。我々は,野生生物の利用事例における細粒度分類を改善するため,いくつかの革新を組み合わせることを提案する。
論文参考訳（メタデータ） (2021-03-21T02:01:38Z)
Multi-label Ranking: Mining Multi-label and Label Ranking Data [1.8275108630751844]
従来のトランスフォーメーションと適応のカテゴリにはもはや当てはまらないので、ユニークな課題を強調し、メソッドを再分類します。本研究は, 深層学習型マルチラベルマイニング, 極度なマルチラベル分類, ラベルランキングにおける最先端の手法に着目して, 過去10年間の開発状況を調査した。
論文参考訳（メタデータ） (2021-01-03T08:36:45Z)
A Multi-Semantic Metapath Model for Large Scale Heterogeneous Network Representation Learning [52.83948119677194]
大規模不均一表現学習のためのマルチセマンティックメタパス(MSM)モデルを提案する。具体的には,マルチセマンティックなメタパスに基づくランダムウォークを生成し,不均衡な分布を扱うヘテロジニアスな近傍を構築する。提案するフレームワークに対して,AmazonとAlibabaの2つの挑戦的なデータセットに対して,体系的な評価を行う。
論文参考訳（メタデータ） (2020-07-19T22:50:20Z)
Multi-source Domain Adaptation in the Deep Learning Era: A Systematic Survey [53.656086832255944]
マルチソースドメイン適応(MDA)は、ラベル付きデータを複数のソースから収集できる強力な拡張である。 MDAは学術と産業の両方で注目を集めている。
論文参考訳（メタデータ） (2020-02-26T08:07:58Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。