論文の概要: A Benchmark for Semi-supervised Multi-modal Crowd Counting
- arxiv url: http://arxiv.org/abs/2606.03646v1
- Date: Tue, 02 Jun 2026 13:38:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 10:57:21.748281
- Title: A Benchmark for Semi-supervised Multi-modal Crowd Counting
- Title(参考訳): 半教師付きマルチモーダルクラウドカウントのためのベンチマーク
- Authors: Haoliang Meng, Xiaopeng Hong, Yabin Wang, Wangmeng Zuo,
- Abstract要約: 本稿では,半教師付きマルチモーダル群カウントに関する最初のベンチマークを構築した。
まず,ラベル付き非ラベルデータパーティションを異なるラベル付き比率で指定する,半教師付きマルチモーダル設定と標準化プロトコルを定式化する。
- 参考スコア(独自算出の注目度): 70.51330672285022
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper constructs the first benchmark on semi-supervised multi-modal crowd counting. To lay the foundation for this unexplored task, we first formulate the semi-supervised multi-modal setting and a standardized protocol that specifies the labeled-unlabeled data partition across different labeled ratios. Next, to establish solid reference points, we carefully tailor a diverse set of representative baselines, including existing fully supervised multi-modal methods and semi-supervised single-modal methods. Then, we carefully evaluate their performance under our proposed benchmark. Codes and the data partition will be released on https://github.com/HenryCilence/Semi-supervised-Multimodal-Crowd-Counting.
- Abstract(参考訳): 本稿では,半教師付きマルチモーダル群カウントに関する最初のベンチマークを構築した。
この未探索タスクの基礎を定式化するために、まず、ラベル付きラベル付きデータパーティションを異なるラベル付き比率で指定する半教師付きマルチモーダル設定と標準化されたプロトコルを定式化する。
次に,既存の完全教師付きマルチモーダル法や半教師付き単一モーダル法など,多種多様な代表的ベースラインのセットを慎重に調整する。
そして,提案したベンチマークに基づいて,その性能を慎重に評価する。
コードとデータパーティションはhttps://github.com/HenryCilence/Semi-supervised-Multimodal-Crowd-Countingでリリースされる。
関連論文リスト
- HAVEN: Hierarchically Aligned Multimodal Benchmark for Unified Video Understanding [1.8482679687103294]
HAVENは階層的に整列したマルチモーダル・ベンチマークである。
この統一アノテーションパラダイムに基づいて,要約,時間的推論,マルチモーダルグラウンド,サリエンシランキングにまたがる総合評価スイートを提案する。
論文 参考訳(メタデータ) (2026-05-19T00:48:14Z) - DecepGPT: Schema-Driven Deception Detection with Multicultural Datasets and Robust Multimodal Learning [64.33887406863899]
マルチモーダル偽装検出は、法医学とセキュリティのための聴覚的手がかりを解析することにより、偽装行動を特定することを目的としている。
既存のベンチマークでは、中間的な推論手段を使わずにバイナリラベルのみを提供する。
構造的キューレベルの記述と推論チェーンを用いた推論データセットを構築した。
1695年のサンプルでは、非実験的偽装検出データセットとしては最大である。
論文 参考訳(メタデータ) (2026-03-25T04:06:36Z) - Towards Multimodal Domain Generalization with Few Labels [37.21678123296403]
SSMDG(Semi-Supervised Multimodal Domain Generalization)という新しい問題を紹介し,研究する。
SSMDGは、ラベル付きサンプルが少ないマルチソースデータから堅牢なマルチモーダルモデルを学習することを目的としている。
本稿では,コンセンサス駆動整合規則,分散認識整合規則,クロスモーダルプロトタイプアライメントの3つの主要なコンポーネントを特徴とする統一フレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-26T12:05:56Z) - Principled Multimodal Representation Learning [99.53621521696051]
マルチモーダル表現学習は、多様なデータモダリティを統合することにより、統一された表現空間を作ろうとする。
最近の進歩は、複数のモードの同時アライメントを調査しているが、いくつかの課題が残っている。
複数モーダルの同時アライメントを実現する新しいフレームワークであるPMRL(Principled Multimodal Representation Learning)を提案する。
論文 参考訳(メタデータ) (2025-07-23T09:12:25Z) - Multi-LLM Text Summarization [58.74987409988719]
本稿では,マルチLLM要約フレームワークを提案し,集中化と分散化を含む2つの異なるマルチLLM戦略について検討する。
当社のフレームワークは,各会話のラウンドにおいて,生成と評価という,基本的に重要なステップを2つ備えています。
我々のマルチLLM要約アプローチは, 1 つの LLM のみを最大 3 倍まで活用するベースラインを著しく上回っていることがわかった。
論文 参考訳(メタデータ) (2024-12-20T01:55:26Z) - Towards Bridging the Cross-modal Semantic Gap for Multi-modal Recommendation [12.306686291299146]
マルチモーダルレコメンデーションはレコメンデーションシステムの性能を大幅に向上させる。
既存のマルチモーダルレコメンデーションモデルは、マルチメディア情報伝搬プロセスを利用してアイテム表現を豊かにする。
本稿では,モダリティ間のセマンティックギャップをブリッジし,詳細な多視点セマンティック情報を抽出する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-07-07T15:56:03Z) - Unsupervised Multimodal Clustering for Semantics Discovery in Multimodal Utterances [24.142013877384603]
本稿では,新しい教師なしマルチモーダルクラスタリング手法 (UMC) を提案する。
UMCは、マルチモーダルデータのための拡張ビューを構築するためのユニークなアプローチを導入し、事前トレーニングを実行するために使用される。
我々は、最先端の手法よりもクラスタリングメトリクスの2-6%のスコアが顕著に改善され、この領域で最初の成功例となった。
論文 参考訳(メタデータ) (2024-05-21T13:24:07Z) - Few-shot Multimodal Sentiment Analysis based on Multimodal Probabilistic
Fusion Prompts [30.15646658460899]
ソーシャルメディア上でのマルチモーダルコンテンツの普及により,マルチモーダル感情分析が注目されている。
この地域の既存の研究は、大規模に監督されたデータに大きく依存している。
マルチモーダルな感情検出のために,様々なモーダルから多様な手がかりを生かしたマルチモーダル確率核融合法(MultiPoint)を提案する。
論文 参考訳(メタデータ) (2022-11-12T08:10:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。