論文の概要: Image-text Retrieval: A Survey on Recent Research and Development
- arxiv url: http://arxiv.org/abs/2203.14713v1
- Date: Mon, 28 Mar 2022 13:00:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-29 23:32:11.309131
- Title: Image-text Retrieval: A Survey on Recent Research and Development
- Title(参考訳): 画像テキスト検索:最近の研究・開発に関する調査
- Authors: Min Cao, Shiping Li, Juntao Li, Liqiang Nie, Min Zhang
- Abstract要約: クロスモーダル画像テキスト検索(ITR)は、優れた研究価値と幅広い実世界の応用により、研究コミュニティへの関心が高まっている。
本稿では,ITRのアプローチに関する4つの視点から,包括的かつ最新の調査を行う。
- 参考スコア(独自算出の注目度): 58.060687870247996
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the past few years, cross-modal image-text retrieval (ITR) has experienced
increased interest in the research community due to its excellent research
value and broad real-world application. It is designed for the scenarios where
the queries are from one modality and the retrieval galleries from another
modality. This paper presents a comprehensive and up-to-date survey on the ITR
approaches from four perspectives. By dissecting an ITR system into two
processes: feature extraction and feature alignment, we summarize the recent
advance of the ITR approaches from these two perspectives. On top of this, the
efficiency-focused study on the ITR system is introduced as the third
perspective. To keep pace with the times, we also provide a pioneering overview
of the cross-modal pre-training ITR approaches as the fourth perspective.
Finally, we outline the common benchmark datasets and valuation metric for ITR,
and conduct the accuracy comparison among the representative ITR approaches.
Some critical yet less studied issues are discussed at the end of the paper.
- Abstract(参考訳): 近年, クロスモーダル画像テキスト検索 (ITR) は, 優れた研究価値と広い実世界の応用により, 研究コミュニティへの関心が高まっている。
クエリがひとつのモダリティから,検索ギャラリーが別のモダリティから,というシナリオ用に設計されている。
本稿では,4つの視点からitrアプローチに関する包括的かつ最新の調査を行う。
ITRシステムを特徴抽出と特徴整合の2つのプロセスに分割することにより、これらの2つの視点から最近のITRアプローチの進歩を要約する。
さらに,第3の視点として,ITRシステムの効率性に着目した研究を紹介する。
また,4番目の視点として,モーダル間事前学習ITRアプローチの先駆的な概要を述べる。
最後に、itrの共通ベンチマークデータセットと評価指標を概説し、代表的なitrアプローチ間の精度比較を行う。
論文の最後には、いくつかの批判的かつ研究の少ない問題が議論されている。
関連論文リスト
- Data Augmentation for Sequential Recommendation: A Survey [9.913317029557588]
シーケンシャルレコメンデーション(SR)は、現実の状況との整合性から多くの注目を集めている。
SRのためのデータ拡張(DA)手法の総合的なレビューを行う。
論文 参考訳(メタデータ) (2024-09-20T14:39:42Z) - A Survey on Interpretable Cross-modal Reasoning [64.37362731950843]
マルチメディア分析から医療診断に至るまで、クロスモーダル推論(CMR)が重要な分野として浮上している。
この調査は、解釈可能なクロスモーダル推論(I-CMR)の領域を掘り下げる
本調査では,I-CMRの3段階分類法について概説する。
論文 参考訳(メタデータ) (2023-09-05T05:06:48Z) - A Comprehensive Survey on Relation Extraction: Recent Advances and New Frontiers [76.51245425667845]
関係抽出(RE)は、基礎となるコンテンツからエンティティ間の関係を識別する。
ディープニューラルネットワークはREの分野を支配しており、顕著な進歩を遂げている。
この調査は、現実世界のREシステムの課題に対処するための研究者の協力的な取り組みを促進することが期待されている。
論文 参考訳(メタデータ) (2023-06-03T08:39:25Z) - Reviewer assignment problem: A scoping review [0.0]
査読の質は、提出された論文に対して適切な審査員を募集する能力に依存する。
このようなレビュアーを見つけることは、いくつかの要因によりますます難しい課題となっている。
論文を「よく一致した」レビュアーと自動的に関連付けるための解決策が30年前から研究の対象となっている。
論文 参考訳(メタデータ) (2023-05-13T10:13:43Z) - Robust Saliency-Aware Distillation for Few-shot Fine-grained Visual
Recognition [57.08108545219043]
サンプルが少ない新しいサブカテゴリを認識することは、コンピュータビジョンにおいて不可欠で挑戦的な研究課題である。
既存の文献は、ローカルベースの表現アプローチを採用することでこの問題に対処している。
本稿では,ロバスト・サリエンシ・アウェア蒸留法(RSaD)を提案する。
論文 参考訳(メタデータ) (2023-05-12T00:13:17Z) - Optimizing Two-way Partial AUC with an End-to-end Framework [154.47590401735323]
ROC曲線のエリア(AUC)は、機械学習にとって重要な指標である。
最近の研究は、TPAUCが既存のPartial AUCメトリクスと本質的に矛盾していることを示している。
本論文では,この新指標を最適化するための最初の試行について述べる。
論文 参考訳(メタデータ) (2022-06-23T12:21:30Z) - A Survey on Temporal Sentence Grounding in Videos [69.13365006222251]
ビデオ(TSGV)における時間的文グラウンドングは、与えられた文クエリに関する未編集ビデオから1つのターゲットセグメントをローカライズすることを目的としている。
我々の知る限りでは、これは時間的文接地に関する最初の体系的な調査である。
論文 参考訳(メタデータ) (2021-09-16T15:01:46Z) - Cross-Domain Recommendation: Challenges, Progress, and Prospects [21.60393384976869]
クロスドメインレコメンデーション(CDR)は、スパーサードメインのレコメンデーションパフォーマンスを改善するために、よりリッチなドメインからの比較的リッチな情報を活用するために提案されている。
本稿では,課題,研究の進展,今後の方向性など,既存のCDRアプローチの総合的なレビューを行う。
論文 参考訳(メタデータ) (2021-03-02T12:58:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。