論文の概要: Vision + Language Applications: A Survey
- arxiv url: http://arxiv.org/abs/2305.14598v1
- Date: Wed, 24 May 2023 00:42:06 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-25 20:57:47.741704
- Title: Vision + Language Applications: A Survey
- Title(参考訳): ビジョン+言語アプリケーション: 調査
- Authors: Yutong Zhou and Nobutaka Shimada
- Abstract要約: 本稿では,テキスト,視覚,音声などのマルチモーダルアプリケーションにおける研究トラックについて検討する。
本稿で論じる研究に加えて、最新の関連論文、データセット、アプリケーションプロジェクト、および対応する情報を継続的に更新することを約束しています。
- 参考スコア(独自算出の注目度): 3.8073142980733
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Text-to-image generation has attracted significant interest from researchers
and practitioners in recent years due to its widespread and diverse
applications across various industries. Despite the progress made in the domain
of vision and language research, the existing literature remains relatively
limited, particularly with regard to advancements and applications in this
field. This paper explores a relevant research track within multimodal
applications, including text, vision, audio, and others. In addition to the
studies discussed in this paper, we are also committed to continually updating
the latest relevant papers, datasets, application projects and corresponding
information at https://github.com/Yutong-Zhou-cv/Awesome-Text-to-Image
- Abstract(参考訳): テキストから画像への生成は、近年、様々な産業にまたがる広く多様な応用により、研究者や実践者から大きな関心を集めている。
視覚と言語研究の分野における進歩にもかかわらず、既存の文献は、特にこの分野の進歩と応用に関して、比較的限定的なままである。
本稿では,テキスト,視覚,音声など,マルチモーダルアプリケーションにおける関連する研究トラックについて検討する。
本稿で論じる研究に加えて、最新の関連論文、データセット、アプリケーションプロジェクト、および対応する情報をhttps://github.com/Yutong-Zhou-cv/Awesome-Text-to-Imageで継続的に更新することを約束しています。
関連論文リスト
- Applications and Advances of Artificial Intelligence in Music Generation:A Review [0.04551615447454769]
本稿では,AI音楽生成における最新の研究成果を体系的にレビューする。
主要な技術、モデル、データセット、評価方法、および様々な分野におけるそれらの実践的応用をカバーしている。
論文 参考訳(メタデータ) (2024-09-03T13:50:55Z) - Visual Text Meets Low-level Vision: A Comprehensive Survey on Visual
Text Processing [4.057550183467041]
視覚テキスト処理の分野は、基本的な生成モデルの出現によって、研究の急増を経験してきた。
この分野での最近の進歩を包括的かつ多面的に分析する。
論文 参考訳(メタデータ) (2024-02-05T15:13:20Z) - Literature Review: Computer Vision Applications in Transportation
Logistics and Warehousing [58.720142291102135]
輸送物流や倉庫におけるコンピュータビジョンの応用は、プロセスの自動化に大きな可能性を秘めている。
本稿では、この可能性を活用するために、この分野の研究に関する構造化された文献レビューを紹介する。
論文 参考訳(メタデータ) (2023-04-12T17:33:41Z) - The Semantic Reader Project: Augmenting Scholarly Documents through
AI-Powered Interactive Reading Interfaces [54.2590226904332]
本稿では,研究論文を対象とした動的読解インタフェースの自動作成を目的としたセマンティック・リーダー・プロジェクトについて述べる。
10のプロトタイプインターフェースが開発され、300人以上の参加者と現実世界のユーザが読書体験を改善している。
本論文は,研究論文を読む際,学者と公衆の面を巡って構築する。
論文 参考訳(メタデータ) (2023-03-25T02:47:09Z) - 3D Object Detection from Images for Autonomous Driving: A Survey [68.33502122185813]
画像から3Dオブジェクトを検出することは、自動運転の基本的かつ困難な問題の一つだ。
この問題を2015年から2021年にかけて200以上の研究が行われ、理論、アルゴリズム、応用の幅広い範囲で研究されている。
我々は,この新奇で継続的な研究分野を包括的に調査し,画像に基づく3D検出に最もよく使用されるパイプラインを要約する。
論文 参考訳(メタデータ) (2022-02-07T07:12:24Z) - From Show to Tell: A Survey on Image Captioning [48.98681267347662]
視覚と言語を結びつけることは、ジェネレーティブ・インテリジェンスにおいて重要な役割を担っている。
画像キャプションの研究はまだ結論に達していない。
本研究の目的は,画像キャプション手法の包括的概要と分類を提供することである。
論文 参考訳(メタデータ) (2021-07-14T18:00:54Z) - A Survey of Deep Learning Approaches for OCR and Document Understanding [68.65995739708525]
我々は、英語で書かれた文書の文書理解のための様々な手法をレビューする。
文献に現れる方法論を集約し,この領域を探索する研究者の跳躍点として機能させる。
論文 参考訳(メタデータ) (2020-11-27T03:05:59Z) - Multimodal Research in Vision and Language: A Review of Current and
Emerging Trends [41.07256031348454]
本稿では,視覚的・言語的モダリティに関する最新の研究動向について概説する。
タスクの定式化におけるその応用と、意味認識やコンテンツ生成に関する様々な問題を解決する方法について検討する。
私たちは、この領域をよりモジュール的で透明なインテリジェントなシステムに向け、過去に現れた、多分野のパターンと洞察に光を当てました。
論文 参考訳(メタデータ) (2020-10-19T13:55:10Z) - Positioning yourself in the maze of Neural Text Generation: A
Task-Agnostic Survey [54.34370423151014]
本稿では, ストーリーテリング, 要約, 翻訳など, 世代ごとのタスクインパクトをリレーする手法の構成要素について検討する。
本稿では,学習パラダイム,事前学習,モデリングアプローチ,復号化,各分野における重要な課題について,命令的手法の抽象化を提案する。
論文 参考訳(メタデータ) (2020-10-14T17:54:42Z) - Text Recognition in the Wild: A Survey [33.22076515689926]
本論文は,シーンテキスト認識の分野の全体像を提示する試みである。
この分野に参入する人々に対する包括的なリファレンスを提供しており、将来の研究を刺激するのに役立ちます。
論文 参考訳(メタデータ) (2020-05-07T13:57:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。