論文の概要: NICE 2023 Zero-shot Image Captioning Challenge
- arxiv url: http://arxiv.org/abs/2309.01961v2
- Date: Wed, 6 Sep 2023 06:13:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-07 11:12:08.293156
- Title: NICE 2023 Zero-shot Image Captioning Challenge
- Title(参考訳): 2023年のゼロショット画像キャプションチャレンジ
- Authors: Taehoon Kim, Pyunghwan Ahn, Sangyun Kim, Sihaeng Lee, Mark Marsden,
Alessandra Sala, Seung Hwan Kim, Bohyung Han, Kyoung Mu Lee, Honglak Lee,
Kyounghoon Bae, Xiangyu Wu, Yi Gao, Hailiang Zhang, Yang Yang, Weili Guo,
Jianfeng Lu, Youngtaek Oh, Jae Won Cho, Dong-jin Kim, In So Kweon, Junmo Kim,
Wooyoung Kang, Won Young Jhoo, Byungseok Roh, Jonghwan Mun, Solgil Oh, Kenan
Emir Ak, Gwang-Gook Lee, Yan Xu, Mingwei Shen, Kyomin Hwang, Wonsik Shin,
Kamin Lee, Wonhark Park, Dongkwan Lee, Nojun Kwak, Yujin Wang, Yimu Wang,
Tiancheng Gu, Xingchang Lv, Mingmao Sun
- Abstract要約: NICEプロジェクトは、堅牢な画像キャプションモデルを開発するためにコンピュータビジョンコミュニティに挑戦するために設計されている。
レポートには、新たに提案されたNICEデータセット、評価方法、課題結果、トップレベルのエントリの技術的な詳細などが含まれている。
- 参考スコア(独自算出の注目度): 149.28330263581012
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this report, we introduce NICE
project\footnote{\url{https://nice.lgresearch.ai/}} and share the results and
outcomes of NICE challenge 2023. This project is designed to challenge the
computer vision community to develop robust image captioning models that
advance the state-of-the-art both in terms of accuracy and fairness. Through
the challenge, the image captioning models were tested using a new evaluation
dataset that includes a large variety of visual concepts from many domains.
There was no specific training data provided for the challenge, and therefore
the challenge entries were required to adapt to new types of image descriptions
that had not been seen during training. This report includes information on the
newly proposed NICE dataset, evaluation methods, challenge results, and
technical details of top-ranking entries. We expect that the outcomes of the
challenge will contribute to the improvement of AI models on various
vision-language tasks.
- Abstract(参考訳): 本稿では、NICE project\footnote{\url{https://nice.lgresearch.ai/}}を紹介し、2023年のNICEチャレンジの結果と成果を共有する。
このプロジェクトはコンピュータビジョンのコミュニティに挑戦し、精度と公正性の両面で最先端の技術を推し進める堅牢な画像キャプションモデルを開発するよう設計されている。
この課題を通じて、画像キャプションモデルは、多くのドメインからさまざまな視覚概念を含む新しい評価データセットを用いてテストされた。
課題には具体的なトレーニングデータがなかったため、トレーニング中に見られなかった新しいタイプの画像記述に適応するためには、課題エントリが要求された。
本報告では,新たに提案したNICEデータセット,評価方法,課題結果,上位項目の技術的詳細について述べる。
この課題の結果が、様々な視覚言語タスクにおけるAIモデルの改善に寄与することを期待している。
関連論文リスト
- NTIRE 2024 Quality Assessment of AI-Generated Content Challenge [141.37864527005226]
課題は、イメージトラックとビデオトラックに分けられる。
両トラックの勝利法はAIGCの予測性能に優れていた。
論文 参考訳(メタデータ) (2024-04-25T15:36:18Z) - NTIRE 2024 Challenge on Image Super-Resolution ($\times$4): Methods and Results [126.78130602974319]
画像の超高解像度化に関するNTIRE 2024の課題(4ドル)をレビューする。
この課題は、低解像度(LR)入力から4倍の倍率で対応する高解像度(HR)画像を生成することである。
この挑戦の目的は、最も先進的なSR性能を持つ設計/解決を得ることである。
論文 参考訳(メタデータ) (2024-04-15T13:45:48Z) - Out-of-Vocabulary Challenge Report [15.827931962904115]
Out-Of-Vocabulary 2022 (OOV) チャレンジでは、トレーニング時に見えないシーンテキストインスタンスの認識が導入されている。
コンペティションは、326,385のイメージと4,864,405のシーンテキストインスタンスからなる公開シーンテキストデータセットのコレクションをコンパイルする。
ベースラインと異なる参加者からの結果を徹底的に分析する。
論文 参考訳(メタデータ) (2022-09-14T15:25:54Z) - NTIRE 2022 Challenge on Perceptual Image Quality Assessment [90.04931572825859]
画像品質評価(IQA)におけるNTIRE 2022の課題について報告する。
この課題は、知覚画像処理アルゴリズムによるIQAの新たな課題に対処するためである。
当選方法は、最先端の性能を示すことができる。
論文 参考訳(メタデータ) (2022-06-23T13:36:49Z) - ChaLearn Looking at People: Inpainting and Denoising challenges [41.481257371694284]
本章では、画像や映像の描画に焦点を当てた学術コンペティションのデザインについて述べる。
ChaLearn Looking at People Inpainting Challengeは、視覚的インペインティングに関する最先端技術を目指しています。
3つのトラックが提案され、人間の身体のポーズ推定、テキストのオーバーレイ除去、指紋のデノーミングといった視覚的塗布が役立つが、それでも難しい。
論文 参考訳(メタデータ) (2021-06-24T14:57:21Z) - Learning to Select: A Fully Attentive Approach for Novel Object
Captioning [48.497478154384105]
新たなオブジェクトキャプション(NOC)は、トレーニング期間中に見えないオブジェクトに対してキャプションモデルをテストするパラダイムとして最近登場した。
我々は,トレーニングセットへの準拠性に関係なく,画像の最も関連性の高いオブジェクトを選択することを学習するNOCに対して,新しいアプローチを提案する。
私たちのアーキテクチャは、制約を組み込む際にも、完全に適応的でエンドツーエンドのトレーニングが可能です。
論文 参考訳(メタデータ) (2021-06-02T19:11:21Z) - NTIRE 2021 Challenge on Perceptual Image Quality Assessment [128.83256694901726]
NTIRE 2021の知覚画像品質評価(IQA)に関する課題について報告する。
CVPR 2021では、画像修復・強化ワークショップ(NTIRE)のNew Trendsと連携して開催されました。
新しいタイプの画像処理技術として、GAN(Generative Adversarial Networks)に基づく知覚画像処理アルゴリズムが、より現実的なテクスチャを持つ画像を生成する。
論文 参考訳(メタデータ) (2021-05-07T05:36:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。