論文の概要: Dialogue-to-Video Retrieval
- arxiv url: http://arxiv.org/abs/2303.16761v1
- Date: Thu, 23 Mar 2023 02:52:45 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-31 15:51:02.936103
- Title: Dialogue-to-Video Retrieval
- Title(参考訳): 対話対ビデオ検索
- Authors: Chenyang Lyu, Manh-Duy Nguyen, Van-Tu Ninh, Liting Zhou, Cathal
Gurrin, Jennifer Foster
- Abstract要約: 構造化された会話情報を組み込んだ対話音声検索システムを提案する。
本手法では,R@1,R@5,R@10において,検索性能を4.2%,6.2%,8.6%向上させる。
- 参考スコア(独自算出の注目度): 11.356755138824349
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent years have witnessed an increasing amount of dialogue/conversation on
the web especially on social media. That inspires the development of
dialogue-based retrieval, in which retrieving videos based on dialogue is of
increasing interest for recommendation systems. Different from other video
retrieval tasks, dialogue-to-video retrieval uses structured queries in the
form of user-generated dialogue as the search descriptor. We present a novel
dialogue-to-video retrieval system, incorporating structured conversational
information. Experiments conducted on the AVSD dataset show that our proposed
approach using plain-text queries improves over the previous counterpart model
by 15.8% on R@1. Furthermore, our approach using dialogue as a query, improves
retrieval performance by 4.2%, 6.2%, 8.6% on R@1, R@5 and R@10 and outperforms
the state-of-the-art model by 0.7%, 3.6% and 6.0% on R@1, R@5 and R@10
respectively.
- Abstract(参考訳): 近年、特にソーシャルメディアでは、ウェブ上での対話や会話が増えている。
これは対話に基づく検索の発展を刺激し、対話に基づくビデオの検索はレコメンデーションシステムへの関心を高めている。
他のビデオ検索タスクとは異なり、対話対ビデオ検索は、ユーザ生成ダイアログの形式で構造化されたクエリを検索記述子として使用する。
構造化された会話情報を組み込んだ対話音声検索システムを提案する。
AVSDデータセットを用いて行った実験から,提案手法は従来のモデルよりも15.8%改善し,R@1。
さらに,問合せとして対話を用い,r@1,r@5,r@10における検索性能を4.2%,6.2%,8.6%向上させ,r@1,r@5,r@10では0.7%,3.6%,6.0%向上させた。
関連論文リスト
- IRLab@iKAT24: Learned Sparse Retrieval with Multi-aspect LLM Query Generation for Conversational Search [6.974395116689502]
iKAT 2024は、対話アシスタントの進化に焦点を当て、対話と応答をパーソナライズされたユーザー知識から適応することができる。
このトラックには、Personal Textual Knowledge Base(PTKB)と会話型AIタスク(通訳ランキングや応答生成など)が組み込まれている。
論文 参考訳(メタデータ) (2024-11-22T05:18:35Z) - Effective and Efficient Conversation Retrieval for Dialogue State Tracking with Implicit Text Summaries [48.243879779374836]
LLM (Large Language Models) を用いたDST (Few-shot dialogue state tracking) では,会話検索を効果的かつ効率的に行うことで,学習の迅速化を図っている。
従来は検索キーやクエリとして生の対話コンテキストを使用していた。
会話のテキスト要約に基づいて会話検索を行う。
LLMに基づく会話要約器がクエリとキー生成に採用され、効果的な内部製品探索が可能となる。
論文 参考訳(メタデータ) (2024-02-20T14:31:17Z) - Simple Baselines for Interactive Video Retrieval with Questions and
Answers [33.17722358007974]
本稿では,質問応答による対話型ビデオ検索のための,シンプルで効果的なベースラインを提案する。
ユーザインタラクションをシミュレートするためにビデオQAモデルを用い,対話型検索タスクの生産性向上を可能にすることを示す。
MSR-VTT, MSVD, AVSDによる実験により, 問合せに基づくインタラクションを用いたフレームワークは, テキストベースのビデオ検索システムの性能を大幅に向上させることが示された。
論文 参考訳(メタデータ) (2023-08-21T00:32:19Z) - FCC: Fusing Conversation History and Candidate Provenance for Contextual
Response Ranking in Dialogue Systems [53.89014188309486]
複数のチャネルからコンテキスト情報を統合できるフレキシブルなニューラルネットワークフレームワークを提案する。
会話応答ランキングタスクの評価に広く用いられているMSDialogデータセット上で,本モデルの評価を行った。
論文 参考訳(メタデータ) (2023-03-31T23:58:28Z) - Reasoning in Dialog: Improving Response Generation by Context Reading
Comprehension [49.92173751203827]
マルチターンダイアログでは、発話が文の完全な形を取るとは限らない。
読み解きの質問に答えるモデルの能力を検討し、応答生成性能の向上を提案する。
論文 参考訳(メタデータ) (2020-12-14T10:58:01Z) - A Compare Aggregate Transformer for Understanding Document-grounded
Dialogue [27.04964963480175]
本稿では,対話コンテキストを協調的に認知し,応答生成のための文書情報を集約する比較集約変換器(CAT)を提案する。
CMUDoGデータセットの実験結果は、提案したCATモデルが最先端のアプローチと強力なベースラインよりも優れていることを示している。
論文 参考訳(メタデータ) (2020-10-01T03:44:44Z) - Rethinking Dialogue State Tracking with Reasoning [76.0991910623001]
本稿では, 対話状態の段階的追跡を, バックエンドデータの助けを借りて行うことを提案する。
実験の結果,MultiWOZ 2.1の連立信条精度は38.6%向上した。
論文 参考訳(メタデータ) (2020-05-27T02:05:33Z) - Dialogue-Based Relation Extraction [53.2896545819799]
本稿では,人間による対話型関係抽出(RE)データセットDialogREを提案する。
我々は,対話型タスクと従来のREタスクの類似点と相違点の分析に基づいて,提案課題において話者関連情報が重要な役割を担っていると論じる。
実験結果から,ベストパフォーマンスモデルにおける話者認識の拡張が,標準設定と会話評価設定の両方において向上することが示された。
論文 参考訳(メタデータ) (2020-04-17T03:51:57Z) - Paraphrase Augmented Task-Oriented Dialog Generation [68.1790912977053]
本稿では,パラフレーズモデルと応答生成モデルを協調訓練するパラフレーズ拡張応答生成(PARG)フレームワークを提案する。
また、ダイアログ状態とダイアログアクトラベルに基づいて、パラフレーズトレーニングデータセットを自動構築する手法も設計する。
論文 参考訳(メタデータ) (2020-04-16T05:12:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。