Fugu-MT 論文翻訳(概要): Modeling Spoken Information Queries for Virtual Assistants: Open Problems, Challenges and Opportunities

論文の概要: Modeling Spoken Information Queries for Virtual Assistants: Open Problems, Challenges and Opportunities

arxiv url: http://arxiv.org/abs/2304.13149v1
Date: Tue, 25 Apr 2023 20:52:40 GMT
ステータス: 翻訳完了
システム内更新日: 2023-04-27 16:23:53.936831
Title: Modeling Spoken Information Queries for Virtual Assistants: Open Problems, Challenges and Opportunities
Title（参考訳）: 仮想アシスタントのための音声情報クエリのモデル化 : オープン問題,課題,機会
Authors: Christophe Van Gysel
Abstract要約: 仮想アシスタントにおける音声情報クエリのモデル化に関して,オープンな問題と課題について論じる。仮想アシスタント音声認識の品質向上のために,情報検索手法と研究を適用する機会をリストアップする。
参考スコア（独自算出の注目度）: 4.012184067445815
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Virtual assistants are becoming increasingly important speech-driven Information Retrieval platforms that assist users with various tasks. We discuss open problems and challenges with respect to modeling spoken information queries for virtual assistants, and list opportunities where Information Retrieval methods and research can be applied to improve the quality of virtual assistant speech recognition. We discuss how query domain classification, knowledge graphs and user interaction data, and query personalization can be helpful to improve the accurate recognition of spoken information domain queries. Finally, we also provide a brief overview of current problems and challenges in speech recognition.
Abstract（参考訳）: バーチャルアシスタントは音声による情報検索プラットフォームとしてますます重要になりつつある。本稿では,仮想アシスタントのための音声情報クエリのモデル化に関するオープン問題と課題と,仮想アシスタント音声認識の品質向上のために情報検索手法と研究が適用できる機会の一覧について論じる。問合せドメイン分類,知識グラフ,ユーザインタラクションデータ,および問合せパーソナライゼーションが,音声情報ドメインクエリの正確な認識向上にどのように役立つかを論じる。最後に,音声認識における現状の問題点と課題について概説する。

関連論文リスト

Do Images Clarify? A Study on the Effect of Images on Clarifying Questions in Conversational Search [59.907919633904775]
73名の被験者を対象に,会話検索における画像の役割を調査する。我々は,対話型検索コンテキストにおける両タスクにおける多モーダルとテキストのみによる質問の明確化の効果を比較した。
論文参考訳（メタデータ） (2026-02-09T14:16:11Z)
Enhancing the Learning Experience: Using Vision-Language Models to Generate Questions for Educational Videos [6.689443785478135]
教育ビデオの学習指向質問生成における視覚言語モデルの有用性について検討する。本研究は,現状の視覚言語モデルの有効性を概説し,課題の微調整と解決の必要性を浮き彫りにした。
論文参考訳（メタデータ） (2025-05-03T11:37:31Z)
Unimib Assistant: designing a student-friendly RAG-based chatbot for all their needs [1.0805849839756092]
このパイロットスタディは,OpenAIカスタムGPT機能を用いた検索・拡張生成(RAG)システムによるChatGPT動作の専門化に重点を置いている。我々はミラノ・ビコッカ大学(Unimib)の学生の特定のニーズに対する情報と解決策を提供するUnimib Assistantを開発した。ユーザの満足度と全体的な経験は、システムが常に正確な情報を提供することができないことで損なわれた。
論文参考訳（メタデータ） (2024-11-29T09:07:21Z)
Can Users Detect Biases or Factual Errors in Generated Responses in Conversational Information-Seeking? [13.790574266700006]
対話型情報検索システムにおける応答生成の限界について検討する。本研究は,問合せ応答性の問題と応答不完全性の課題に対処する。分析の結果,クエリ応答性よりも応答不完全性の検出が容易であることが判明した。
論文参考訳（メタデータ） (2024-10-28T20:55:00Z)
On the Reliability of Large Language Models to Misinformed and Demographically-Informed Prompts [20.84000437261526]
本研究では,大言語モデル(LLM)が支援するチャットボットを用いて,人口統計情報を用いて,誤情報や質問に対処する。 True/Falseの質問を使って定量的に分析すると、これらのチャットボットがこれらのクローズドな質問に対して正しい答えを与えることができることが分かる。ドメインの専門家から集めた質的な洞察はプライバシーや倫理的影響に懸念がまだあることを示している
論文参考訳（メタデータ） (2024-10-06T07:40:11Z)
CLARINET: Augmenting Language Models to Ask Clarification Questions for Retrieval [52.134133938779776]
CLARINETは,回答が正しい候補の確実性を最大化する質問を選択することで,情報的明確化を問うシステムである。提案手法は,大規模言語モデル(LLM)を検索分布の条件付きで拡張し,各ターンで真の候補のランクを最大化する問題を生成する。
論文参考訳（メタデータ） (2024-04-28T18:21:31Z)
Asking Multimodal Clarifying Questions in Mixed-Initiative Conversational Search [89.1772985740272]
混合開始型会話検索システムでは、質問を明確にすることで、意図を単一のクエリで表現するのに苦労するユーザを支援する。マルチモーダル情報が関係するシナリオでは、非テクスチャ情報を用いることで、明確化のプロセスを改善することができると仮定する。質問を明確にする4k以上のマルチモーダルを含むMelonというデータセットを収集し、14k以上の画像で濃縮する。クエリの明確化フェーズにおけるマルチモーダルコンテンツの重要性を理解するために,いくつかの解析を行った。
論文参考訳（メタデータ） (2024-02-12T16:04:01Z)
SememeASR: Boosting Performance of End-to-End Speech Recognition against Domain and Long-Tailed Data Shift with Sememe Semantic Knowledge [58.979490858061745]
セメムに基づくセマンティック知識情報を音声認識に導入する。実験の結果,セム情報により音声認識の有効性が向上することが示された。さらに,本実験により,セメム知識が長期データ認識を改善することが確認された。
論文参考訳（メタデータ） (2023-09-04T08:35:05Z)
Can Pre-trained Vision and Language Models Answer Visual Information-Seeking Questions? [50.29862466940209]
情報検索に適した視覚的質問応答データセットであるInfoSeekを紹介する。事前学習した様々な視覚的質問応答モデルを分析し,その特徴について考察する。関連文書を検索することでInfoSeekの性能を向上させるために,正確な視覚的実体認識が利用できることを示す。
論文参考訳（メタデータ） (2023-02-23T00:33:54Z)
Are Akpans Trick or Treat: Unveiling Helpful Biases in Assistant Systems [55.09907990139756]
情報探索型AIアシスタントシステムは,ユーザの知識に関する質問に対して,タイムリーに回答することを目的としている。本稿では,有用性の計算測度について検討する。最先端の対話システムを用いた実験により、既存のシステムは高度開発途上国の概念に関する質問に役立っていることが明らかとなった。
論文参考訳（メタデータ） (2022-05-25T07:58:38Z)
End-to-end Spoken Conversational Question Answering: Task, Dataset and Model [92.18621726802726]
音声による質問応答では、システムは関連する音声書き起こしの中に連続したテキストスパンからの質問に答えるように設計されている。本稿では,複雑な対話フローをモデル化することを目的とした音声対話型質問応答タスク(SCQA)を提案する。本研究の目的は,音声記録に基づく対話型質問に対処するシステムを構築することであり,情報収集システムによる様々なモダリティからより多くの手がかりを提供する可能性を探ることである。
論文参考訳（メタデータ） (2022-04-29T17:56:59Z)
Reasoning over Vision and Language: Exploring the Benefits of Supplemental Knowledge [59.87823082513752]
本稿では,汎用知識基盤(KB)から視覚言語変換器への知識の注入について検討する。我々は複数のタスクやベンチマークに対する様々なkbの関連性を実証的に研究する。この技術はモデルに依存しず、最小限の計算オーバーヘッドで任意の視覚言語変換器の適用可能性を拡張することができる。
論文参考訳（メタデータ） (2021-01-15T08:37:55Z)
A Semantic Web Framework for Automated Smart Assistants: COVID-19 Case Study [0.0]
Instant Expertは、音声対応スマートアシスタントの構築と統合のためのオープンソースのセマンティックWebフレームワークである。提案するフレームワークは、高度なWeb技術を活用して、再利用性と信頼性を確保する。疾病予防管理センター(CDC)のデータに基づいて、新型コロナウイルスの情報アシスタントを作成するためのユースケースを提示する。
論文参考訳（メタデータ） (2020-07-01T20:47:44Z)
Stay Hungry, Stay Focused: Generating Informative and Specific Questions in Information-Seeking Conversations [41.74162467619795]
情報非対称な会話における情報的質問生成の問題について検討する。実践的な質問を生成するために,情報量測定を最適化するために強化学習を用いる。そこで本研究では,提案した実用的質問は,ベースラインモデル上で生成した質問の有意性と特異性を大幅に向上させることを示す。
論文参考訳（メタデータ） (2020-04-30T00:49:14Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。