論文の概要: The language of sound search: Examining User Queries in Audio Search Engines
- arxiv url: http://arxiv.org/abs/2410.08324v1
- Date: Thu, 10 Oct 2024 19:24:13 GMT
- ステータス: 処理完了
- システム内更新日: 2024-10-31 04:06:19.004200
- Title: The language of sound search: Examining User Queries in Audio Search Engines
- Title(参考訳): 音声検索の言語:音声検索エンジンにおけるユーザクエリの検討
- Authors: Benno Weck, Frederic Font,
- Abstract要約: テキストベースの音声検索システムの設計における現実世界のユーザニーズと振る舞いについて、研究は不十分に対処する。
このギャップを埋めるために、カスタムサーベイとFreesound Webサイトクエリログという、2つのソースからの検索クエリを分析しました。
その結果,調査クエリは一般にFreesoundクエリよりも長いことが示唆され,システム制約によって制限されない場合,ユーザが詳細なクエリを好むことが示唆された。
- 参考スコア(独自算出の注目度): 0.2455468619225742
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This study examines textual, user-written search queries within the context of sound search engines, encompassing various applications such as foley, sound effects, and general audio retrieval. Current research inadequately addresses real-world user needs and behaviours in designing text-based audio retrieval systems. To bridge this gap, we analysed search queries from two sources: a custom survey and Freesound website query logs. The survey was designed to collect queries for an unrestricted, hypothetical sound search engine, resulting in a dataset that captures user intentions without the constraints of existing systems. This dataset is also made available for sharing with the research community. In contrast, the Freesound query logs encompass approximately 9 million search requests, providing a comprehensive view of real-world usage patterns. Our findings indicate that survey queries are generally longer than Freesound queries, suggesting users prefer detailed queries when not limited by system constraints. Both datasets predominantly feature keyword-based queries, with few survey participants using full sentences. Key factors influencing survey queries include the primary sound source, intended usage, perceived location, and the number of sound sources. These insights are crucial for developing user-centred, effective text-based audio retrieval systems, enhancing our understanding of user behaviour in sound search contexts.
- Abstract(参考訳): 本研究では,音声検索エンジンのコンテキスト内でのテキストによるユーザによる検索クエリについて検討し,フォリー,音響効果,一般音声検索などの様々な応用について検討した。
現在の研究は、テキストベースの音声検索システムの設計における現実世界のユーザニーズと行動に不適切な対処を行っている。
このギャップを埋めるために、カスタムサーベイとFreesound Webサイトクエリログという、2つのソースからの検索クエリを分析しました。
このサーベイは、制限のない仮説的な音声検索エンジンのクエリを収集するために設計され、結果として既存のシステムの制約なしにユーザの意図をキャプチャするデータセットが作られる。
このデータセットは研究コミュニティと共有することもできる。
これとは対照的に、Freesoundのクエリログには約900万の検索リクエストが含まれており、実際の使用パターンの包括的なビューを提供する。
その結果,調査クエリは一般にFreesoundクエリよりも長いことが示唆され,システム制約によって制限されない場合,ユーザが詳細なクエリを好むことが示唆された。
どちらのデータセットも主にキーワードベースのクエリを特徴としており、全文を使用した調査参加者はほとんどいない。
調査クエリに影響を及ぼす要因は,主音源,意図的使用法,知覚された位置,音源数などである。
これらの知見は、ユーザ中心の効果的なテキストベース音声検索システムの開発に不可欠であり、音声検索コンテキストにおけるユーザ行動の理解を深める。
関連論文リスト
- Using LLMs to Investigate Correlations of Conversational Follow-up Queries with User Satisfaction [32.32365329050603]
そこで本稿では,会話検索エンジンNaver Cueから18人のユーザのフォローアップクエリパターンの分類法を提案する。
クエリ修正に関する既存の文献と比較して、フォローアップクエリの背後にある新たなモチベーションとアクションが明らかになった。
最初の結果から,Clarifying Queries, Excluding Condition, Substitutioning Condition with follow-up queryなど,いくつかの不満のシグナルが示唆された。
論文 参考訳(メタデータ) (2024-07-18T05:10:35Z) - CLARINET: Augmenting Language Models to Ask Clarification Questions for Retrieval [52.134133938779776]
CLARINETは,回答が正しい候補の確実性を最大化する質問を選択することで,情報的明確化を問うシステムである。
提案手法は,大規模言語モデル(LLM)を検索分布の条件付きで拡張し,各ターンで真の候補のランクを最大化する問題を生成する。
論文 参考訳(メタデータ) (2024-04-28T18:21:31Z) - Search-Engine-augmented Dialogue Response Generation with Cheaply
Supervised Query Production [98.98161995555485]
応答生成のために,任意の検索エンジンから膨大な動的情報にアクセス可能な対話モデルを提案する。
コアモジュールとして、クエリプロデューサを使用して、対話コンテキストからクエリを生成して、検索エンジンと対話する。
R@1とR@5のレートを62.4%と74.8%で達成できることを示す実験を行った。
論文 参考訳(メタデータ) (2023-02-16T01:58:10Z) - Graph Enhanced BERT for Query Understanding [55.90334539898102]
クエリ理解は、ユーザの検索意図を探索し、ユーザが最も望まれる情報を発見できるようにする上で、重要な役割を果たす。
近年、プレトレーニング言語モデル (PLM) は様々な自然言語処理タスクを進歩させてきた。
本稿では,クエリコンテンツとクエリグラフの両方を活用可能な,グラフ強化事前学習フレームワークGE-BERTを提案する。
論文 参考訳(メタデータ) (2022-04-03T16:50:30Z) - Audio-text Retrieval in Context [24.38055340045366]
そこで本研究では,音声・テキストのアライメントを改善するために,複数のオーディオ機能とシーケンスアグリゲーション手法について検討する。
我々は,事前学習した音声特徴と記述子に基づくアグリゲーション法を用いた文脈音声テキスト検索システムを構築した。
提案システムでは、リコール、中央値、平均値を含むすべての指標において、双方向音声テキスト検索において顕著な改善が達成されている。
論文 参考訳(メタデータ) (2022-03-25T13:41:17Z) - Exposing Query Identification for Search Transparency [69.06545074617685]
本稿では,検索システムの2つのクラスにおいて,クエリとドキュメントの役割を逆転させることにより,検索タスクとしてのEQIの実現可能性について検討する。
本研究では,クエリのランク付けの質を評価するための評価基準を導出するとともに,近似EQIの様々な実践的側面に着目した経験的分析を行う。
論文 参考訳(メタデータ) (2021-10-14T20:19:27Z) - Open-Retrieval Conversational Question Answering [62.11228261293487]
オープン検索型対話型質問応答 (ORConvQA) の設定を導入する。
ORConvQAのエンド・ツー・エンドシステムを構築し,レトリバー,リランカ,およびすべてトランスフォーマーをベースとしたリーダを特徴とする。
論文 参考訳(メタデータ) (2020-05-22T19:39:50Z) - Conversations with Search Engines: SERP-based Conversational Response
Generation [77.1381159789032]
我々は、検索エンジンと対話するためのパイプラインを開発するために、適切なデータセット、検索・アズ・ア・会話(SaaC)データセットを作成します。
また、このデータセットを用いて、検索エンジンと対話するための最先端パイプライン(Conversations with Search Engines (CaSE))も開発しています。
CaSEは、サポートされたトークン識別モジュールとプリア・アウェア・ポインタージェネレータを導入することで最先端を向上する。
論文 参考訳(メタデータ) (2020-04-29T13:07:53Z) - Search Result Clustering in Collaborative Sound Collections [17.48516881308658]
大規模オンラインデータベースを問合せする際に得られた多様な音声コレクションをクラスタリングするために,音声特徴を用いたグラフベースのアプローチを提案する。
不整合クラスタを破棄する信頼性尺度を用いることで,パーティションの品質が向上することを示す。
論文 参考訳(メタデータ) (2020-04-08T13:08:17Z) - Modeling Information Need of Users in Search Sessions [5.172625611483604]
本稿では,ユーザによって発行された過去のクエリの集合を利用するシーケンス・ツー・シーケンス・ベース・ニューラルアーキテクチャを提案する。
まず、我々のモデルを用いて、現在のクエリで重要で、次のクエリに保持される単語を予測する。
情報収集の直感的な戦略は,2つの大規模リアルタイム検索ログデータセットにおいて,これらのタスクにおいて優れた性能が得られることを示す。
論文 参考訳(メタデータ) (2020-01-03T15:25:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。