論文の概要: Search Result Clustering in Collaborative Sound Collections
- arxiv url: http://arxiv.org/abs/2004.03985v1
- Date: Wed, 8 Apr 2020 13:08:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-15 09:49:07.629730
- Title: Search Result Clustering in Collaborative Sound Collections
- Title(参考訳): 協調音集における検索結果クラスタリング
- Authors: Xavier Favory, Frederic Font and Xavier Serra
- Abstract要約: 大規模オンラインデータベースを問合せする際に得られた多様な音声コレクションをクラスタリングするために,音声特徴を用いたグラフベースのアプローチを提案する。
不整合クラスタを破棄する信頼性尺度を用いることで,パーティションの品質が向上することを示す。
- 参考スコア(独自算出の注目度): 17.48516881308658
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The large size of nowadays' online multimedia databases makes retrieving
their content a difficult and time-consuming task. Users of online sound
collections typically submit search queries that express a broad intent, often
making the system return large and unmanageable result sets. Search Result
Clustering is a technique that organises search-result content into coherent
groups, which allows users to identify useful subsets in their results.
Obtaining coherent and distinctive clusters that can be explored with a
suitable interface is crucial for making this technique a useful complement of
traditional search engines. In our work, we propose a graph-based approach
using audio features for clustering diverse sound collections obtained when
querying large online databases. We propose an approach to assess the
performance of different features at scale, by taking advantage of the metadata
associated with each sound. This analysis is complemented with an evaluation
using ground-truth labels from manually annotated datasets. We show that using
a confidence measure for discarding inconsistent clusters improves the quality
of the partitions. After identifying the most appropriate features for
clustering, we conduct an experiment with users performing a sound design task,
in order to evaluate our approach and its user interface. A qualitative
analysis is carried out including usability questionnaires and semi-structured
interviews. This provides us with valuable new insights regarding the features
that promote efficient interaction with the clusters.
- Abstract(参考訳): 現在のオンラインマルチメディアデータベースの大規模化は、コンテンツの検索を困難かつ時間のかかる作業にしている。
オンラインのサウンドコレクションのユーザーは、通常、幅広い意図を表す検索クエリを送信し、しばしばシステムが大きくて管理不能な結果セットを返す。
Search Result Clusteringは、検索-resultコンテンツを一貫性のあるグループにまとめるテクニックで、ユーザは検索結果に有用なサブセットを識別できる。
適切なインターフェースで探索できるコヒーレントで独特なクラスタを持つことは、この技術を従来の検索エンジンを補うのに不可欠である。
本研究では,大規模オンラインデータベースの問合せ時に得られる多様な音響コレクションをクラスタリングするために,音声特徴を用いたグラフベースアプローチを提案する。
本稿では,各音に関連付けられたメタデータを利用して,様々な特徴を大規模に評価する手法を提案する。
この分析は、手動の注釈付きデータセットからの接地ラベルを用いた評価で補完される。
不整合クラスタを破棄する信頼性尺度を用いることで,パーティションの品質が向上することを示す。
クラスタ化に最も適した特徴を特定した上で,ユーザに対して適切な設計タスクを行う実験を行い,アプローチとそのユーザインターフェースを評価する。
ユーザビリティアンケートや半構造化インタビューを含む質的分析を行う。
これにより、クラスタとの効率的なインタラクションを促進する機能に関する貴重な新しい洞察が得られます。
関連論文リスト
- A structured regression approach for evaluating model performance across intersectional subgroups [53.91682617836498]
分散評価(disaggregated evaluation)は、AIフェアネスアセスメントにおける中心的なタスクであり、AIシステムのさまざまなサブグループ間でのパフォーマンスを測定することを目的としている。
非常に小さなサブグループであっても,信頼性の高いシステム性能推定値が得られることを示す。
論文 参考訳(メタデータ) (2024-01-26T14:21:45Z) - One-Shot Learning as Instruction Data Prospector for Large Language Models [108.81681547472138]
textscNuggetsはワンショット学習を使用して、広範なデータセットから高品質な命令データを選択する。
我々は,textscNuggets がキュレートした例の上位1%による命令チューニングが,データセット全体を用いた従来の手法よりも大幅に優れていることを示す。
論文 参考訳(メタデータ) (2023-12-16T03:33:12Z) - Representation Learning for the Automatic Indexing of Sound Effects
Libraries [79.68916470119743]
タスク固有のがデータセットに依存しない表現は、クラス不均衡、一貫性のないクラスラベル、不十分なデータセットサイズなどのデータ問題にうまく対処できることを示す。
詳細な実験結果は、メトリック学習アプローチと異なるデータセット間の学習方法が表現効率に与える影響を示している。
論文 参考訳(メタデータ) (2022-08-18T23:46:13Z) - Seeking the Truth Beyond the Data. An Unsupervised Machine Learning
Approach [0.0]
クラスタリングは、ラベルのない要素/オブジェクトがグループ化される、教師なしの機械学習方法論である。
この記事では、最も広く使われているクラスタリング手法について詳しく説明する。
3つのデータセットに基づいて、これらのアルゴリズムのクラスタリング効率の比較を強調している。
論文 参考訳(メタデータ) (2022-07-14T14:22:36Z) - Twitter Referral Behaviours on News Consumption with Ensemble Clustering
of Click-Stream Data in Turkish Media [2.9005223064604078]
本研究は,Twitter のレファレンスに追随するニュース消費パターンを識別するために,組織ウェブサイトにおける読者のクリック活動について調査する。
調査は、ログデータをニュースコンテンツとリンクして洞察を深めることで、幅広い視点に展開されている。
論文 参考訳(メタデータ) (2022-02-04T09:57:13Z) - A review of systematic selection of clustering algorithms and their
evaluation [0.0]
本稿では,クラスタリングアルゴリズムとそれに対応する検証概念の体系的選択ロジックを同定することを目的とする。
目標は、潜在的なユーザが自分のニーズと基盤となるデータクラスタリングの問題の性質に最も適したアルゴリズムを選択できるようにすることだ。
論文 参考訳(メタデータ) (2021-06-24T07:01:46Z) - Connecting Images through Time and Sources: Introducing Low-data,
Heterogeneous Instance Retrieval [3.6526118822907594]
バリエーションやセマンティックな内容のパネルによく反応する機能を選択するのは簡単ではないことを示す。
Alegoriaベンチマークの新しい拡張バージョンを導入し、詳細なアノテーションを使って記述子を比較します。
論文 参考訳(メタデータ) (2021-03-19T10:54:51Z) - Automatic Curation of Large-Scale Datasets for Audio-Visual
Representation Learning [62.47593143542552]
本稿では,自動データセットキュレーションのためのサブセット最適化手法について述べる。
本研究では,高視聴覚対応の映像を抽出し,自己監視モデルが自動的に構築されているにもかかわらず,既存のスケールのビデオデータセットと類似したダウンストリームパフォーマンスを達成できることを実証した。
論文 参考訳(メタデータ) (2021-01-26T14:27:47Z) - Boxer: Interactive Comparison of Classifier Results [9.957660146705745]
Boxerは、機械学習の比較を可能にするシステムである。
これによってユーザは、トレーニングとテストのインスタンスの興味深いサブセットを特定し、これらのサブセットの分類器のパフォーマンスを比較することができる。
モデル選択,チューニング,公平性評価,データ品質診断などのユースケースで,Boxerを実演する。
論文 参考訳(メタデータ) (2020-04-16T21:05:34Z) - Mining Implicit Entity Preference from User-Item Interaction Data for
Knowledge Graph Completion via Adversarial Learning [82.46332224556257]
本稿では,知識グラフ補完タスクにおけるユーザインタラクションデータを活用することで,新たな逆学習手法を提案する。
我々のジェネレータはユーザインタラクションデータから分離されており、識別器の性能を向上させるのに役立ちます。
利用者の暗黙の実体的嗜好を発見するために,グラフニューラルネットワークに基づく精巧な協調学習アルゴリズムを設計する。
論文 参考訳(メタデータ) (2020-03-28T05:47:33Z) - Improving Multi-Turn Response Selection Models with Complementary
Last-Utterance Selection by Instance Weighting [84.9716460244444]
我々は、データリソース自体の根底にある相関を利用して、異なる種類の監視信号を導出することを検討する。
2つの公開データセットで広範な実験を行い、両方のデータセットで大幅に改善した。
論文 参考訳(メタデータ) (2020-02-18T06:29:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。