論文の概要: Forgetful by Design? A Critical Audit of YouTube's Search API for Academic Research
- arxiv url: http://arxiv.org/abs/2506.11727v2
- Date: Wed, 25 Jun 2025 14:06:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-26 14:36:56.577526
- Title: Forgetful by Design? A Critical Audit of YouTube's Search API for Academic Research
- Title(参考訳): デザインの忘れ物? YouTubeの学術研究のための検索APIの批判的監査
- Authors: Bernhard Rieder, Adrian Padilla, Oscar Coromina,
- Abstract要約: 本稿では、学術研究の共通ツールであるYouTubeのData API(v3)の検索エンドポイントを批判的に監査する。
完全性、代表性、一貫性、バイアスに関する大きな制限を特定します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This paper critically audits the search endpoint of YouTube's Data API (v3), a common tool for academic research. Through systematic weekly searches over six months using eleven queries, we identify major limitations regarding completeness, representativeness, consistency, and bias. Our findings reveal substantial differences between ranking parameters like relevance and date in terms of video recall and precision, with relevance often retrieving numerous off-topic videos. We also find severe temporal decay, as the number of findable videos for a specific period dramatically decreases after just 20-60 days from the publication date, potentially hampering many different research designs. Furthermore, search results lack consistency, with identical queries yielding different video sets over time, compromising replicability. A case study on the European Parliament elections highlights how these issues impact research outcomes. While the paper offers several mitigation strategies, it concludes that the API's search function, potentially prioritizing "freshness" over comprehensive retrieval, is not adequate for robust academic research, especially concerning Digital Services Act requirements.
- Abstract(参考訳): 本稿では、学術研究の共通ツールであるYouTubeのData API(v3)の検索エンドポイントを批判的に監査する。
6ヶ月にわたる体系的な週次検索を通じて、完全性、代表性、一貫性、バイアスに関する大きな制限を識別する。
以上の結果から,ビデオのリコールと精度において,関連性や日付などのランキングパラメータには大きな違いがみられた。
また、公開日からわずか20~60日で特定の期間の検索可能なビデオの数が劇的に減少し、多くの異なる研究デザインが妨げられる可能性があるため、時間的劣化も深刻である。
さらに、検索結果には一貫性がなく、同じクエリで時間とともに異なるビデオセットが生成されるため、再現性が損なわれる。
欧州議会議員選挙に関するケーススタディでは、これらの問題が研究成果にどのように影響するかを強調している。
論文はいくつかの緩和戦略を提供しているが、包括的な検索よりも「新しさ」を優先する可能性のあるAPIの検索機能は、特にデジタルサービス法要件に関する堅牢な学術研究には不十分である、と結論付けている。
関連論文リスト
- I'm Sorry Dave, I'm Afraid I Can't Return That: On YouTube Search API Use in Research [55.2480439325792]
同一クエリを12週間にわたって実行することで,APIの動作を分析する。
以上の結果から,検索エンドポイントは文書化されていない方法で,一貫性のない結果を返すことが示唆された。
以上の結果から,より短い人気ビデオが優先される可能性が示唆されているが,チャンネルの人気の役割はそれほど明確ではない。
論文 参考訳(メタデータ) (2025-06-04T20:13:42Z) - MultiConIR: Towards multi-condition Information Retrieval [57.6405602406446]
我々は,マルチコンディションシナリオにおける検索モデルの評価を目的とした,最初のベンチマークであるMultiConIRを紹介する。
本稿では,マルチコンディションのロバスト性,モノトニック関連性ランキング,クエリフォーマットの感度に基づいて,検索とリランクモデルの評価を行う3つのタスクを提案する。
論文 参考訳(メタデータ) (2025-03-11T05:02:03Z) - MomentSeeker: A Task-Oriented Benchmark For Long-Video Moment Retrieval [61.414236415351446]
長ビデオモーメント検索(LMVR)のための新しいベンチマークであるMomentSeekerを提案する。
MomentSeekerは、長く多様なビデオに基づいて作られ、平均1200秒以上持続する。
グローバルレベル、イベントレベル、オブジェクトレベル、アクション認識、オブジェクトローカライゼーション、因果推論といった一般的なタスクをカバーする。
論文 参考訳(メタデータ) (2025-02-18T05:50:23Z) - A Flexible and Scalable Framework for Video Moment Search [51.47907684209207]
本稿では,テキストクエリにマッチする任意の長さの動画のコレクションからランク付けされたモーメントのリストを取得するためのフレキシブルなフレームワークを提案する。
SPR(Segment-Proposal-Ranking)と呼ばれる我々のフレームワークは,探索プロセスを,セグメント検索,提案生成,モーメント改善という3つの独立した段階に単純化する。
TVR-Rankingデータセットの評価から,我々のフレームワークは,計算コストと処理時間を大幅に削減して最先端の性能を実現することを示す。
論文 参考訳(メタデータ) (2025-01-09T08:54:19Z) - Towards Debiasing Frame Length Bias in Text-Video Retrieval via Causal
Intervention [72.12974259966592]
トリミングビデオクリップのトレーニングセットとテストセットのフレーム長差による時間偏差について,一意かつ体系的に検討した。
Epic-Kitchens-100, YouCook2, MSR-VTTデータセットについて, 因果脱バイアス法を提案し, 広範な実験およびアブレーション研究を行った。
論文 参考訳(メタデータ) (2023-09-17T15:58:27Z) - Zero-shot Audio Topic Reranking using Large Language Models [42.774019015099704]
実例によるマルチモーダルビデオ検索 (MVSE) では, ビデオクリップを情報検索の問合せ語として利用する。
本研究の目的は,この高速アーカイブ検索による性能損失を,再ランク付け手法を検証することによって補償することである。
パブリックなビデオアーカイブであるBBC Rewind corpusでトピックベースの検索のパフォーマンスを評価する。
論文 参考訳(メタデータ) (2023-09-14T11:13:36Z) - Deep Learning for Video-Text Retrieval: a Review [13.341694455581363]
Video-Text Retrieval (VTR) は、ある文のセマンティクスに関連する最も関連性の高いビデオを探すことを目的としている。
本稿では,VTRに関する100以上の研究論文をレビューし,要約する。
論文 参考訳(メタデータ) (2023-02-24T10:14:35Z) - Exposing Query Identification for Search Transparency [69.06545074617685]
本稿では,検索システムの2つのクラスにおいて,クエリとドキュメントの役割を逆転させることにより,検索タスクとしてのEQIの実現可能性について検討する。
本研究では,クエリのランク付けの質を評価するための評価基準を導出するとともに,近似EQIの様々な実践的側面に着目した経験的分析を行う。
論文 参考訳(メタデータ) (2021-10-14T20:19:27Z) - A Systematic Review of Automated Query Reformulations in Source Code
Search [12.234169944475537]
我々は,2,970の候補研究から,問合せの改定に関する70の研究を選定した。
本稿では,検索クエリの改定における研究状況を改善するためのベストプラクティスと今後の機会について論じる。
論文 参考訳(メタデータ) (2021-08-22T05:47:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。