論文の概要: I'm Sorry Dave, I'm Afraid I Can't Return That: On YouTube Search API Use in Research
- arxiv url: http://arxiv.org/abs/2506.04422v1
- Date: Wed, 04 Jun 2025 20:13:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-06 21:53:49.410661
- Title: I'm Sorry Dave, I'm Afraid I Can't Return That: On YouTube Search API Use in Research
- Title(参考訳): YouTubeの検索APIが研究に使われている
- Authors: Alexandros Efstratiou,
- Abstract要約: 同一クエリを12週間にわたって実行することで,APIの動作を分析する。
以上の結果から,検索エンドポイントは文書化されていない方法で,一貫性のない結果を返すことが示唆された。
以上の結果から,より短い人気ビデオが優先される可能性が示唆されているが,チャンネルの人気の役割はそれほど明確ではない。
- 参考スコア(独自算出の注目度): 55.2480439325792
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: YouTube is among the most widely-used platforms worldwide, and has seen a lot of recent academic attention. Despite its popularity and the number of studies conducted on it, much less is understood about the way in which YouTube's Data API, and especially the Search endpoint, operates. In this paper, we analyze the API's behavior by running identical queries across a period of 12 weeks. Our findings suggest that the search endpoint returns highly inconsistent results between queries in ways that are not officially documented. Specifically, the API seems to randomize returned videos based on the relative popularity of the respective topic during the query period, making it nearly impossible to obtain representative historical video samples, especially during non-peak topical periods. Our results also suggest that the API may prioritize shorter, more popular videos, although the role of channel popularity is not as clear. We conclude with suggested strategies for researchers using the API for data collection, as well as future research directions on expanding the API's use-cases.
- Abstract(参考訳): YouTubeは世界で最も広く使われているプラットフォームの一つであり、近年は学術的な注目を集めている。
その人気とそれに関する研究の数にもかかわらず、YouTubeのData API、特に検索エンドポイントの動作方法についてはあまり理解されていない。
本稿では,12週間にわたって同一クエリを実行することにより,APIの動作を分析する。
以上の結果から,検索終端は公式に文書化されていない方法でクエリ間で非常に一貫性のない結果を返すことが示唆された。
具体的には、検索期間中に各トピックの相対的な人気に基づいて、返却されたビデオのランダム化を行う。
以上の結果から,より短い人気ビデオが優先される可能性が示唆されているが,チャンネルの人気の役割はそれほど明確ではない。
このAPIをデータ収集に使用する研究者の戦略や、APIのユースケースを拡張するための今後の研究方針について結論付けた。
関連論文リスト
- APIRL: Deep Reinforcement Learning for REST API Fuzzing [3.053989095162017]
APIRLは、REST APIをテストするための、完全に自動化された深層強化学習ツールである。
APIRLは、現実世界のREST APIの最先端よりも、はるかに多くのバグを見つけることができます。
論文 参考訳(メタデータ) (2024-12-20T15:40:51Z) - A Systematic Evaluation of Large Code Models in API Suggestion: When, Which, and How [53.65636914757381]
API提案は、現代のソフトウェア開発において重要なタスクである。
大規模コードモデル(LCM)の最近の進歩は、API提案タスクにおいて有望であることを示している。
論文 参考訳(メタデータ) (2024-09-20T03:12:35Z) - A Solution-based LLM API-using Methodology for Academic Information Seeking [49.096714812902576]
SoAyは学術情報検索のためのソリューションベースのLLM API利用方法論である。
ソリューションが事前に構築されたAPI呼び出しシーケンスである場合、推論メソッドとしてソリューションを備えたコードを使用する。
その結果、最先端のLLM APIベースのベースラインと比較して34.58-75.99%のパフォーマンス改善が見られた。
論文 参考訳(メタデータ) (2024-05-24T02:44:14Z) - What we can learn from TikTok through its Research API [3.424635462664968]
最近リリースされた無料のResearch APIは、投稿されたビデオ、関連コメント、ユーザーアクティビティのデータを集めるための扉を開く。
本研究は,TikTokビデオのランダムなサンプルを6年間にわたって収集し,分析することにより,Research APIが返した結果の信頼性を評価することに焦点を当てた。
論文 参考訳(メタデータ) (2024-02-21T14:59:49Z) - Advanced White-Box Heuristics for Search-Based Fuzzing of REST APIs [3.3714461095047743]
現在、EvoMasterはREST APIのホワイトボックスファジングをサポートする唯一のツールである。
私たちは、APIスキーマで不特定な制約に対処する方法など、一連の新しいホワイトボックスファズを提供します。
我々の新しい技術は、オープンソースの検索ベースのファズーEvoMasterの拡張として実装されている。
論文 参考訳(メタデータ) (2023-09-15T12:39:01Z) - APICom: Automatic API Completion via Prompt Learning and Adversarial
Training-based Data Augmentation [6.029137544885093]
APIレコメンデーションは、開発者が多数の候補APIの中で必要なAPIを見つけるのを支援するプロセスである。
これまでの研究では、主にAPIレコメンデーションをレコメンデーションタスクとしてモデル化していた。
ニューラルネットワーク翻訳研究領域に動機づけられたこの問題を生成タスクとしてモデル化することができる。
提案手法は,プロンプト学習に基づく新しいアプローチAPIComを提案し,そのプロンプトに応じてクエリに関連するAPIを生成する。
論文 参考訳(メタデータ) (2023-09-13T15:31:50Z) - Evaluating Embedding APIs for Information Retrieval [51.24236853841468]
ドメインの一般化と多言語検索における既存のセマンティック埋め込みAPIの機能を評価する。
BM25の結果をAPIを使って再ランク付けすることは、予算に優しいアプローチであり、英語でもっとも効果的である。
非英語検索では、再ランク付けは結果を改善するが、BM25のハイブリッドモデルは高いコストで機能する。
論文 参考訳(メタデータ) (2023-05-10T16:40:52Z) - Scanning Only Once: An End-to-end Framework for Fast Temporal Grounding
in Long Videos [60.86880787242561]
ビデオ時間グラウンドは、クエリ記述にマッチしたビデオセグメントをピンポイントすることを目的としている。
高速な時間的グラウンド化のためのエンドツーエンドのフレームワークを提案する。
提案手法は最先端技術よりも優れ,textbf14.6$times$ / textbf102.8$times$高効率を実現している。
論文 参考訳(メタデータ) (2023-03-15T03:54:43Z) - QVHighlights: Detecting Moments and Highlights in Videos via Natural
Language Queries [89.24431389933703]
Query-based Video Highlights (QVHighlights) データセットを提示する。
これは1万本以上のYouTubeビデオで構成され、幅広いトピックをカバーしている。
データセット内の各ビデオには、(1)人書き自由形式のNLクエリ、(2)クエリに関するビデオw.r.t.の関連モーメント、(3)クエリに関連するすべてのクリップに対する5ポイントスケールのサリエンシスコアが注釈付けされている。
論文 参考訳(メタデータ) (2021-07-20T16:42:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。