論文の概要: TikTok's Research API: Problems Without Explanations
- arxiv url: http://arxiv.org/abs/2506.09746v2
- Date: Thu, 12 Jun 2025 11:44:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-13 13:18:14.195188
- Title: TikTok's Research API: Problems Without Explanations
- Title(参考訳): TikTokのResearch API:説明なしの問題
- Authors: Carlos Entrena-Serrano, Martin Degeling, Salvatore Romano, Raziye Buse Çetin,
- Abstract要約: TikTokは2023年7月にヨーロッパでResearch APIへのアクセスを拡大した。
この拡張にもかかわらず、提供されたデータには顕著な制限と不整合が持続する。
APIデータは不完全であり、データドキュメンテーションを扱う際には信頼できない。
- 参考スコア(独自算出の注目度): 2.06242362470764
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Following the Digital Services Act of 2023, which requires Very Large Online Platforms (VLOPs) and Very Large Online Search Engines (VLOSEs) to facilitate data accessibility for independent research, TikTok augmented its Research API access within Europe in July 2023. This action was intended to ensure compliance with the DSA, bolster transparency, and address systemic risks. Nonetheless, research findings reveal that despite this expansion, notable limitations and inconsistencies persist within the data provided. Our experiment reveals that the API fails to provide metadata for one in eight videos provided through data donations, including official TikTok videos, advertisements, and content from specific accounts, without an apparent reason. The API data is incomplete, making it unreliable when working with data donations, a prominent methodology for algorithm audits and research on platform accountability. To monitor the functionality of the API and eventual fixes implemented by TikTok, we publish a dashboard with a daily check of the availability of 10 videos that were not retrievable in the last month. The video list includes very well-known accounts, notably that of Taylor Swift. The current API lacks the necessary capabilities for thorough independent research and scrutiny. It is crucial to support and safeguard researchers who utilize data scraping to independently validate the platform's data quality.
- Abstract(参考訳): 2023年デジタルサービス法は、独立研究のためのデータアクセシビリティを促進するために、VLOP(Very Large Online Platforms)とVLOSE(Very Large Online Search Engines)を必要とするが、TikTokは2023年7月にヨーロッパでのResearch APIアクセスを強化した。
この行動は、DSAへのコンプライアンスを確保し、透明性を高め、システム的リスクに対処することを目的としていた。
それでも研究結果は、この拡張にもかかわらず、提供されたデータの中に顕著な制限と不整合が持続していることを明らかにしている。
実験の結果、このAPIは公式のTikTokビデオ、広告、特定のアカウントからのコンテンツなど、データ提供によって提供される8つに1つに1つのメタデータを提供していないことが明らかになった。
APIデータは不完全であり、アルゴリズム監査とプラットフォームアカウンタビリティ研究の著名な方法論であるデータ提供を扱う場合、信頼性が低い。
TikTokが実装したAPIの機能と最終的な修正を監視するため、先月取得できなかった10本のビデオの可用性を毎日チェックしたダッシュボードを公開しています。
ビデオリストにはテイラー・スウィフトの有名なアカウントが含まれている。
現在のAPIには、徹底的な独立した調査と精査に必要な機能がない。
データスクレイピングを利用して、プラットフォームのデータ品質を独立して検証する研究者を支援し、保護することが重要である。
関連論文リスト
- Real Money, Fake Models: Deceptive Model Claims in Shadow APIs [26.860718016839126]
サードパーティサービスは、間接アクセスによる地域制限なしに、公式のモデルサービスへのアクセスを提供すると主張している。
広く使われているにもかかわらず、シャドウAPIが公式APIと一貫性のあるアウトプットを提供するかどうかは不明だ。
これらのプラクティスは、科学的研究の妥当性を損なうとともに、シャドウAPI利用者の利益を損なうとともに、公式なモデル提供者の評判を損なう。
論文 参考訳(メタデータ) (2026-03-02T14:33:05Z) - Why Authors and Maintainers Link (or Don't Link) Their PyPI Libraries to Code Repositories and Donation Platforms [83.16077040470975]
Python Package Index(PyPI)上のライブラリのメタデータは、オープンソースライブラリの透明性、信頼性、持続性をサポートする上で重要な役割を果たす。
本稿は,5万PyPIの著者とメンテナに送付された2つの対象調査を組み合わせた大規模実証研究である。
我々は,大規模言語モデル(LLM)に基づくトピックモデリングを用いて1,400以上の応答を分析し,リポジトリと寄付プラットフォームのリンクに関連する重要なモチベーションと障壁を明らかにする。
論文 参考訳(メタデータ) (2026-01-21T16:13:57Z) - Auditing Meta and TikTok Research API Data Access under Article 40(12) of the Digital Services Act [8.348593305367523]
本稿では、プラットフォームリサーチAPIから得られたデータと、同一プラットフォームのユーザ可視公開情報環境(PIE)に関するデータを比較することで、研究アクセスモダリティの体系的な監査を行う。
本研究は,3種類のプラットフォームを具体化する機構,スコープ狭化,メタデータのストリッピング,運用上の制約による系統的なデータ損失を示す。
デジタルサービス法(DSA)に基づくシステムリスクの有意義かつ独立した監査を支援するには,MetaおよびTikTok Research APIの現在の形態は不十分である,と我々は結論付けている。
論文 参考訳(メタデータ) (2026-01-18T12:59:11Z) - Detecting and Fixing API Misuses of Data Science Libraries Using Large Language Models [0.6958509696068848]
本稿では,データサイエンスライブラリのAPI誤用を検出し,修正するためのLCMベースのアプローチであるDSCHECKERを紹介する。
APIの誤用の検出と修正に有用な2つの重要な情報、すなわちAPIディレクティブとデータ情報を特定します。
ドシェッカー剤は48.65パーセントのF1スコアを検出でき、誤用の39.47パーセントを修正している。
論文 参考訳(メタデータ) (2025-09-29T18:30:02Z) - Differentially Private Synthetic Data Release for Topics API Outputs [63.79476766779742]
当社では,Google ChromeのPrivacy Sandboxの一部として,1つのPrivacy-Preserving Ads API – Topics APIに注目しています。
実トピックAPIデータの再識別リスク特性と密に一致した、微分プライベートなデータセットを生成する。
これにより、外部の研究者がAPIを詳細に分析し、現実的な大規模データセットの事前および将来の作業の再現が可能になります。
論文 参考訳(メタデータ) (2025-06-30T13:46:57Z) - I'm Sorry Dave, I'm Afraid I Can't Return That: On YouTube Search API Use in Research [55.2480439325792]
同一クエリを12週間にわたって実行することで,APIの動作を分析する。
以上の結果から,検索エンドポイントは文書化されていない方法で,一貫性のない結果を返すことが示唆された。
以上の結果から,より短い人気ビデオが優先される可能性が示唆されているが,チャンネルの人気の役割はそれほど明確ではない。
論文 参考訳(メタデータ) (2025-06-04T20:13:42Z) - Post-Post-API Age: Studying Digital Platforms in Scant Data Access Times [5.997153455641738]
API後の時代」は、プラットフォームの透明性の向上と、デジタルプラットフォームに関する包括的な研究の新たな機会に対する楽観を喚起した。
しかし、プラットフォームが実際に適切なデータアクセスを提供するかどうかは不明だ。
以上の結果から,ソーシャルメディアデータにアクセスする上で大きな課題が浮かび上がっている。
これらの課題は、データアクセスにおける既存の制度的、地域的、財政的不平等を悪化させてきた。
論文 参考訳(メタデータ) (2025-05-15T00:47:06Z) - The Great Data Standoff: Researchers vs. Platforms Under the Digital Services Act [9.275892768167122]
我々は2024年のルーマニア大統領選挙の干渉事件に焦点を当てている。
これは欧州委員会によるシステム的リスク調査を誘発するこの種のイベントとしては初めてである。
この事件を解析することにより、選挙に関連したシステムリスクを理解して、実践的な研究課題を探求することができる。
論文 参考訳(メタデータ) (2025-05-02T09:00:19Z) - Your Fix Is My Exploit: Enabling Comprehensive DL Library API Fuzzing with Large Language Models [49.214291813478695]
AIアプリケーションで広く使用されているディープラーニング(DL)ライブラリは、オーバーフローやバッファフリーエラーなどの脆弱性を含むことが多い。
従来のファジィングはDLライブラリの複雑さとAPIの多様性に悩まされている。
DLライブラリのためのLLM駆動ファジィ手法であるDFUZZを提案する。
論文 参考訳(メタデータ) (2025-01-08T07:07:22Z) - What we can learn from TikTok through its Research API [3.424635462664968]
最近リリースされた無料のResearch APIは、投稿されたビデオ、関連コメント、ユーザーアクティビティのデータを集めるための扉を開く。
本研究は,TikTokビデオのランダムなサンプルを6年間にわたって収集し,分析することにより,Research APIが返した結果の信頼性を評価することに焦点を当てた。
論文 参考訳(メタデータ) (2024-02-21T14:59:49Z) - Analyzing User Engagement with TikTok's Short Format Video Recommendations using Data Donations [31.764672446151412]
データ提供システムを通じて収集したデータを用いて、TikTok上のユーザエンゲージメントを分析する。
利用者の注意力は45%程度で安定しているのに対し,平均日使用時間は1日平均で1日当たり1時間以上上昇していることがわかった。
また、フォローしていない人よりもフォローしている人がアップロードしたビデオの方が多いこともわかりました。
論文 参考訳(メタデータ) (2023-01-12T11:34:45Z) - Black-box Dataset Ownership Verification via Backdoor Watermarking [67.69308278379957]
我々は、リリースデータセットの保護を、(目立たしい)サードパーティモデルのトレーニングに採用されているかどうかの検証として定式化する。
バックドアの透かしを通じて外部パターンを埋め込んでオーナシップの検証を行い,保護することを提案する。
具体的には、有毒なバックドア攻撃(例えばBadNets)をデータセットのウォーターマーキングに利用し、データセット検証のための仮説テストガイダンスメソッドを設計する。
論文 参考訳(メタデータ) (2022-08-04T05:32:20Z) - DataLab: A Platform for Data Analysis and Intervention [96.75253335629534]
DataLabは統一されたデータ指向プラットフォームであり、ユーザはデータの特徴をインタラクティブに分析することができる。
ツールネームには、データセットレコメンデーションとグローバルビジョン分析のための機能がある。
これまでのところ、DataLabは1,715のデータセットと3,583の変換バージョンをカバーしている。
論文 参考訳(メタデータ) (2022-02-25T18:32:19Z) - Algorithmic Fairness Datasets: the Story so Far [68.45921483094705]
データ駆動アルゴリズムは、人々の幸福に直接影響し、批判的な決定をサポートするために、さまざまな領域で研究されている。
研究者のコミュニティは、既存のアルゴリズムの株式を調査し、新しいアルゴリズムを提案し、歴史的に不利な人口に対する自動意思決定のリスクと機会の理解を深めてきた。
公正な機械学習の進歩はデータに基づいており、適切に文書化された場合にのみ適切に使用できる。
残念なことに、アルゴリズムフェアネスコミュニティは、特定のリソース(オパシティ)に関する情報の不足と利用可能な情報の分散(スパーシティ)によって引き起こされる、集合的なデータドキュメント負債に悩まされている。
論文 参考訳(メタデータ) (2022-02-03T17:25:46Z) - An Empirical Investigation of Personalization Factors on TikTok [77.34726150561087]
TikTokのアルゴリズムがプラットフォームの成功とコンテンツの配布に重要であるにもかかわらず、アルゴリズムの実証的な分析はほとんど行われていない。
我々は,私たちが開発したカスタムアルゴリズムを用いたソック・パペット・監査手法を用いて,TikTokへのアクセスに使用される言語と位置情報の効果を検証,分析した。
その結果,フォローフェールが最も強い影響を受けており,ライクフェールやビデオ視聴率が高いことが判明した。
論文 参考訳(メタデータ) (2022-01-28T17:40:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。