論文の概要: From 50K to 8.2 Million in 24 Hours: Vozinha's Algorithmic Consecration and the Multilingual Making of World Cup Visibility
- arxiv url: http://arxiv.org/abs/2606.19647v1
- Date: Wed, 17 Jun 2026 23:01:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-19 18:23:39.57584
- Title: From 50K to 8.2 Million in 24 Hours: Vozinha's Algorithmic Consecration and the Multilingual Making of World Cup Visibility
- Title(参考訳): 24時間で50万から820万に:Vozinhaのアルゴリズム会議とワールドカップの多言語化
- Authors: Vinicius Covas,
- Abstract要約: この研究はポルトガル語、スペイン語、英語、フランス語の多言語コーパスに貢献している。
我々は,「50k〜8M」と命名されたプラットフォーム従者数を言語的対象として扱う。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a multilingual computational discourse analysis of how language constructed the algorithmic consecration of Vozinha, the 40-year-old Cape Verde goalkeeper, after Spain 0-0 Cape Verde at the 2026 FIFA World Cup. The study contributes a multilingual corpus in Portuguese, Spanish, English, and French; a nine-frame narrative taxonomy with cue-based frame annotation; a reproducible annotation pipeline combining LLM-assisted suggestion with human validation; and an analysis of cross-lingual narrative diffusion across discourse phases. We treat the platform follower count itself, narrated as "50k to 8M", as a linguistic object: a circulating and narratable proof of visibility rather than a mere measurement. The follower-growth timeline is used only as contextual metadata: we reconstruct a conservative phase structure, not a continuous API-native series, and type every datapoint by value class, confidence, and evidence type. The only exact primary scraper anchor is 8,235,652 followers at 2026-06-16 15:47 UTC; all other figures are reported as estimated ranges or thresholds, including an estimated pre-match baseline of 45k-56k. Findings suggest that distinct languages carried distinct frames: Portuguese mobilization, Spanish crisis, English nation-making, and a shared platform-metric spectacle through which peripheral athletic performance became globally visible. As a v0.1 pilot, the paper releases the corpus schema, frame taxonomy, annotation guidelines, hashed visual-evidence log, and typed timeline, while flagging full double annotation and inter-annotator agreement as planned work.
- Abstract(参考訳): 2026 FIFAワールドカップにおいて,40歳のカーボベルデゴールキーパーであるVozinhaが,スペインで0-0のカーボベルデに次いで,どのように言語がアルゴリズム的に祝福されたかの多言語計算談話分析を行った。
この研究は、ポルトガル語、スペイン語、英語、フランス語の多言語コーパス、Cueベースのフレームアノテーションを用いた9フレームの物語分類、LLMの支援された提案と人間の検証を組み合わせた再現可能なアノテーションパイプライン、談話フェーズ間のクロスランガルな物語拡散の分析に寄与している。
我々は,「50k〜8M」と命名されたプラットフォーム追従者数自体を言語的対象として扱う。
私たちは、継続的APIネイティブシリーズではなく、保守的なフェーズ構造を再構築し、すべてのデータポイントをバリュークラス、信頼性、エビデンスタイプでタイプします。
唯一の正確な一次スクレーカーアンカーは、2026-06-16 15:47 UTCで8,235,652人のフォロワーである。
ポルトガルの動員、スペイン危機、イングランドの国産化、そして周囲の運動性能が世界中で見られるようになった共通のプラットフォーム・メトリック・スペクタクルなどである。
v0.1パイロットとして、コーパススキーマ、フレーム分類、アノテーションガイドライン、ハッシュされたビジュアル・エビデンスログ、型付きタイムラインをリリースした。
関連論文リスト
- Benchmarking Speech-to-Speech Translation Models [55.00303727199927]
音声音声翻訳(S2ST)は急速に進歩しているが、オフライン評価には統一されたプロトコルが欠けている。
8次元にわたる46のメトリクスを統合するベンチマークフレームワークを導入する。
FLEURSとCVSSから1,248のモデル言語構成でデプロイする。
論文 参考訳(メタデータ) (2026-06-02T07:01:33Z) - Uncovering Temporal Framing in the News [35.01659778607836]
我々は時間的フレーミングについて検討し、時系列を報告するよりも、意味を構造化するために時間的関連言語を説得的に用いていると定義した。
結果として得られたデータセットには、458の英語とドイツ語のニュース記事が含まれており、2K以上の時間枠の文がある。
フレームの有病率,共起パターン,語彙的手がかりを分析し,教師付き微調整とゼロショット分類を用いた時間的フレーミング検出の評価を行った。
論文 参考訳(メタデータ) (2026-05-29T19:26:13Z) - An Empirical Recipe for Universal Phone Recognition [63.45609714127985]
音声認識(PR)は、多言語および低リソースの音声処理タスクの鍵となる機能である。
我々は、大規模多言語データに基づいて訓練されたPhonticXEUSを提案する。
多言語(17.7%PFER)とアクセント付き英語(10.6%PFER)の両方で最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2026-03-30T22:12:48Z) - Simultaneous Speech-to-Speech Translation Without Aligned Data [52.467808474293605]
同時音声翻訳では、ソース音声を対象言語にリアルタイムで翻訳する必要がある。
単語レベルのアライメントを完全に不要にするヒビキゼロを提案する。
Hibiki-Zeroは5つのX-英語タスクの翻訳精度、レイテンシ、音声転送、自然性において最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2026-02-11T17:41:01Z) - Advancing Topic Segmentation of Broadcasted Speech with Multilingual Semantic Embeddings [2.615008111842321]
セマンティック音声エンコーダを用いたトピックセグメンテーションのためのエンドツーエンドスキームを提案する。
そこで本研究では,1000時間の公開録音を特徴とするデータセットを用いて,音声ニューストピックセグメンテーションのための新しいベンチマークを提案する。
この結果から,従来のパイプライン方式では英語のP_k$スコアが0.2431であるのに対して,エンドツーエンドモデルは競争力のあるP_k$スコアが0.2564であることがわかった。
論文 参考訳(メタデータ) (2024-09-10T05:24:36Z) - Pretraining Approaches for Spoken Language Recognition: TalTech
Submission to the OLR 2021 Challenge [0.0]
この論文は、東洋言語認識2021チャレンジへの提案に基づいています。
制約トラックに対しては,まず,多言語自動音声認識のためのコンバータベースのエンコーダデコーダモデルを訓練した。
制約のないタスクでは、外部で利用可能な事前訓練されたモデルと外部データの両方を頼りにしました。
論文 参考訳(メタデータ) (2022-05-14T15:17:08Z) - Lahjoita puhetta -- a large-scale corpus of spoken Finnish with some
benchmarks [9.160401226886947]
ドナート・スピーチ・キャンペーンはフィンランドの通常の口頭で約3600時間のスピーチを収集することに成功している。
収集の主な目的は、フィンランド語を自発的に研究するための代表的かつ大規模な資源を作成し、言語技術と音声ベースのサービスの開発を加速することであった。
収集プロセスと収集コーパスを示し,その汎用性を複数のユースケースで示す。
論文 参考訳(メタデータ) (2022-03-24T07:50:25Z) - Models and Datasets for Cross-Lingual Summarisation [78.56238251185214]
対象言語における多文要約に関連付けられたソース言語において,長い文書を含む言語間要約コーパスを提案する。
コーパスは、チェコ語、英語、フランス語、ドイツ語の4つの言語について、12の言語対と指示をカバーしている。
言語対応のウィキペディアのタイトルから、主節と記事の本体を組み合わせることで、ウィキペディアから言語横断的な文書要約インスタンスを導出する。
論文 参考訳(メタデータ) (2022-02-19T11:55:40Z) - A Massively Multilingual Analysis of Cross-linguality in Shared
Embedding Space [61.18554842370824]
言語間モデルでは、多くの異なる言語に対する表現は同じ空間に存在している。
我々は,bitext検索性能の形式で,言語間アライメントのタスクベース尺度を計算した。
我々はこれらのアライメント指標の潜在的な予測因子として言語的、準言語的、および訓練関連の特徴について検討する。
論文 参考訳(メタデータ) (2021-09-13T21:05:37Z) - Direct speech-to-speech translation with discrete units [64.19830539866072]
本稿では、中間テキスト生成に頼ることなく、ある言語から別の言語に音声を変換する直接音声音声翻訳(S2ST)モデルを提案する。
そこで本稿では,ラベルなし音声コーパスから学習した自己教師付き離散表現の予測を提案する。
対象のテキスト書き起こしが利用可能となると、同一の推論パスで2つのモード出力(音声とテキスト)を同時に生成できる、共同音声認識とテキストトレーニングを備えたマルチタスク学習フレームワークを設計する。
論文 参考訳(メタデータ) (2021-07-12T17:40:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。