論文の概要: Integrating Machine-Generated Short Descriptions into the Wikipedia Android App: A Pilot Deployment of Descartes
- arxiv url: http://arxiv.org/abs/2601.07631v1
- Date: Mon, 12 Jan 2026 15:13:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-13 19:08:01.485489
- Title: Integrating Machine-Generated Short Descriptions into the Wikipedia Android App: A Pilot Deployment of Descartes
- Title(参考訳): マシン生成した短い記述をWikipedia Androidアプリに統合する: Descartesのパイロットデプロイ
- Authors: Marija Šakota, Dmitry Brant, Cooltey Feng, Shay Nowick, Amal Ramadan, Robin Schoenbaechler, Joseph Seddon, Jazmin Tanner, Isaac Johnson, Robert West,
- Abstract要約: ウィキペディアのAndroidアプリにDescartesのパイロット展開の結果を示す。
実験には12の言語があり、3900以上の記事と375人の編集者が参加した。
全体では、デカルトによる記述の90%は、品質の5つのうち少なくとも3つと評価され、平均評価は人間によるものと比較された。
- 参考スコア(独自算出の注目度): 5.104306712623376
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Short descriptions are a key part of the Wikipedia user experience, but their coverage remains uneven across languages and topics. In previous work, we introduced Descartes, a multilingual model for generating short descriptions. In this report, we present the results of a pilot deployment of Descartes in the Wikipedia Android app, where editors were offered suggestions based on outputs from Descartes while editing short descriptions. The experiment spanned 12 languages, with over 3,900 articles and 375 editors participating. Overall, 90% of accepted Descartes descriptions were rated at least 3 out of 5 in quality, and their average ratings were comparable to human-written ones. Editors adopted machine suggestions both directly and with modifications, while the rate of reverts and reports remained low. The pilot also revealed practical considerations for deployment, including latency, language-specific gaps, and the need for safeguards around sensitive topics. These results indicate that Descartes's short descriptions can support editors in reducing content gaps, provided that technical, design, and community guardrails are in place.
- Abstract(参考訳): 短い説明はウィキペディアのユーザー体験の重要な部分だが、その内容は言語やトピックで不均一である。
前回の研究で、短い記述を生成するための多言語モデルであるDescartesを紹介した。
本報告では,Wikipedia Androidアプリにデカルトをパイロットで配置し,デカルトからのアウトプットに基づいた提案を行い,短い記述を編集した。
実験には12の言語があり、3900以上の記事と375人の編集者が参加した。
全体では、デカルトによる記述の90%は、品質の5つのうち少なくとも3つが評価され、平均評価は人間による記述に匹敵するものであった。
編集者は機械による提案を直接と修正の両方で採用したが、逆転率と報告率は低かった。
パイロットはまた、レイテンシ、言語固有のギャップ、センシティブなトピックに関する保護の必要性など、デプロイに関する実践的な考慮を明らかにした。
これらの結果は、デカルトの短い記述は、技術、設計、コミュニティガードレールが整備されていることを前提として、編集者がコンテンツギャップを減らすのをサポートすることを示唆している。
関連論文リスト
- Edit Distances and Their Applications to Downstream Tasks in Research and Commercial Contexts [7.629053304626553]
チュートリアルでは、研究や商業の文脈に適用される編集距離について記述している。
我々は,翻訳編集率 (TER), Levenshtein, Damerau-Levenshtein, Longest Common Subsequence and $n$-gram distances を用いて,テキスト列の比較における統計指標の脆弱さを示す。
論文 参考訳(メタデータ) (2024-10-08T10:21:22Z) - Edisum: Summarizing and Explaining Wikipedia Edits at Scale [9.968020416365757]
優れた編集要約を生成するために訓練された言語モデルにより生成された編集要約を推薦するモデルを提案する。
我々のモデルは人間の編集者と同等に機能する。
より広い範囲で、Web上で最大かつ最も目に見えるプロジェクトの1つを維持する上で、言語モデリング技術が人間をサポートする方法を紹介します。
論文 参考訳(メタデータ) (2024-04-04T13:15:28Z) - Assisting in Writing Wikipedia-like Articles From Scratch with Large Language Models [11.597314728459573]
我々は、大きな言語モデルを用いて、ウィキペディアのページに匹敵する幅と深さの長い記事をスクラッチから書く方法を研究した。
本稿では,検索と複数パースペクティブ質問応答によるトピックアウトライン生成のための記述システムSTORMを提案する。
論文 参考訳(メタデータ) (2024-02-22T01:20:17Z) - WikiDes: A Wikipedia-Based Dataset for Generating Short Descriptions
from Paragraphs [66.88232442007062]
ウィキデックスはウィキペディアの記事の短い記述を生成するデータセットである。
データセットは、6987のトピックに関する80万以上の英語サンプルで構成されている。
本論文は,ウィキペディアとウィキデータに多くの記述が欠落していることから,実際的な影響を示すものである。
論文 参考訳(メタデータ) (2022-09-27T01:28:02Z) - Descartes: Generating Short Descriptions of Wikipedia Articles [37.53434446908093]
ウィキペディアの記事の短い記述を自動的に生成する問題を紹介・解決する。
デカルト(Descartes)は、人間の編集者と同等に動作した記述を生成できるモデルである。
私たちの研究は、ウィキペディアの編集者が、900万以上の記事がまだ欠落している記事の短い説明を提供するのを助けるための、実践的な応用を直接持っています。
論文 参考訳(メタデータ) (2022-05-20T08:03:07Z) - Scarecrow: A Framework for Scrutinizing Machine Text [69.26985439191151]
我々はScarecrowと呼ばれる新しい構造化されたクラウドソースエラーアノテーションスキーマを導入する。
Scarecrowは1.3kの人文と機械が生成する英語ニューステキストの13kのアノテーションを収集する。
これらの結果は,現在および将来のテキスト生成システムの評価において,Scarecrowアノテーションの価値を示すものである。
論文 参考訳(メタデータ) (2021-07-02T22:37:03Z) - Hierarchical Bi-Directional Self-Attention Networks for Paper Review
Rating Recommendation [81.55533657694016]
本稿では,階層型双方向自己注意ネットワークフレームワーク(HabNet)を提案する。
具体的には、文エンコーダ(レベル1)、レビュー内エンコーダ(レベル2)、レビュー間エンコーダ(レベル3)の3つのレベルで、論文レビューの階層構造を利用する。
我々は、最終的な受理決定を行う上で有用な予測者を特定することができ、また、数値的なレビュー評価とレビュアーが伝えるテキストの感情の不整合を発見するのに役立てることができる。
論文 参考訳(メタデータ) (2020-11-02T08:07:50Z) - Curious Case of Language Generation Evaluation Metrics: A Cautionary
Tale [52.663117551150954]
イメージキャプションや機械翻訳などのタスクを評価するデファクトメトリクスとして、いくつかの一般的な指標が残っている。
これは、使いやすさが原因でもあり、また、研究者がそれらを見て解釈する方法を知りたがっているためでもある。
本稿では,モデルの自動評価方法について,コミュニティにより慎重に検討するよう促す。
論文 参考訳(メタデータ) (2020-10-26T13:57:20Z) - Automatic Discourse Segmentation: an evaluation in French [65.00134288222509]
本稿では, 部分分割法と, 部分分割品質の予備評価について述べる。
我々は,マーカーリストと統計POSラベリングという,複数の言語で同時に利用可能なリソースのみに基づく3つのモデルを開発した。
論文 参考訳(メタデータ) (2020-02-10T21:35:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。