Fugu-MT 論文翻訳(概要): Generative Models are Unsupervised Predictors of Page Quality: A Colossal-Scale Study

論文の概要: Generative Models are Unsupervised Predictors of Page Quality: A Colossal-Scale Study

arxiv url: http://arxiv.org/abs/2008.13533v1
Date: Mon, 17 Aug 2020 07:13:24 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-28 02:50:38.845622
Title: Generative Models are Unsupervised Predictors of Page Quality: A Colossal-Scale Study
Title（参考訳）: 生成モデルはページ品質の教師なし予測因子である:コロッサルスケールによる研究
Authors: Dara Bahri, Yi Tay, Che Zheng, Donald Metzler, Cliff Brunk, Andrew Tomkins
Abstract要約: GPT-2のような大規模な生成言語モデルは、テキストを生成する能力で有名である。ページ品質」の教師なし予測器が出現し、トレーニングなしで品質の低いコンテンツを検出することができることを示す。われわれは5億件以上のウェブ記事の質的、定量的な分析を行い、このトピックについて史上最大規模の研究を行った。
参考スコア（独自算出の注目度）: 86.62171568318716
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Large generative language models such as GPT-2 are well-known for their ability to generate text as well as their utility in supervised downstream tasks via fine-tuning. Our work is twofold: firstly we demonstrate via human evaluation that classifiers trained to discriminate between human and machine-generated text emerge as unsupervised predictors of "page quality", able to detect low quality content without any training. This enables fast bootstrapping of quality indicators in a low-resource setting. Secondly, curious to understand the prevalence and nature of low quality pages in the wild, we conduct extensive qualitative and quantitative analysis over 500 million web articles, making this the largest-scale study ever conducted on the topic.
Abstract（参考訳）: gpt-2のような大規模な生成言語モデルは、テキストを生成する能力や、微調整によるダウンストリームタスクの監督機能で有名である。まず、人間と機械が生成するテキストを区別するために訓練された分類器が、教師なしの「ページ品質」予測器として出現し、トレーニングなしで品質の低いコンテンツを検出できることを示す。これにより、低リソース環境における品質指標の高速ブートストラップが可能になる。第2に,野生における低品質ページの発生状況と本質を理解することに興味のある我々は,5億以上のweb記事に対して広範囲な質的,定量的な分析を行い,この話題に関する最大の研究となった。

関連論文リスト

Cropping outperforms dropout as an augmentation strategy for training self-supervised text embeddings [10.915424073774744]
我々は、テキスト埋め込みの対照的な学習において、正ペア生成において最もよく知られた2つの拡張戦略を比較した。ドメイン外のデータでは、結果として得られる埋め込みの質は、教師付きSOTAモデルより低いが、ドメイン内データでは、自己監督型微調整が高品質なテキスト埋め込みを生成する。
論文参考訳（メタデータ） (2025-08-05T13:54:01Z)
Large Language Models in the Task of Automatic Validation of Text Classifier Predictions [55.2480439325792]
テキスト分類のための機械学習モデルは、与えられたテキストのクラスを予測するために訓練される。これを行うには、トレーニングと検証のサンプルを用意し、各テキストにクラスを割り当てる必要がある。人間のアノテーションは通常、特定の分類タスクによって異なる専門レベルを持つ人間のアノテーションによって割り当てられる。本稿では,人間のアノテータを大規模言語モデルに置き換えるためのいくつかのアプローチを提案する。
論文参考訳（メタデータ） (2025-05-24T13:19:03Z)
AGHI-QA: A Subjective-Aligned Dataset and Metric for AI-Generated Human Images [58.87047247313503]
本稿では,人体画像の品質評価のための大規模ベンチマークAGHI-QAを紹介する。データセットは、400の慎重に作成されたテキストプロンプトから生成される4,000の画像で構成され、10の最先端のT2Iモデルを使用している。我々は,視覚的品質スコア,テキスト画像対応スコア,可視および歪んだ身体部分ラベルを含む多次元アノテーションの収集のために,体系的な主観的研究を行う。
論文参考訳（メタデータ） (2025-04-30T04:36:56Z)
Human-Activity AGV Quality Assessment: A Benchmark Dataset and an Objective Evaluation Metric [56.73624246192218]
我々は人間活動型AI生成ビデオ(AGV)の先駆的な研究を行っている。視覚的品質評価と意味歪みの同定に焦点をあてる。我々は,人間活動AGVの質を自動解析するために,AI生成人活動ビデオ品質指標(GHVQ)という客観的評価指標を開発した。
論文参考訳（メタデータ） (2024-11-25T17:58:43Z)
Are AI Detectors Good Enough? A Survey on Quality of Datasets With Machine-Generated Texts [0.0]
AIフラグメントを備えた膨大な数の検出器とコレクションが出現し、いくつかの検出方法は認識品質を99.9%まで向上させた。検出器は実際に非常に信頼性が高いのか、あるいは評価データセットの質が低いことから高いベンチマークスコアを得るのか? 本稿では,AI生成コンテンツ検出専用のコンペからのデータセットを体系的にレビューし,AI生成フラグメントを含むデータセットの品質を評価する手法を提案する。
論文参考訳（メタデータ） (2024-10-18T17:59:57Z)
Balancing Label Quantity and Quality for Scalable Elicitation [2.2143065226946423]
本研究では,NLP分類タスクにおける量品質トレードオフのミクロ経済性について検討する。教師付き微調整を用いた事前学習モデルから分類知識を抽出する3つの方法について検討した。固定ラベル付予算において,教師付き微調整の精度を最大5ポイント向上できることがわかった。
論文参考訳（メタデータ） (2024-10-17T04:39:58Z)
Exploring Rich Subjective Quality Information for Image Quality Assessment in the Wild [66.40314964321557]
我々は,リッチIQAという新しいIQA手法を提案し,MOSを超えるリッチな主観的評価情報を探索し,野生における画像品質を予測する。コンボリューショナル・ビジョン・トランスフォーマー(CvT)の強力な特徴表現能力を活用し、人間の脳の短期記憶機構と長期記憶機構を模倣する3段階画像品質予測ネットワークである。 RichIQAは、リッチな主観的評価ラベルを持つ複数の大規模IQAデータベースにおいて、最先端の競合より優れている。
論文参考訳（メタデータ） (2024-09-09T12:00:17Z)
Exploring Precision and Recall to assess the quality and diversity of LLMs [82.21278402856079]
我々はtextscLlama-2 や textscMistral のような大規模言語モデル (LLM) のための新しい評価フレームワークを提案する。このアプローチにより、コーパスの整合を必要とせず、生成したテキストの品質と多様性を微妙に評価できる。
論文参考訳（メタデータ） (2024-02-16T13:53:26Z)
QuRating: Selecting High-Quality Data for Training Language Models [64.83332850645074]
データ品質に関する人間の直感をキャプチャできる事前学習データを選択するQuRatingを導入する。本稿では,書体,専門知識,事実とトリビア,教育的価値の4つの特性について検討する。ペアの判断からスカラー評価を学習するためにQurモデルをトレーニングし、それを4つの基準ごとに品質評価付き260Bのトレーニングコーパスにアノテートするために使用します。
論文参考訳（メタデータ） (2024-02-15T06:36:07Z)
Language Model as an Annotator: Unsupervised Context-aware Quality Phrase Generation [20.195149109523314]
LMPhraseは,大規模な事前学習言語モデル(LM)上に構築された,教師なしの高品質なフレーズマイニングフレームワークである。具体的には,事前学習された言語モデルBERT上で,パラメータフリーな探索手法であるPerturbed Maskingを用いて,まず品質フレーズを銀ラベルとして抽出する。一般的な統計ベースや遠方で管理される手法とは対照的に、我々の銀ラベルは、大規模な事前学習言語モデルから派生したもので、LMに含まれる豊富な文脈情報を考慮に入れている。
論文参考訳（メタデータ） (2023-12-28T20:32:44Z)
NaturalSpeech: End-to-End Text to Speech Synthesis with Human-Level Quality [123.97136358092585]
我々は、ベンチマークデータセット上で人間レベルの品質を実現するNaturalSpeechと呼ばれるTSシステムを開発した。具体的には、波形生成のための変分オートエンコーダ(VAE)を利用する。 LJSpeechデータセットを用いた実験により,提案したNaturalSpeechは文レベルでの人間の記録に対して-0.01CMOSを達成した。
論文参考訳（メタデータ） (2022-05-09T16:57:35Z)
Sentence Level Human Translation Quality Estimation with Attention-based Neural Networks [0.30458514384586394]
本稿では,人間の翻訳品質の自動推定にDeep Learning法を用いる方法について検討する。大規模な人間の注釈付きデータセットの実証結果は、ニューラルモデルが特徴に基づく手法を大幅に上回っていることを示している。
論文参考訳（メタデータ） (2020-03-13T16:57:55Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。