Fugu-MT 論文翻訳(概要): Please Make it Sound like Human: Encoder-Decoder vs. Decoder-Only Transformers for AI-to-Human Text Style Transfer

論文の概要: Please Make it Sound like Human: Encoder-Decoder vs. Decoder-Only Transformers for AI-to-Human Text Style Transfer

arxiv url: http://arxiv.org/abs/2604.11687v1
Date: Mon, 13 Apr 2026 16:30:15 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-14 20:13:16.685005
Title: Please Make it Sound like Human: Encoder-Decoder vs. Decoder-Only Transformers for AI-to-Human Text Style Transfer
Title（参考訳）: Encoder-Decoder vs. Decoder-Only Transformers for AI-to-Human Text Style Transfer
Authors: Utsav Paneru,
Abstract要約: 我々は25,140対のAI入力とヒューマン参照テキストチャンクの並列コーパスを構築した。我々は2つのレジスタを分離する11の計測可能なスタイリスティックマーカーを同定する。我々は,Mistral-7Bのマーカーシフトスコアが高いことは,精度よりもオーバーシュートを反映していることを示す。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: AI-generated text has become common in academic and professional writing, prompting research into detection methods. Less studied is the reverse: systematically rewriting AI-generated prose to read as genuinely human-authored. We build a parallel corpus of 25,140 paired AI-input and human-reference text chunks, identify 11 measurable stylistic markers separating the two registers, and fine-tune three models: BART-base, BART-large, and Mistral-7B-Instruct with QLoRA. BART-large achieves the highest reference similarity -- BERTScore F1 of 0.924, ROUGE-L of 0.566, and chrF++ of 55.92 -- with 17x fewer parameters than Mistral-7B. We show that Mistral-7B's higher marker shift score reflects overshoot rather than accuracy, and argue that shift accuracy is a meaningful blind spot in current style transfer evaluation.
Abstract（参考訳）: AI生成されたテキストは、学術的および専門的な執筆において一般的になり、検出方法の研究を促している。 AI生成した散文を体系的に書き直して、真に人間が書いたものと解釈する。我々は25,140対のAI入力テキストチャンクとヒューマン参照テキストチャンクの並列コーパスを構築し、2つのレジスタを分離した11の計測可能なスタイリスティックマーカーを特定し、QLoRAでBARTベース、BART-large、Mistral-7B-Instructの3つのモデルを微調整する。 BERTScore F1は0.924、ROUGE-Lは0.566、chrF++は55.92、パラメータはMistral-7Bの17倍である。 Mistral-7Bのより高いマーカーシフトスコアは、精度よりもオーバーシュートを反映していることを示し、シフト精度が現在のスタイル転送評価において有意義な盲点であることを論じる。

関連論文リスト

Readers Prefer Outputs of AI Trained on Copyrighted Books over Expert Human Writers [8.031052360107092]
著者のスタイルをエミュレートしながら、フロンティアAIモデルが高品質な文学テキストを生成できるかどうかは不明だ。 MFAの訓練を受けたエキスパートライターと、ChatGPT、Claude、Geminiの3つのフロンティアAIモデルを比較する。
論文参考訳（メタデータ） (2025-10-15T17:51:58Z)
EditLens: Quantifying the Extent of AI Editing in Text [23.457378805409714]
AIで編集されたテキストは、人間が書いたテキストやAIで生成したテキストと区別可能であることを示す。テキスト内に存在するAI編集量を予測する回帰モデルをトレーニングする。 AIによって編集されたテキストが検出できるだけでなく、AIによる人間の文章への変化の度合いも検出できることを示す。
論文参考訳（メタデータ） (2025-10-03T16:27:48Z)
How Well Do LLMs Imitate Human Writing Style? [2.3754840025365183]
大規模言語モデル(LLM)は、流動的なテキストを生成することができるが、特定の人間の作者の独特のスタイルを再現する能力は、まだ不明である。著者の検証とスタイルの模倣分析のための,高速かつトレーニング不要なフレームワークを提案する。学術エッセイでは97.5%、クロスドメイン評価では94.5%の精度を達成している。
論文参考訳（メタデータ） (2025-09-29T15:34:40Z)
LLM Encoder vs. Decoder: Robust Detection of Chinese AI-Generated Text with LoRA [4.104443734934105]
我々は、エンコーダベースのトランスフォーマー(中国のBERTラージとRoBERTa-wwm-ext-large)、デコーダのみのLCM(アリババのQwen2.5-7B/Deep-R1-Distill-Qwen-7B)、およびFastTextベースラインを比較した。実験により、エンコーダモデルはトレーニングデータをほとんど記憶しているが、分散シフト時に顕著な性能劣化を被っていることが明らかになった。
論文参考訳（メタデータ） (2025-08-31T07:51:22Z)
AuthorMist: Evading AI Text Detectors with Reinforcement Learning [4.806579822134391]
AuthorMistは、AI生成したテキストを人間ライクな文章に変換する、新しい強化学習ベースのシステムだ。 AuthorMistは,本来の意味を保ちながら,AI生成テキストの検出性を効果的に低減することを示す。
論文参考訳（メタデータ） (2025-03-10T12:41:05Z)
Group-Adaptive Threshold Optimization for Robust AI-Generated Text Detection [58.419940585826744]
本稿では,確率的AIテキスト検出のためのグループ固有しきい値最適化アルゴリズムであるFairOPTを紹介する。属性(例えば、テキストの長さと書き込みスタイル)に基づいてデータをサブグループに分割し、FairOPTを実装して、各グループに対する決定しきい値の学習を行い、不一致を低減しました。我々のフレームワークは、後処理によるAI生成コンテンツ検出において、より堅牢な分類の道を開く。
論文参考訳（メタデータ） (2025-02-06T21:58:48Z)
RADAR: Robust AI-Text Detection via Adversarial Learning [69.5883095262619]
RADARはパラフラザーと検出器の対向訓練に基づいている。パラフレーズの目標は、AIテキスト検出を避けるために現実的なコンテンツを生成することである。 RADARは検出器からのフィードバックを使ってパラフラザーを更新する。
論文参考訳（メタデータ） (2023-07-07T21:13:27Z)
Paraphrasing evades detectors of AI-generated text, but retrieval is an effective defense [56.077252790310176]
本稿では,パラフレーズ生成モデル(DIPPER)を提案する。 DIPPERを使って3つの大きな言語モデル(GPT3.5-davinci-003)で生成されたテキストを言い換えると、透かしを含むいくつかの検出器を回避できた。我々は,言語モデルAPIプロバイダによって維持されなければならない,意味論的に類似した世代を検索するシンプルなディフェンスを導入する。
論文参考訳（メタデータ） (2023-03-23T16:29:27Z)
BARTScore: Evaluating Generated Text as Text Generation [89.50052670307434]
我々は、事前学習されたシーケンス・ツー・シーケンスモデルを用いてモデル化されたテキスト生成問題として、生成されたテキストの評価を概念化する。我々は、エンコーダ-デコーダベースの事前学習モデルであるBARTを用いて、このアイデアを運用する。本稿では,様々な視点からテキストの評価に柔軟に適用可能な,数多くの変種を持つメトリクスBARTScoreを提案する。
論文参考訳（メタデータ） (2021-06-22T03:20:53Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。