Fugu-MT 論文翻訳(概要): Taming CATS: Controllable Automatic Text Simplification through Instruction Fine-Tuning with Control Tokens

論文の概要: Taming CATS: Controllable Automatic Text Simplification through Instruction Fine-Tuning with Control Tokens

arxiv url: http://arxiv.org/abs/2604.01779v1
Date: Thu, 02 Apr 2026 08:44:17 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-03 14:21:10.625026
Title: Taming CATS: Controllable Automatic Text Simplification through Instruction Fine-Tuning with Control Tokens
Title（参考訳）: タミングCATS:制御トークンによる命令ファインタニングによる制御可能な自動テキストの簡易化
Authors: Hanna Hubarava, Yingqiang Gao,
Abstract要約: 自動テキストの簡易化における制御性は、データと評価によって著しく制限される。本稿では,個別制御トークンを用いた命令微調整に基づくドメインに依存しないCATSフレームワークを提案する。標準の単純化と類似度指標は制御の計測に不十分であることを示す。
参考スコア（独自算出の注目度）: 2.4713807020542773
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Controllable Automatic Text Simplification (CATS) produces user-tailored outputs, yet controllability is often treated as a decoding problem and evaluated with metrics that are not reflective to the measure of control. We observe that controllability in ATS is significantly constrained by data and evaluation. To this end, we introduce a domain-agnostic CATS framework based on instruction fine-tuning with discrete control tokens, steering open-source models to target readability levels and compression rates. Across three model families with different model sizes (Llama, Mistral, Qwen; 1-14B) and four domains (medicine, public administration, news, encyclopedic text), we find that smaller models (1-3B) can be competitive, but reliable controllability strongly depends on whether the training data encodes sufficient variation in the target attribute. Readability control (FKGL, ARI, Dale-Chall) is learned consistently, whereas compression control underperforms due to limited signal variability in the existing corpora. We further show that standard simplification and similarity metrics are insufficient for measuring control, motivating error-based measures for target-output alignment. Finally, our sampling and stratification experiments demonstrate that naive splits can introduce distributional mismatch that undermines both training and evaluation.
Abstract（参考訳）: Controllable Automatic Text Simplification (CATS) はユーザがカスタマイズした出力を生成するが、制御性はしばしばデコード問題として扱われ、制御の尺度に反映しないメトリクスで評価される。 ATSの制御性はデータと評価によって著しく制約されている。そこで本研究では,個別制御トークンを用いた命令微調整に基づくドメインに依存しないCATSフレームワークを導入し,可読性レベルと圧縮速度を目標としたオープンソースモデルをステアリングする。モデルサイズが異なる3つのモデルファミリー(Llama, Mistral, Qwen, 1-14B)と4つのドメイン(医学、行政、ニュース、百科事典テキスト)で、より小さなモデル(1-3B)が競合する可能性があるが、信頼性の高い制御性は、トレーニングデータが目標属性の十分な変動を符号化するかどうかに大きく依存する。可読性制御 (FKGL, ARI, Dale-Chall) は一貫して学習されるが, 圧縮制御は既存のコーパスにおける信号変動の制限により性能が低下する。さらに、標準の単純化と類似度指標は、制御の計測に不十分であり、目標出力アライメントのためのエラーベースの測定を動機付けていることを示す。最後に, 標本化と成層化実験により, ナイーブスプリットは, トレーニングと評価の両方を損なう分布ミスマッチを生じさせることを示した。

関連論文リスト

Sparse Visual Thought Circuits in Vision-Language Models [2.5754366051855837]
我々はQwen3-VL-8Bにおける疎視的思考回路の局所化とテストを行う因果パイプラインを開発した。この層でSAEを訓練し、明示的な規則でタスク選択集合を構築し、精度とドリフトを定量化しながら推論時間スケーリングとアブレーションを行う。
論文参考訳（メタデータ） (2026-03-26T06:24:36Z)
FaithSteer-BENCH: A Deployment-Aligned Stress-Testing Benchmark for Inference-Time Steering [11.609466767597093]
FaithSteer-BENCHはストレステストベンチマークである。制御性, 実用性, 堅牢性の3つのゲートワイド基準により, 固定配置式運転点での操舵方法を評価する。ゲートワイズベンチマークの結果は、既存の手法がデプロイメント指向の実践的設定において信頼性の高い制御性を提供するとは限らないことを示している。
論文参考訳（メタデータ） (2026-03-18T22:28:36Z)
AMPS: Adaptive Modality Preference Steering via Functional Entropy [66.69992693275061]
本稿では,各モータリティの情報提供量を定量化し,ステアリングに対するサンプル固有の感受性を明らかにするインスタンス認識診断指標を提案する。実験結果から, インスタンス認識のステアリングは, 従来のステアリングよりもモダリティの嗜好の調整に優れていたことが示唆された。
論文参考訳（メタデータ） (2026-02-13T02:29:06Z)
Steering Language Models Before They Speak: Logit-Level Interventions [9.055997973281919]
制御可能な生成のためのトレーニング不要な推論時間ロジット介入を提案する。以上の結果から,ロジットステアリングは大きな,一貫した,マルチタスク制御のゲインを達成できることが示唆された。
論文参考訳（メタデータ） (2026-01-16T03:00:33Z)
Analysing Zero-Shot Readability-Controlled Sentence Simplification [54.09069745799918]
本研究では,異なる種類の文脈情報が,所望の可読性を持つ文を生成するモデルの能力に与える影響について検討する。結果から,全ての試験されたモデルは,原文の制限や特徴のため,文の簡略化に苦慮していることがわかった。実験では、RCTSに合わせたより良い自動評価指標の必要性も強調した。
論文参考訳（メタデータ） (2024-09-30T12:36:25Z)
A Study of Unsupervised Evaluation Metrics for Practical and Automatic Domain Adaptation [15.728090002818963]
教師なしドメイン適応(UDA)メソッドは、ラベルなしでターゲットドメインへのモデル転送を容易にする。本稿では,対象の検証ラベルにアクセスすることなく,移動モデルの品質を評価できる評価指標を見つけることを目的とする。
論文参考訳（メタデータ） (2023-08-01T05:01:05Z)
Bring Your Own Data! Self-Supervised Evaluation for Large Language Models [52.15056231665816]
大規模言語モデル(LLM)の自己教師型評価のためのフレームワークを提案する。閉書知識,毒性,長期文脈依存性を測定するための自己指導型評価戦略を実証する。自己監督評価と人監督評価との間には強い相関関係が認められた。
論文参考訳（メタデータ） (2023-06-23T17:59:09Z)
Controller-Guided Partial Label Consistency Regularization with Unlabeled Data [49.24911720809604]
本稿では,ラベルレベルと表現レベルの両方において,コントローラ誘導整合正則化を提案する。信頼度閾値を動的に調整し、整合正則化に参加する各クラスのサンプル数が大まかに等しいようにし、クラス不均衡の問題を緩和する。
論文参考訳（メタデータ） (2022-10-20T12:15:13Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。