論文の概要: Casual as an Anchor: Resolving Supervision Misalignment in Formality Transfer Dataset
- arxiv url: http://arxiv.org/abs/2605.29365v3
- Date: Mon, 01 Jun 2026 06:06:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 18:24:16.731566
- Title: Casual as an Anchor: Resolving Supervision Misalignment in Formality Transfer Dataset
- Title(参考訳): アンカーとしてのカジュアル:形式的伝達データセットにおけるスーパービジョンミスの解消
- Authors: Hyojeong Yu, Hyukhun Koh, Minsung Kim, Kyomin Jung,
- Abstract要約: 形式的転送は、通常、形式的レジスタと形式的レジスタの間の対称的な双方向タスクとしてフレーム化される。
このフレーミングは、GYAFCのような既存のベンチマークにおいて、監督設計上の欠陥を隠蔽していると論じる。
人間の整合性の定義の下で、ベンチマーク形式ラベルを再評価することで、このミスアライメントを定量化する。
- 参考スコア(独自算出の注目度): 22.0608497133374
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Formality transfer is commonly framed as a symmetric bidirectional task between informal and formal registers. We argue that this framing conceals a supervision design flaw in existing benchmarks such as GYAFC: binary human rewrites encode relative stylistic shifts rather than absolute human notions of formality. Consequently, models learn to generate pseudo-formal outputs that satisfy benchmark labels while failing to produce genuinely formal language. We quantify this misalignment by re-evaluating benchmark formal labels under a human-aligned definition of formality, revealing substantial discrepancies that propagate to consistent informal-to-formal failures across model families. To address this issue, we reconceptualize formality transfer as a graded dimension rather than a binary attribute. We introduce a three-level spectrum: informal, casual, and formal, where casual serves as an explicit intermediate state that clarifies supervision signals. Based on this framework, we introduce 3LF, a dataset providing parallel supervision across all three levels. Training on 3LF substantially reduces informal-to-formal failures and improves alignment with human perception. For example, GPT-4.1-nano improves from 0.06 to 0.88 F1 in the informal-to-formal direction despite 3LF being significantly smaller than GYAFC. We further demonstrate that these gains cannot be reproduced through in-context learning alone and provide qualitative analyses of ambiguity-driven errors and meaning distortions. Overall, our findings demonstrate how supervision design shapes stylistic alignment and highlight the importance of alignment-aware benchmark construction in controllable text generation.
- Abstract(参考訳): 形式的転送は、通常、形式的レジスタと形式的レジスタの間の対称的な双方向タスクとしてフレーム化される。
我々は、このフレーミングは、GYAFCのような既存のベンチマークにおける監督設計上の欠陥を隠蔽していると論じている。
その結果、モデルはベンチマークラベルを満たす擬似形式出力を生成することを学び、真に形式的な言語を生成できない。
モデルファミリ間の一貫した非公式な形式的障害に伝播する相当な相違点を, 人為的整合性の定義の下で, ベンチマークの形式的ラベルを再評価することによって, この不一致を定量化する。
この問題に対処するため、形式的移動を二項属性ではなく次数次元として再認識する。
我々は,カジュアル,カジュアル,フォーマルの3段階のスペクトルを導入し,カジュアルは監視信号を明確にする明示的な中間状態として機能する。
このフレームワークをベースとして,3つのレベルを並行して監視するデータセットである3LFを導入する。
3LFのトレーニングは、非公式から形式的障害を大幅に減らし、人間の知覚との整合性を改善する。
例えば、GPT-4.1-nanoは、3LFはGYAFCよりもかなり小さいにもかかわらず、非公式に形式的に0.06から0.88F1に改善されている。
さらに、文脈内学習だけではこれらの利得を再現できないことを示し、あいまいさ駆動の誤りと歪みの意味の質的分析を提供する。
本研究は, 制御可能なテキスト生成におけるアライメント・アライメントとアライメント・アウェア・ベンチマーク構築の重要性を明らかにするものである。
関連論文リスト
- Beyond Distribution Estimation: Simplex Anchored Structural Inference Towards Universal Semi-Supervised Learning [47.92504362652887]
半教師付き学習は、ラベル付きデータが不足し、ラベルなしデータが未知の任意の分布に従う現実的なシナリオにおいて重大な課題に直面している。
我々は、Universal Semi-supervised Learning (UniSSL)として、批判的ながら未探索のパラダイムを定式化する。
本稿では,信頼度の高い擬似ラベルを優先するための分布非依存指標に基づく重み付け戦略と,誤用する可能性のある擬似ラベルを分離するための補助分岐を導入する。
論文 参考訳(メタデータ) (2026-05-08T10:33:09Z) - Surface Sensitivity in Lean 4 Autoformalization [1.7855077077275565]
観察されたパラフレーズの感度は,形式化が成功する間に意味的差異が生じるのではなく,コンパイル境界の障害を反映していることがわかった。
この結果から,今後のトレーニング時間の介入はセマンティック層ではなく,コンパイル境界を目標とすべきであることが示唆された。
論文 参考訳(メタデータ) (2026-04-25T04:26:19Z) - Character as a Latent Variable in Large Language Models: A Mechanistic Account of Emergent Misalignment and Conditional Safety Failures [70.48661957773449]
創発的ミスアライメント(英: Emergent Misalignment)とは、狭い範囲のデータに対する微調整された大きな言語モデルによって、広範囲に不整合な振る舞いが引き起こされる障害モードを指す。
複数のドメインやモデルファミリにまたがって、特定の文字レベルの配置を示すデータの微調整モデルは、誤操作よりもはるかに強く、転送可能な微調整を誘導する。
論文 参考訳(メタデータ) (2026-01-30T15:28:42Z) - Refinement Provenance Inference: Detecting LLM-Refined Training Prompts from Model Behavior [58.751981587234916]
本稿では,Refinement Provenance Inference (RPI)監査タスクをRefinement Provenance Inference (RPI)として定式化する。
本稿では,ロジットレベルの信号で教師が強制する可能性機能を融合させるロジットベースのフレームワークであるReProを提案する。
トレーニング中、ReProはシャドウファインチューニングを通じて転送可能な表現を学び、訓練データアクセスなしで、見えない犠牲者の証明を推測するために軽量のリニアヘッドを使用する。
論文 参考訳(メタデータ) (2026-01-05T10:16:41Z) - ReForm: Reflective Autoformalization with Prospective Bounded Sequence Optimization [73.0780809974414]
本稿では,意味的整合性評価を自己形式化プロセスに統合する反射的自己形式化手法を提案する。
これにより、モデルが形式的なステートメントを反復的に生成し、セマンティックな忠実さを評価し、自己修正された特定エラーを発生させることができる。
実験の結果、ReFormは最強のベースラインに対して平均22.6ポイントの改善を達成した。
論文 参考訳(メタデータ) (2025-10-28T16:22:54Z) - Conjecturing: An Overlooked Step in Formal Mathematical Reasoning [10.398167568549924]
結論を導かない限り、多くの数学的問題は直接形式化できない。
本研究では,大規模言語モデルの導出能力を測定するためにConjectureBenchを開発した。
提案手法は,GPT-4.1と7とDeepSeek-V3.1の13のPutnamBench問題において,最初のエンドツーエンドの自動形式化を実現する。
論文 参考訳(メタデータ) (2025-10-13T22:29:49Z) - StepFun-Formalizer: Unlocking the Autoformalization Potential of LLMs through Knowledge-Reasoning Fusion [30.51794514312176]
効果的な自己形式化のための2つの重要な能力を特定する。
我々は、両方の能力を改善するデータ合成およびトレーニングパイプラインであるThinkingFを紹介します。
結果の7Bと32Bモデルは、包括的な形式的知識と強い形式的・形式的推論の両方を示す。
論文 参考訳(メタデータ) (2025-08-06T13:28:22Z) - Semi-supervised Formality Style Transfer using Language Model
Discriminator and Mutual Information Maximization [52.867459839641526]
フォーマル・スタイル・トランスファー(英: Formality style transfer)とは、非公式な文を文法的に正しい形式文に変換するタスクである。
本稿では,言語モデルに基づく識別器を用いて,文が形式的である確率を最大化する半教師付き形式表現スタイル転送モデルを提案する。
実験の結果,我々のモデルは,自動計測と人的判断の両面で,従来の最先端のベースラインを著しく上回りました。
論文 参考訳(メタデータ) (2020-10-10T21:05:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。