論文の概要: RSA-Control: A Pragmatics-Grounded Lightweight Controllable Text Generation Framework
- arxiv url: http://arxiv.org/abs/2410.19109v1
- Date: Thu, 24 Oct 2024 19:21:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-28 13:38:00.605009
- Title: RSA-Control: A Pragmatics-Grounded Lightweight Controllable Text Generation Framework
- Title(参考訳): RSA-Control: 実用的な軽量制御可能なテキスト生成フレームワーク
- Authors: Yifan Wang, Vera Demberg,
- Abstract要約: RSA-Controlは、実用的なテキスト生成フレームワークである。
本稿では,文脈に基づく制御強度の自動調整を可能にする自己調整可能な合理性パラメータを提案する。
2種類のタスクタイプと2種類の言語モデルを用いて実験を行った結果,RSA-Controlは言語流速とコンテントの整合性を維持しつつ,強い属性制御を実現することが示された。
- 参考スコア(独自算出の注目度): 20.32863137027766
- License:
- Abstract: Despite significant advancements in natural language generation, controlling language models to produce texts with desired attributes remains a formidable challenge. In this work, we introduce RSA-Control, a training-free controllable text generation framework grounded in pragmatics. RSA-Control directs the generation process by recursively reasoning between imaginary speakers and listeners, enhancing the likelihood that target attributes are correctly interpreted by listeners amidst distractors. Additionally, we introduce a self-adjustable rationality parameter, which allows for automatic adjustment of control strength based on context. Our experiments, conducted with two task types and two types of language models, demonstrate that RSA-Control achieves strong attribute control while maintaining language fluency and content consistency. Our code is available at https://github.com/Ewanwong/RSA-Control.
- Abstract(参考訳): 自然言語生成の大幅な進歩にもかかわらず、望ましい属性を持つテキストを生成するための言語モデルを制御することは、依然として深刻な課題である。
そこで本研究では,実用性に基づく学習自由制御可能なテキスト生成フレームワークであるRSA-Controlについて紹介する。
RSA-Controlは、虚構話者とリスナーを再帰的に推論することで生成プロセスを指示し、イントラクタ内のリスナーによってターゲット属性が正しく解釈される可能性を高める。
さらに、文脈に基づく制御強度の自動調整を可能にする自己調整可能な有理性パラメータを導入する。
2種類のタスクタイプと2種類の言語モデルを用いて実験を行った結果,RSA-Controlは言語流速とコンテントの整合性を維持しつつ,強い属性制御を実現することが示された。
私たちのコードはhttps://github.com/Ewanwong/RSA-Control.comで利用可能です。
関連論文リスト
- ControlSpeech: Towards Simultaneous Zero-shot Speaker Cloning and Zero-shot Language Style Control With Decoupled Codec [50.273832905535485]
話者の声を完全に模倣し,任意の発話スタイルの制御と調整を可能にするTTSシステムであるControlSpeechを提案する。
以前のゼロショットTSモデルとコントロール可能なTSモデルは、さらなる制御と調整機能なしでスピーカーの声を模倣することしかできず、スピーカー固有の音声生成とは無関係であった。
論文 参考訳(メタデータ) (2024-06-03T11:15:16Z) - Successor Features for Efficient Multisubject Controlled Text Generation [48.37713738712319]
本稿では,後継機能 (SF) と言語モデル修正の2つの基本概念を基礎とするSF-GENを紹介する。
SF-GENはこの2つをシームレスに統合し、LCMのパラメータを変更することなくテキスト生成の動的ステアリングを可能にする。
我々の知る限り、本研究はテキスト生成における後継機能の最初の応用である。
論文 参考訳(メタデータ) (2023-11-03T00:17:08Z) - Controlled Text Generation with Hidden Representation Transformations [12.576140288264835]
CHRTは、特定の属性(毒性など)に関連するテキストを生成するために、大きな言語モデルを操縦する
コントラスト学習フレームワークを使ってこれらの変換を学習し、それを組み合わせてマルチ属性制御を実現します。
CHRTは、解毒、ポジティブな感情のステアリング、テキストの単純化といったタスクにおいて、すべてのベースラインを上回ります。
論文 参考訳(メタデータ) (2023-05-30T17:21:17Z) - UniControl: A Unified Diffusion Model for Controllable Visual Generation
In the Wild [166.25327094261038]
制御可能なコンディション・トゥ・イメージ(C2I)タスクのための新しい生成基盤モデルUniControlを紹介する。
UniControlは、任意の言語プロンプトを許容しながら、特定のフレームワーク内で幅広いC2Iタスクを統合する。
9つのユニークなC2Iタスクで訓練されたUniControlは、印象的なゼロショット生成能力を誇示している。
論文 参考訳(メタデータ) (2023-05-18T17:41:34Z) - Critic-Guided Decoding for Controlled Text Generation [26.74490141567982]
制御言語生成のための新しい批判復号法(CriticControl)を提案する。
具体的には,不特定報酬モデルからLMステアリング評論家を訓練するためにアクタ批判的枠組みを採用する。
提案手法は,言語モデルを凍結し,評論家と呼ばれる出力トークン分布を制御し,学習効率と安定性を向上させる。
論文 参考訳(メタデータ) (2022-12-21T11:25:41Z) - Bridging the Gap Between Training and Inference of Bayesian Controllable
Language Models [58.990214815032495]
大規模事前学習型言語モデルは、自然言語生成タスクにおいて大きな成功を収めている。
BCLMは制御可能な言語生成において効率的であることが示されている。
本稿では,ミスマッチ問題を少ない計算コストで軽減する制御可能な言語生成のための"Gemini Discriminator"を提案する。
論文 参考訳(メタデータ) (2022-06-11T12:52:32Z) - Controllable Natural Language Generation with Contrastive Prefixes [120.12778570283956]
GPT2生成は、自然言語生成を操るために、プレフィックスと呼ばれる小さな属性固有のベクトルのセットを利用する。
単一アスペクト制御のための接頭辞を訓練するための新しい教師なし手法と教師なし手法を提案する。
単一アスペクト制御と多アスペクト制御の両方の実験結果から,提案手法は高い言語的品質を維持しつつ,所望の属性に向かって生成を導くことができることがわかった。
論文 参考訳(メタデータ) (2022-02-27T00:31:03Z) - On-the-Fly Controlled Text Generation with Experts and Anti-Experts [70.41630506059113]
本稿では,DExperts: Decoding-time Expertsを提案する。
私たちのアンサンブルの下では、出力トークンは専門家によって可能性が高く、おそらく反専門家によってのみ高い確率を得ます。
論文 参考訳(メタデータ) (2021-05-07T01:19:38Z) - Plug-and-Blend: A Framework for Controllable Story Generation with
Blended Control Codes [11.053902512072813]
制御可能な言語生成フレームワークPlug-and-Blendについて述べる。
自動ストーリ生成のコンテキストでは、人間のユーザがトピックやそれらの間の遷移をきめ細やかに制御することができる。
人間の参加者による評価は、生成されたストーリーが2つのトピックの間で観測可能に遷移していることを示している。
論文 参考訳(メタデータ) (2021-03-23T03:15:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。