Fugu-MT 論文翻訳(概要): Adaptable Logical Control for Large Language Models

論文の概要: Adaptable Logical Control for Large Language Models

arxiv url: http://arxiv.org/abs/2406.13892v1
Date: Wed, 19 Jun 2024 23:47:59 GMT
ステータス: 翻訳完了
システム内更新日: 2024-06-21 17:56:22.003578
Title: Adaptable Logical Control for Large Language Models
Title（参考訳）: 大規模言語モデルに対する適応論理制御
Authors: Honghua Zhang, Po-Nien Kung, Masahiro Yoshida, Guy Van den Broeck, Nanyun Peng,
Abstract要約: Ctrl-Gは、推論時にモデル生成のトラクタブルでフレキシブルな制御を容易にする適応可能なフレームワークである。 TULU2-7Bモデルに適用したCtrl-Gは、インタラクティブテキスト編集のタスクにおいて、GPT3.5とGPT4より優れていることを示す。
参考スコア（独自算出の注目度）: 68.27725600175013
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Despite the success of Large Language Models (LLMs) on various tasks following human instructions, controlling model generation at inference time poses a persistent challenge. In this paper, we introduce Ctrl-G, an adaptable framework that facilitates tractable and flexible control of LLM generation to reliably follow logical constraints. Ctrl-G combines any production-ready LLM with a Hidden Markov Model, enabling LLM outputs to adhere to logical constraints represented as deterministic finite automata. We show that Ctrl-G, when applied to a TULU2-7B model, outperforms GPT3.5 and GPT4 on the task of interactive text editing: specifically, for the task of generating text insertions/continuations following logical constraints, Ctrl-G achieves over 30% higher satisfaction rate in human evaluation compared to GPT4. When applied to medium-size language models (e.g., GPT2-large), Ctrl-G also beats its counterparts for constrained generation by large margins on standard benchmarks. Additionally, as a proof-of-concept study, we experiment Ctrl-G on the Grade School Math benchmark to assist LLM reasoning, foreshadowing the application of Ctrl-G, as well as other constrained generation approaches, beyond traditional language generation tasks.
Abstract（参考訳）: 大規模言語モデル(LLM)が人間の指示に従って様々なタスクで成功したにもかかわらず、推論時にモデル生成を制御することは永続的な課題である。本稿では,LLM生成のトラクタブルかつフレキシブルな制御を容易にし,論理的制約を確実に追従できるフレームワークであるCtrl-Gを紹介する。 Ctrl-G は任意の生産可能な LLM と隠れマルコフモデルを組み合わせることで、LCM の出力は決定論的有限オートマトンとして表される論理的制約に従うことができる。 TULU2-7Bモデルに適用されたCtrl-Gは、対話的テキスト編集作業においてGPT3.5とGPT4よりも優れており、特に、論理的制約に従ってテキスト挿入/継続を生成するタスクでは、GPT4よりも30%高い満足度を達成する。中規模の言語モデル(例: GPT2-large)に適用した場合、Ctrl-Gは標準ベンチマークで大きなマージンで制約付き生成に勝っている。さらに、概念実証研究として、Ctrl-Gベンチマークを用いてLLM推論を補助し、Ctrl-Gの適用を先導し、従来の言語生成タスクを超える制約付き生成アプローチを実験する。

関連論文リスト

Self-Steering Language Models [113.96916935955842]
DisCIPLは、"セルフステアリング(self-steering)"言語モデルのメソッドである。 DisCIPLはPlannerモデルを使用してタスク固有の推論プログラムを生成する。我々の研究は、高度に並列化されたモンテカルロ推論戦略の設計空間を開く。
論文参考訳（メタデータ） (2025-04-09T17:54:22Z)
Smaller But Better: Unifying Layout Generation with Smaller Large Language Models [33.18391143075568]
LGGPT(LGGPT)は、LLMベースの統一レイアウト生成用に設計されたモデルである。 ALIとULRは、過剰なトークンを強制する簡潔な構造を持っている。本稿では,LGGPTが既存手法に比べて優れた性能を示すことを示す。
論文参考訳（メタデータ） (2025-02-19T10:06:42Z)
A Systematic Approach for Assessing Large Language Models' Test Case Generation Capability [0.8287206589886879]
大規模言語モデル (LLM) を評価するために,制御フロー構造と可変利用構成 (GBCV) から生成したベンチマークを提案する。基本的な制御フロー構造と変数使用量を活用することで、GBCVは、単純なプログラムから複雑なプログラムの範囲を作成する柔軟なフレームワークを提供する。以上の結果から,GPT-4oは複雑なプログラム構造において優れた性能を示し,全てのモデルが単純な条件下で境界値を効果的に検出するが,算術計算では問題に直面することが示唆された。
論文参考訳（メタデータ） (2025-02-05T03:51:44Z)
Control Large Language Models via Divide and Conquer [94.48784966256463]
本稿では,Lexically Constrained Generation(LCG)に着目し,大規模言語モデル(LLM)のプロンプトベース制御による制御可能生成について検討する。我々は,レキシカル制約を満たすためのLLMの性能を,プロンプトベース制御により評価し,下流アプリケーションでの有効性を検証した。
論文参考訳（メタデータ） (2024-10-06T21:20:06Z)
ReadCtrl: Personalizing text generation with readability-controlled instruction learning [12.493713890977943]
Readability-Controlled Instruction Learning (ReadCtrl) は,大規模言語モデル (LLM) を指導し,ユーザの可読性レベルを調整することを目的としている。その結果,ReadCtrl-Mistral-7BモデルはGPT-4やClaude-3といった強力なベースラインモデルよりも優れていた。これらの結果は、高品質で文脈的に適切な出力を生成する上でのRead-Ctrlの有効性と忍耐性を裏付けるものである。
論文参考訳（メタデータ） (2024-06-13T15:03:46Z)
From Tarzan to Tolkien: Controlling the Language Proficiency Level of LLMs for Content Generation [10.009516150364371]
本稿では,この課題に対するいくつかの重要なアプローチの有効性を評価する。この結果から,プロンプトベース戦略を用いた場合,GPT-4とオープンソースモデルの間に大きな性能差があることが判明した。我々の最良のモデルであるCALM (CEFR-Aligned Language Model) は、GPT-4やその他の戦略の性能をほんの少しのコストで上回ります。
論文参考訳（メタデータ） (2024-06-05T07:57:17Z)
Generating Code World Models with Large Language Models Guided by Monte Carlo Tree Search [5.913758275518443]
我々は,大規模言語モデル(LLM)が生成する世界モデルであるコードワールドモデルを,モデルベース強化学習(RL)のためのPythonコード形式として検討する。 LLMの代わりにコードを呼び出すことは、より正確で、信頼性があり、解釈可能で、非常に効率的である可能性がある。その結果, モデルベースRLエージェントは, サンプル効率と推論速度を大幅に向上させることができた。
論文参考訳（メタデータ） (2024-05-24T09:31:26Z)
LLM can Achieve Self-Regulation via Hyperparameter Aware Generation [88.69052513433603]
大規模言語モデル (LLM) は、生成されたテキストを制御するために様々な復号法を用いる。 LLMはこれらのデコード戦略の存在を意識し、自己統制できるのか? ハイパーパラメータ・アウェア・ジェネレーション(HAG)と呼ばれる新しいテキスト生成パラダイムを提案する。
論文参考訳（メタデータ） (2024-02-17T11:18:22Z)
Controlled Text Generation via Language Model Arithmetic [7.687678490751105]
本稿では,大規模言語モデルの合成とバイアス化のための新しい推論フレームワークであるモデル演算を導入する。モデル算術により生成したテキストのきめ細かい制御が可能であり, 毒性低減の課題において, 最先端の処理性能に優れることを示す。
論文参考訳（メタデータ） (2023-11-24T13:41:12Z)
Controllable Text Generation with Residual Memory Transformer [4.9329649616940205]
任意の時間ステップでCLMを生成するための,非侵襲的で軽量な制御プラグインを提案する。提案されているプラグイン、すなわちResidual Memory Transformer (RMT)は、任意の種類の制御条件を受け入れることができるエンコーダとデコーダのセットアップを備えている。各種制御タスクにおいて, 自動評価と人的評価の両面で, 広範囲な実験が実施されている。
論文参考訳（メタデータ） (2023-09-28T08:13:33Z)
Stay on topic with Classifier-Free Guidance [57.28934343207042]
CFGは純粋言語モデリングにおける推論時手法として広く利用できることを示す。 CFG は Pythia, GPT-2 および LLaMA ファミリーモデルの性能をタスクの配列にわたって改善することを示す。
論文参考訳（メタデータ） (2023-06-30T17:07:02Z)
Tractable Control for Autoregressive Language Generation [82.79160918147852]
本稿では,自動回帰テキスト生成モデルに語彙制約を課すために,トラクタブル確率モデル(TPM)を提案する。本稿では,GeLaToが制約付きテキスト生成のための挑戦的ベンチマークにおいて,最先端のパフォーマンスを実現することを示す。我々の研究は、大きな言語モデルを制御するための新しい道を開き、さらに表現力のあるTPMの開発を動機付けます。
論文参考訳（メタデータ） (2023-04-15T00:19:44Z)
Guiding Large Language Models via Directional Stimulus Prompting [114.84930073977672]
我々は,特定の所望の出力に対して,ブラックボックス大言語モデル(LLM)を導くための新しいフレームワークであるDirectional Stimulus Promptingを紹介する。 LLMを直接調整するのではなく、小さな調整可能なポリシーモデルを用いて各入力インスタンスに対して補助的な指向性刺激プロンプトを生成する。
論文参考訳（メタデータ） (2023-02-22T17:44:15Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。