論文の概要: Gumbel Machine: Counterfactual Student Writing Generation via Gumbel Noise Steering
- arxiv url: http://arxiv.org/abs/2605.27249v1
- Date: Tue, 26 May 2026 16:27:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:42.414065
- Title: Gumbel Machine: Counterfactual Student Writing Generation via Gumbel Noise Steering
- Title(参考訳): Gumbel Machine:Gumbelノイズステアリングによる対実的学生書き込み生成
- Authors: Hunter McNichols, Alexander Scarlatos, Mihai Dascalu, Danielle McNamara, Andrew Lan,
- Abstract要約: 理想的な学習デモは、学生作品の反実的なバージョンであり、改善されたバージョンは、まだ彼ら自身のものと似ている。
LLM(Large Language Models)を用いた対実テキストの自動生成のアプローチは、実用的なアプリケーションへの変換が難しいドメイン固有システムをもたらす。
提案するGumbel Machineは,LLM命令追従機能を活用しながら,参照ファクトテキストとの類似性を奨励する,フレキシブルでモジュラーな手法である。
- 参考スコア(独自算出の注目度): 41.340472784619756
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: An effective method of teaching across disciplines is to provide examples of high-quality work. However, an example may be significantly different from a student's current work, making it challenging for them to emulate. An ideal learning demonstration is a counterfactual version of the student work, an improved version that is still similar to their own. Existing automated approaches for counterfactual text generation using Large Language Models (LLMs) result in domain-specific systems that are difficult to translate into practical applications. We present the Gumbel Machine, a flexible, modular approach to generating counterfactuals that leverages LLM instruction-following capabilities while encouraging similarity to a reference factual text. Central to our approach is a novel, controlled decoding algorithm, $β$-Hindsight control, which uses latent randomness as a tunable similarity control mechanism during counterfactual generation. Experiments on datasets of student writing, scored on various criteria, demonstrate the effectiveness of our approach at generating counterfactuals both rubric-consistent and similar to a reference.
- Abstract(参考訳): 規律にまたがる効果的な教育方法は、高品質な仕事の例を提供することである。
しかし、その例は学生の現在の仕事と大きく異なり、エミュレートするのが困難である。
理想的な学習デモは、学生作品の反実的なバージョンであり、改善されたバージョンは、まだ彼ら自身のものと似ている。
LLM(Large Language Models)を用いた対実テキストの自動生成のアプローチは、実用的なアプリケーションへの変換が難しいドメイン固有システムをもたらす。
提案するGumbel Machineは,LLM命令追従機能を活用しながら,参照ファクトテキストとの類似性を奨励する,フレキシブルでモジュラーな手法である。
提案手法の中心となるのは, 逆ファクト生成時の調整可能な類似性制御機構として潜時ランダム性を利用する, 新規で制御された復号アルゴリズムである$β$-Hindsight 制御である。
様々な基準で評価された学生の文章のデータセットに関する実験は、ルーリック一貫性と参照に類似した反事実を生成するためのアプローチの有効性を実証している。
関連論文リスト
- Teaching Language Models How to Code Like Learners: Conversational Serialization for Student Simulation [4.361813083295904]
本稿では,学生プロセスデータを用いたオープンウェイトな人工プログラミング学習者の学習方法を提案する。
提案手法では,時間的ログトレースを対話形式にシリアライズし,各生徒の問題解決プロセスを表現する。
学生のコード提出とテスト結果、成績、エラートレースなどの環境フィードバックは、交互に会話のターンを形成する。
論文 参考訳(メタデータ) (2026-04-12T16:38:42Z) - GRAD: Generative Retrieval-Aligned Demonstration Sampler for Efficient Few-Shot Reasoning [6.371118178107715]
大規模言語モデル(LLM)は様々なタスクで高いパフォーマンスを達成する。
Retrieval-Augmented Generation (RAG)は外部情報でプロンプトを豊かにするが、静的データベースへの依存は適応性を制限する。
本稿では,GRAD(Generative Retrieval-Aligned Demonstrator)を提案する。
論文 参考訳(メタデータ) (2025-10-01T17:52:41Z) - ParaStudent: Generating and Evaluating Realistic Student Code by Teaching LLMs to Struggle [24.691302820912888]
大規模言語モデル(LLM)は、プログラミングタスクに強いパフォーマンスを示していますが、実際の学生のように、学生のようなコードを生成することができますか?
本稿では,LLMをベースとした「学生的」コード生成の体系的研究であるParaStudentについて紹介する。
論文 参考訳(メタデータ) (2025-07-16T23:12:14Z) - Automated Generation of Commit Messages in Software Repositories [0.7366405857677226]
コミットメッセージはソフトウェア変更の文書化に不可欠であり、プログラムの理解とメンテナンスを支援する。
機械学習(ML)と自然言語処理(NLP)を用いたコミットメッセージの自動生成手法を提案する。
コード変更とそれに対応するコミットメッセージのデータセットをLiuらによって使用しました。
論文 参考訳(メタデータ) (2025-04-17T15:08:05Z) - Aligning Language Models with Demonstrated Feedback [58.834937450242975]
Demonstration ITerated Task Optimization (DITTO)は、言語モデルの出力とユーザの実証された振る舞いを直接調整する。
我々は,DITTOがニュース記事やメール,ブログ記事などのドメイン間できめ細かいスタイルやタスクアライメントを学習する能力を評価する。
論文 参考訳(メタデータ) (2024-06-02T23:13:56Z) - DiffGen: Robot Demonstration Generation via Differentiable Physics Simulation, Differentiable Rendering, and Vision-Language Model [72.66465487508556]
DiffGenは、微分可能な物理シミュレーション、微分可能なレンダリング、ビジョン言語モデルを統合する新しいフレームワークである。
言語命令の埋め込みとシミュレートされた観察の埋め込みとの距離を最小化することにより、現実的なロボットデモを生成することができる。
実験によると、DiffGenを使えば、人間の努力やトレーニング時間を最小限に抑えて、ロボットデータを効率よく、効果的に生成できる。
論文 参考訳(メタデータ) (2024-05-12T15:38:17Z) - $\textit{latent}$-GLAT: Glancing at Latent Variables for Parallel Text
Generation [65.29170569821093]
並列テキスト生成は、ジェネレーション効率の成功により、広く注目を集めています。
本稿では,単語分類情報を取得するために,離散潜在変数を用いた$textitlatent$-GLATを提案する。
実験結果から,本手法は自己回帰モデルを用いることなく,強いベースラインを達成できることが示唆された。
論文 参考訳(メタデータ) (2022-04-05T07:34:12Z) - Learning Multi-Objective Curricula for Deep Reinforcement Learning [55.27879754113767]
深部強化学習(DRL)のサンプル効率と最終性能を向上させるために,各種自動カリキュラム学習(ACL)手法が提案されている。
本稿では,多目的だがコヒーレントなカリキュラムを作成するための統合された自動カリキュラム学習フレームワークを提案する。
既存の手設計のカリキュラムパラダイムに加えて,抽象カリキュラムを学習するためのフレキシブルなメモリ機構を設計する。
論文 参考訳(メタデータ) (2021-10-06T19:30:25Z) - Unsupervised Text Generation by Learning from Search [86.51619839836331]
TGLSは、教師なしテキスト生成のための新しいフレームワークである。
実世界の自然言語生成タスクであるパラフレーズ生成とテキストの形式化におけるTGLSの有効性を示す。
論文 参考訳(メタデータ) (2020-07-09T04:34:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。