Fugu-MT 論文翻訳(概要): Describing Console I/O Behavior for Testing Student Submissions in Haskell

論文の概要: Describing Console I/O Behavior for Testing Student Submissions in Haskell

arxiv url: http://arxiv.org/abs/2008.09253v2
Date: Thu, 26 Jun 2025 13:12:32 GMT
ステータス: 翻訳完了
システム内更新日: 2025-06-29 15:26:09.919431
Title: Describing Console I/O Behavior for Testing Student Submissions in Haskell
Title（参考訳）: Haskell におけるテスト用コンソール I/O 動作の記述
Authors: Oliver Westphal, Janis Voigtländer,
Abstract要約: 単純なコンソールI/Oプログラムの動作を特定するための,小型で形式的な言語を提案する。この設計は、学生が書いたインタラクティブHaskellプログラムをテストする具体的なアプリケーションケースによって進められている。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We present a small, formal language for specifying the behavior of simple console I/O programs. The design is driven by the concrete application case of testing interactive Haskell programs written by students. Specifications are structurally similar to lexical analysis regular expressions, but are augmented with features like global variables that track state and history of program runs, enabling expression of an interesting range of dynamic behavior. We give a semantics for our specification language based on acceptance of execution traces. From this semantics we derive a definition of the set of all traces valid for a given specification. Sampling that set enables us to mechanically check program behavior against specifications in a probabilistic fashion. Beyond testing, other possible uses of the specification language in an education context include related activities like providing more helpful feedback, generating sample solutions, and even generating random exercise tasks.
Abstract（参考訳）: 単純なコンソールI/Oプログラムの動作を特定するための,小型で形式的な言語を提案する。この設計は、学生が書いたインタラクティブHaskellプログラムをテストする具体的なアプリケーションケースによって進められている。仕様は構文解析正規表現と構造的に似ているが、グローバル変数のようなプログラム実行の状態や履歴を追跡する機能で拡張されており、興味深いダイナミックな振る舞いを表現できる。実行トレースの受け入れに基づいて、仕様言語にセマンティクスを提供します。この意味論から、与えられた仕様に有効なすべてのトレースの集合の定義を導き出す。このセットをサンプリングすることで、確率的な方法でプログラムの動作を仕様に対して機械的にチェックできます。テスト以外にも、教育コンテキストにおける仕様言語の使用には、より有用なフィードバックの提供、サンプルソリューションの生成、ランダムなエクササイズタスクの生成など、関連するアクティビティが含まれる。

関連論文リスト

Inferring Attributed Grammars from Parser Implementations [1.0217990949413291]
本稿では,入力文法の実装から属性文法を推定する新しい手法を提案する。実行時の実行を観察し,プログラムの振る舞いを文法にマッピングすることにより,文法規則に意味的アクションを体系的に抽出し,組み込む。プログラムの初期セットを用いて,提案手法の有効性を実証し,生成した属性文法を用いてプログラムの動作を正確に再現可能であることを示す。
論文参考訳（メタデータ） (2025-07-17T13:32:59Z)
Automated Synthesis of Formally Verified Multi-Abstraction Function Summaries [19.23701821549906]
本稿では,記号実行,大規模言語モデル(LLM),および相対的最強ポストコンディション(RSP)を生成するための形式検証を組み合わせた新しいフレームワークを提案する。我々のアプローチは、VST-Aのシンボル的実行を利用して、プログラムの実行パスと状態遷移を正確に追跡する。生成したRSPから,ドメイン固有言語内で表現される最強の非冗長な条件を自動で合成する。
論文参考訳（メタデータ） (2025-06-11T09:33:02Z)
BehaviorBox: Automated Discovery of Fine-Grained Performance Differences Between Language Models [55.2480439325792]
本稿では,性能を考慮した文脈埋め込みを用いた言語モデルの自動比較手法を提案する。提案手法は,2つのLM間の生成容易性について,その相違点を示すコヒーレントな特徴を抽出する。本研究では,サイズ,モデルファミリ,ポストトレーニングの異なるモデルを比較し,コーパスレベルの難易度だけでは見つからないパフォーマンスの有意義な違いを示す,特定のコンテキストに対する洞察を列挙する。
論文参考訳（メタデータ） (2025-06-02T19:44:06Z)
Watch Your Steps: Observable and Modular Chains of Thought [36.79118554877861]
プログラムトレースプロンプティング(Program Trace Prompting)と呼ばれる,思考の連鎖(CoT)の変種を提案する。 CoTのパワー、一般性、柔軟性を保ちながら、より観察可能な説明をする。 Program Trace Promptingは多くのタスクに適用でき、BIG-Bench Hardベンチマークの23種類のタスクに対して強力な結果が得られる。
論文参考訳（メタデータ） (2024-09-17T23:47:20Z)
A Pattern Language for Machine Learning Tasks [0.0]
学習者の合成に対する等式制約として,目的関数の本質的データを定式化する。 1)ドメイン間における機械学習のアプローチの統一的な視点を提供し,(2)望ましい振る舞いをモデルに依存しない設計と最適化し,(3)理論的コンピュータ科学からの洞察を実践的な機械学習へインポートする。
論文参考訳（メタデータ） (2024-07-02T16:50:27Z)
Functionality learning through specification instructions [2.4095382017500464]
テストスイートは、自然言語処理モデルのパフォーマンスを特定の機能で評価する。本稿では,細粒度タスク固有の振る舞いを記述したテキスト記述について述べる。我々は、仕様記述と仕様拡張プロンプトを組み合わせ、自然の命令データに基づいて事前訓練された言語モデルにフィードする。
論文参考訳（メタデータ） (2023-11-14T19:15:55Z)
Eliciting Human Preferences with Language Models [56.68637202313052]
言語モデル(LM)は、ラベル付き例や自然言語のプロンプトを使用してターゲットタスクを実行するように指示することができる。タスク仕様プロセスのガイドには*LM自身を使うことを提案します。我々は、メール検証、コンテンツレコメンデーション、道徳的推論の3つの領域でGATEを研究している。
論文参考訳（メタデータ） (2023-10-17T21:11:21Z)
Compositional Program Generation for Few-Shot Systematic Generalization [59.57656559816271]
コンポジションプログラムジェネレータ(CPG)と呼ばれるニューロシンボリックアーキテクチャに関する研究 CPGには3つの重要な特徴がある: 文法規則の形で、テキストモジュラリティ、テキストコンポジション、テキストタストラクションである。 SCAN と COGS のベンチマークでは,SCAN の14例と COGS の22例を使用して,完全な一般化を実現している。
論文参考訳（メタデータ） (2023-09-28T14:33:20Z)
Code Representation Pre-training with Complements from Program Executions [29.148208436656216]
テストケースで明らかになったプログラムの動的情報を調べ,それを補体としてコードの特徴表現に埋め込むために,FuzzPretrainを提案する。 FuzzyPretrainは、ソースコードやASTのみをトレーニングしたコード検索に対して、6%/9%のmAP改善を実現した。
論文参考訳（メタデータ） (2023-09-04T01:57:22Z)
Prompting Language Models for Linguistic Structure [73.11488464916668]
本稿では,言語構造予測タスクに対する構造化プロンプト手法を提案する。提案手法は, 音声タグ付け, 名前付きエンティティ認識, 文チャンキングについて評価する。 PLMはタスクラベルの事前知識を事前学習コーパスに漏えいすることで有意な事前知識を含むが、構造化プロンプトは任意のラベルで言語構造を復元することも可能である。
論文参考訳（メタデータ） (2022-11-15T01:13:39Z)
BenchCLAMP: A Benchmark for Evaluating Language Models on Syntactic and Semantic Parsing [55.058258437125524]
本稿では,制約付きLanguage Model Parsingを評価するベンチマークであるBenchCLAMPを紹介する。 APIを通じてのみ利用可能な2つのGPT-3変種を含む8つの言語モデルをベンチマークする。実験により,エンコーダ-デコーダ事前学習言語モデルでは,モデル出力が有効であると制約された場合に,構文解析や意味解析の最先端手法を超えることができることがわかった。
論文参考訳（メタデータ） (2022-06-21T18:34:11Z)
Instruction Induction: From Few Examples to Natural Language Task Descriptions [55.139554327372934]
実例に適合する自然言語命令を生成するように促すことで,言語モデルがいくつかの実演から基礎となるタスクを明示的に推論できることを示す。 InstructGPTは65.7%の人的パフォーマンスを達成するが、オリジナルのGPT-3モデルは9.8%にしか達しない。
論文参考訳（メタデータ） (2022-05-22T09:22:37Z)
Representing Partial Programs with Blended Abstract Semantics [62.20775388513027]
プログラム合成エンジンにおける部分的なプログラム表現手法について紹介する。モジュラーニューラルネットワークとして実装された近似実行モデルを学ぶ。これらのハイブリッドニューロシンボリック表現は、実行誘導型シンセサイザーがより強力な言語構成を使うことができることを示す。
論文参考訳（メタデータ） (2020-12-23T20:40:18Z)
Infusing Finetuning with Semantic Dependencies [62.37697048781823]
シンタックスとは異なり、セマンティクスは今日の事前訓練モデルによって表面化されないことを示す。次に、畳み込みグラフエンコーダを使用して、タスク固有の微調整にセマンティック解析を明示的に組み込む。
論文参考訳（メタデータ） (2020-12-10T01:27:24Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。