論文の概要: A Reasoning Engine for the Gamification of Loop-Invariant Discovery
- arxiv url: http://arxiv.org/abs/2109.01121v1
- Date: Thu, 2 Sep 2021 17:47:03 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-03 13:45:45.125026
- Title: A Reasoning Engine for the Gamification of Loop-Invariant Discovery
- Title(参考訳): ループ不変発見のゲーミフィケーションのための推論エンジン
- Authors: Andrew Walter and Seth Cooper and Panagiotis Manolios
- Abstract要約: 我々の推論エンジンは、学生や計算エージェント、正規のソフトウェアエンジニアが形式的な手法の専門知識を持っていない状態で、興味深い定理を共同で証明することを可能にする。
1時間以内にプレイヤーは、完全に自動化されたツールの能力を超えたプログラムの特性を特定し、検証することができる。
- 参考スコア(独自算出の注目度): 4.125187280299247
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We describe the design and implementation of a reasoning engine that
facilitates the gamification of loop-invariant discovery. Our reasoning engine
enables students, computational agents and regular software engineers with no
formal methods expertise to collaboratively prove interesting theorems about
simple programs using browser-based, online games. Within an hour, players are
able to specify and verify properties of programs that are beyond the
capabilities of fully-automated tools. The hour limit includes the time for
setting up the system, completing a short tutorial explaining game play and
reasoning about simple imperative programs. Players are never required to
understand formal proofs; they only provide insights by proposing invariants.
The reasoning engine is responsible for managing and evaluating the proposed
invariants, as well as generating actionable feedback.
- Abstract(参考訳): 本稿では,ループ不変発見のゲーミフィケーションを容易にする推論エンジンの設計と実装について述べる。
私たちの推論エンジンは、学生、計算エージェント、正規のソフトウェアエンジニアが、ブラウザベースのオンラインゲームを使って、単純なプログラムに関する興味深い定理を協調的に証明することを可能にする。
1時間以内に、完全に自動化されたツールの能力を超えたプログラムの特性を特定し検証することができる。
時間制限には、システムのセットアップ時間、ゲームプレイを説明する簡単なチュートリアルの完了、単純な命令的プログラムの推論が含まれる。
プレイヤーは形式的な証明を理解する必要はなく、不変量を提案することでのみ洞察を与える。
推論エンジンは提案された不変量を管理し評価し、実用的なフィードバックを生成する。
関連論文リスト
- LogicGame: Benchmarking Rule-Based Reasoning Abilities of Large Language Models [87.49676980090555]
大規模言語モデル(LLM)は、様々なタスクにまたがる顕著な能力を示し、複雑な問題解決能力を示している。
LLMの包括的なルール理解、実行、計画能力を評価するために設計された新しいベンチマークであるLogicGameを紹介する。
論文 参考訳(メタデータ) (2024-08-28T13:16:41Z) - Improving Complex Reasoning over Knowledge Graph with Logic-Aware Curriculum Tuning [89.89857766491475]
大規模言語モデル(LLM)に基づくKG上の複雑な推論スキーマを提案する。
任意の一階論理クエリを二分木分解により拡張し、LLMの推論能力を刺激する。
広く使われているデータセットに対する実験では、LACTは高度な手法よりも大幅に改善されている(平均+5.5% MRRスコア)。
論文 参考訳(メタデータ) (2024-05-02T18:12:08Z) - NExT: Teaching Large Language Models to Reason about Code Execution [50.93581376646064]
大規模言語モデル(LLM)のコードは通常、プログラムの表面テキスト形式に基づいて訓練される。
NExTは,プログラムの実行トレースを検査し,実行時の動作を判断する手法である。
論文 参考訳(メタデータ) (2024-04-23T01:46:32Z) - Language Models as Compilers: Simulating Pseudocode Execution Improves Algorithmic Reasoning in Language Models [17.76252625790628]
本稿では,言語モデルの推論過程を2段階に分解するフレームワークであるThink-and-Executeについて述べる。
7つのアルゴリズム的推論タスクについて広範な実験を行い、思考と実行の有効性を実証する。
論文 参考訳(メタデータ) (2024-04-03T08:49:11Z) - Instruction-Driven Game Engines on Large Language Models [59.280666591243154]
IDGEプロジェクトは、大規模な言語モデルが自由形式のゲームルールに従うことを可能にすることで、ゲーム開発を民主化することを目的としている。
我々は、複雑なシナリオに対するモデルの露出を徐々に増大させるカリキュラム方式でIDGEを訓練する。
私たちの最初の進歩は、汎用的なカードゲームであるPoker用のIDGEを開発することです。
論文 参考訳(メタデータ) (2024-03-30T08:02:16Z) - Learning Guided Automated Reasoning: A Brief Survey [5.607616497275423]
これまでに開発されてきたいくつかの自動推論・定理証明領域と学習・AI手法の概要について概説する。
これには、前提選択、いくつかの設定での証明ガイダンス、推論と学習を繰り返すフィードバックループ、象徴的な分類問題が含まれる。
論文 参考訳(メタデータ) (2024-03-06T19:59:17Z) - Leveraging Large Language Models to Generate Answer Set Programs [5.532477732693001]
大規模言語モデル(LLM)は、様々な自然言語処理タスクにおいて例外的な性能を示した。
本稿では,大規模言語モデルの強みと解集合プログラミングを組み合わせたニューロシンボリック手法を提案する。
論文 参考訳(メタデータ) (2023-07-15T03:40:55Z) - Code Prompting: a Neural Symbolic Method for Complex Reasoning in Large
Language Models [74.95486528482327]
コードプロンプト(code prompting)は、ゼロショットバージョンと少数ショットバージョンの両方を持ち、中間ステップとしてコードをトリガーするニューラルシンボルプロンプトである。
我々は,記号的推論と算術的推論を含む7つの広く使用されているベンチマーク実験を行った。
論文 参考訳(メタデータ) (2023-05-29T15:14:09Z) - Fact-driven Logical Reasoning for Machine Reading Comprehension [82.58857437343974]
私たちは、常識と一時的な知識のヒントの両方を階層的にカバーする動機があります。
具体的には,文の背骨成分を抽出し,知識単位の一般的な定式化を提案する。
次に、事実単位の上にスーパーグラフを構築し、文レベル(事実群間の関係)と実体レベルの相互作用の利点を享受する。
論文 参考訳(メタデータ) (2021-05-21T13:11:13Z) - Extending Automated Deduction for Commonsense Reasoning [0.0]
本論文は,古典的な一階述語論理を自動推論する手法とアルゴリズムを,コモンセンス推論に拡張できると主張している。
提案された拡張は主に通常の証明木に依存しており、不整合、デフォルトルール、トピックの操作、関連性、信頼性、類似度などを含む常識知識ベースを扱うように設計されている。
機械学習はコモンセンスの知識ベースを構築するのに最適であり、拡張された論理ベースの手法はこれらの知識ベースからのクエリに実際に答えるのに適している、と我々は主張する。
論文 参考訳(メタデータ) (2020-03-29T23:17:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。