Fugu-MT 論文翻訳(概要): Adventures in Mathematical Reasoning

関連論文リスト

In Reverie Together: Ten Years of Mathematical Discovery with a Machine Collaborator [0.0]
自動推論システム textttTxGraffiti によって生成されるグラフ理論における4つの開予想を示す。各予想は簡潔で、自然グラフ不変量に基づいており、数百のグラフに対して経験的に検証されている。私たちは、人間数学者とAIシステムの両方に、それらに取り組むよう促すことを目指しています。
論文参考訳（メタデータ） (2025-07-23T00:49:32Z)
CogMath: Assessing LLMs' Authentic Mathematical Ability from a Human Cognitive Perspective [68.94793547575343]
CogMathは、人間の推論プロセスを3段階に定式化している。各次元において,この次元からLLMの熟達度を評価する問合せを生成するために,emphInquiry-emphJudge-emphReference'のマルチエージェントシステムの開発を行う。 LLMは、9次元からのすべての問い合わせに優れている場合にのみ、真に問題をマスターすると考えられている。
論文参考訳（メタデータ） (2025-06-04T22:00:52Z)
Formal Mathematical Reasoning: A New Frontier in AI [60.26950681543385]
我々は公式な数学的推論を提唱し、AI4Mathを次のレベルに進めるには不可欠であると主張している。既存の進捗を要約し、オープンな課題について議論し、将来の成功を測るための重要なマイルストーンを想定します。
論文参考訳（メタデータ） (2024-12-20T17:19:24Z)
FrontierMath: A Benchmark for Evaluating Advanced Mathematical Reasoning in AI [2.0608396919601493]
FrontierMath(フロンティアマス、フロンティアマス、FrontierMath)は、数学者が考案し検証した何百もの数学問題のベンチマークである。現在の最先端のAIモデルは、問題の2%未満を解決し、AI能力と数学的コミュニティの長所との間に大きなギャップが浮かび上がっている。 AIシステムが専門家レベルの数学的能力に向かって進むにつれ、FrontierMathは彼らの進歩を定量化する厳格なテストベッドを提供する。
論文参考訳（メタデータ） (2024-11-07T17:07:35Z)
MathHay: An Automated Benchmark for Long-Context Mathematical Reasoning in LLMs [61.74749961334557]
MathHayは、LLMの長文数学的推論能力を評価するために設計された自動ベンチマークである。我々は,8つのトップパフォーマンスモデルの長文数学的推論能力を評価するために,MathHayの広範な実験を行った。
論文参考訳（メタデータ） (2024-10-07T02:30:07Z)
A Semantic Search Engine for Mathlib4 [3.4826238218770813]
本稿では,非公式な問合せを受け付け,関連する定理を求めるMathlib4のセマンティック検索エンジンを提案する。また,各種検索エンジンの性能評価のためのベンチマークを構築した。
論文参考訳（メタデータ） (2024-03-20T05:23:09Z)
Machine learning and information theory concepts towards an AI Mathematician [77.63761356203105]
人工知能の現在の最先端技術は、特に言語習得の点で印象的だが、数学的推論の点ではあまり重要ではない。このエッセイは、現在のディープラーニングが主にシステム1の能力で成功するという考えに基づいている。興味深い数学的ステートメントを構成するものについて質問するために、情報理論的な姿勢を取る。
論文参考訳（メタデータ） (2024-03-07T15:12:06Z)
MathScale: Scaling Instruction Tuning for Mathematical Reasoning [70.89605383298331]
大規模言語モデル(LLM)は問題解決において顕著な能力を示した。しかし、数学的な問題を解く能力は依然として不十分である。高品質な数学的推論データを作成するためのシンプルでスケーラブルな方法であるMathScaleを提案する。
論文参考訳（メタデータ） (2024-03-05T11:42:59Z)
The legacy of Bletchley Park on UK mathematics [0.0]
第2次世界大戦では、暗号解析と暗号の分野に数学の才能が流入した。本稿では、ブレッチリー・パークにおけるこれらの数学者と他の数学者の経験が、戦後のキャリアで生み出された数学にどのように影響したかを考察する。
論文参考訳（メタデータ） (2024-03-02T22:32:49Z)
GSM-Plus: A Comprehensive Benchmark for Evaluating the Robustness of LLMs as Mathematical Problem Solvers [68.77382332826167]
大規模言語モデル (LLM) は、様々な数学的推論ベンチマークで顕著な性能を達成している。 1つの必須かつ頻繁な証拠は、数学の質問がわずかに変更されたとき、LLMは誤って振る舞うことができることである。このことは, LLMの数学推論能力の頑健性を評価するために, 幅広い質問のバリエーションを試すことによるものである。
論文参考訳（メタデータ） (2024-02-29T15:26:14Z)
MetaMath: Bootstrap Your Own Mathematical Questions for Large Language Models [91.66694225955872]
数学的推論を専門とする微調整言語モデルであるMetaMathを提案する。具体的には、余分な知識を伴わずに複数の視点から質問を書き換えることで、数学的質問をブートストラップすることから始める。私たちは、すべてのMetaMathQAデータセット、異なるモデルサイズを持つMetaMathモデル、パブリック使用のためのトレーニングコードをリリースします。
論文参考訳（メタデータ） (2023-09-21T17:45:42Z)
WizardMath: Empowering Mathematical Reasoning for Large Language Models via Reinforced Evol-Instruct [130.37945867605302]
本稿では,大規模言語モデル(LLM)の数学的CoT推論能力を向上させるWizardMathを提案する。注目すべきは、WizardMath-Mistral 7BがトップクラスのオープンソースLLMをはるかに上回り、データ効率が向上したことだ。予備的な調査では、卓越した数学性能を達成する上で、命令の進化とプロセスの監督が重要な役割を担っていることを強調した。
論文参考訳（メタデータ） (2023-08-18T14:23:21Z)
Mathematical Artifacts Have Politics: The Journey from Examples to Embedded Ethics [0.0]
数学的アーティファクトが政治を持っていることを認めることが、数学者が学生のためにより良いエクササイズを設計するのにどう役立つかを示す。我々は、倫理を数学的カリキュラムに組み込むことの意味を示す。
論文参考訳（メタデータ） (2023-08-09T11:09:53Z)
Transformers discover an elementary calculation system exploiting local attention and grid-like problem representation [0.424243593213882]
局所的な注意と適応的な停止機構を備えたユニバーサルトランスフォーマーは、外部のグリッドライクなメモリを利用してマルチ桁加算を行うことができることを示す。提案モデルでは, トレーニング分布外の補間を必要とする問題に対して, 実験を行った場合においても, 顕著な精度が得られた。
論文参考訳（メタデータ） (2022-07-06T09:29:56Z)
Inter-GPS: Interpretable Geometry Problem Solving with Formal Language and Symbolic Reasoning [123.06420835072225]
3,002の幾何学的問題と密接なアノテーションを形式言語に含む新しい大規模ベンチマークGeometry3Kを構築します。我々は、Interpretable Geometry Problemsolvr (Inter-GPS)と呼ばれる形式言語と記号推論を用いた新しい幾何学的解法を提案する。イントラGPSは定理の知識を条件付き規則として取り入れ、記号的推論を段階的に行う。
論文参考訳（メタデータ） (2021-05-10T07:46:55Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

論文の概要: Adventures in Mathematical Reasoning

関連論文リスト