Fugu-MT 論文翻訳(概要): Int2Int: a framework for mathematics with transformers

論文の概要: Int2Int: a framework for mathematics with transformers

arxiv url: http://arxiv.org/abs/2502.17513v2
Date: Mon, 24 Mar 2025 19:11:58 GMT
ステータス: 翻訳完了
システム内更新日: 2025-03-26 19:42:57.841404
Title: Int2Int: a framework for mathematics with transformers
Title（参考訳）: Int2Int: 変圧器を用いた数学のフレームワーク
Authors: François Charton,
Abstract要約: Int2Intは、トランスフォーマーアーキテクチャの完全なPyTorch実装である。本稿では,Int2Intの主な機能について紹介し,ユーザマニュアルとして機能し,拡張方法に関するガイドラインを提供する。
参考スコア（独自算出の注目度）: 8.430481660019451
License: http://creativecommons.org/licenses/by/4.0/
Abstract: This paper documents Int2Int, an open source code base for using transformers on problems of mathematical research, with a focus on number theory and other problems involving integers. Int2Int is a complete PyTorch implementation of a transformer architecture, together with training and evaluation loops, and classes and functions to represent, generate and decode common mathematical objects. Ancillary code for data preparation, and Jupyter Notebooks for visualizing experimental results are also provided. This document presents the main features of Int2Int, serves as its user manual, and provides guidelines on how to extend it. Int2Int is released under the MIT licence, at https://github.com/f-charton/Int2Int.
Abstract（参考訳）: Int2Intは、数論やその他の整数問題に焦点をあて、数学的研究の課題にトランスフォーマーを使うためのオープンソースのコードベースである。 Int2Intは、トレーニングと評価ループ、一般的な数学的オブジェクトを表現、生成、デコードするためのクラスと関数とともに、トランスフォーマーアーキテクチャの完全なPyTorch実装である。データ準備の補助コードと実験結果を視覚化するJupyter Notebookも提供される。この文書はInt2Intの主な機能を示し、ユーザーマニュアルとして機能し、それを拡張するためのガイドラインを提供する。 Int2IntはMITライセンスのもと、https://github.com/f-charton/Int2Intでリリースされた。

関連論文リスト

Paper2Code: Automating Code Generation from Scientific Papers in Machine Learning [57.09163579304332]
機械学習論文を機能コードリポジトリに変換するフレームワークであるPaperCoderを紹介した。 PaperCoderは3つの段階で動作する。計画、図によるシステムアーキテクチャの設計、ファイル依存の特定、構成ファイルの生成である。次に、モデルベースおよび人的評価の両方に基づいて、機械学習論文からコード実装を生成するPaperCoderを評価する。
論文参考訳（メタデータ） (2025-04-24T01:57:01Z)
Concise One-Layer Transformers Can Do Function Evaluation (Sometimes) [1.157192696857674]
本稿では,変圧器の表現能力に関する研究に寄与する。任意の関数を与えられた引数で$[n]$から$[n]$に評価する基本的な計算タスクを実行する能力に焦点を当てる。
論文参考訳（メタデータ） (2025-03-28T01:40:23Z)
MAMUT: A Novel Framework for Modifying Mathematical Formulas for the Generation of Specialized Datasets for Language Model Training [7.164697875838552]
本研究は,数学的内容のエンコーディングを強化するための専門訓練データセットの開発に焦点をあてる。そこで我々は,与えられた数学的公式の等価かつファルシフィケートなバージョンを生成可能なフレームワークであるMath Mutator (MAMUT)を紹介した。実験により、これらのデータセットでトレーニングされたモデルは、数学的検索タスクにおいて新しいSoTA性能を示すことが示された。
論文参考訳（メタデータ） (2025-02-28T08:53:42Z)
FoNE: Precise Single-Token Number Embeddings via Fourier Features [51.17846016593835]
本稿では,数値をFourierの特徴を持つ埋め込み空間にマッピングする新しい手法を提案する。 FoNEは各数値を1桁に2つの埋め込み次元しか持たない単一のトークンとしてエンコードし、フラグメンテーションなしで数値を効果的にキャプチャする。 6桁の10進法では、FoNEはサブワードや桁の埋め込みよりも99%の精度を達成するために64$times$少ないデータを必要とする。 FoNEは、加算、減算、乗算の10万以上の試験例で100%精度を得る唯一の方法である。
論文参考訳（メタデータ） (2025-02-13T19:54:59Z)
Data for Mathematical Copilots: Better Ways of Presenting Proofs for Machine Learning [85.635988711588]
我々は,大規模言語モデルの能力向上には,数学的データセットの設計におけるパラダイムシフトが必要であると論じる。 1949年にG. P'olyaが導入した「動機付き証明」の概念は、より良い証明学習信号を提供するデータセットの青写真として機能する。数学データセットに特化して設計されたアンケートでは、クリエーターにデータセットを含めるよう促します。
論文参考訳（メタデータ） (2024-12-19T18:55:17Z)
MathCoder2: Better Math Reasoning from Continued Pretraining on Model-translated Mathematical Code [38.127313175508746]
本稿では, 継続事前学習のための推論ステップを伴って, 数学的コードを生成する新しい手法を提案する。私たちのアプローチは、高品質な数学的継続事前学習データセットの構築から始まります。生成されたコードを推論ステップ毎に適用すると、ペアの自然言語推論ステップとその対応するコードからなるデータが得られる。
論文参考訳（メタデータ） (2024-10-10T17:58:40Z)
Transformers Can Do Arithmetic with the Right Embeddings [75.66545271398704]
算術演算における変換器の性能向上について述べる。たった20桁の数値で1日1GPUでトレーニングすれば、最先端のパフォーマンスに到達できます。これらの数的増加は、ソートや乗算を含む他の多段階の推論タスクの改善を解放する。
論文参考訳（メタデータ） (2024-05-27T17:49:18Z)
MuMath-Code: Combining Tool-Use Large Language Models with Multi-perspective Data Augmentation for Mathematical Reasoning [11.426127461122908]
この研究には、マルチパースペクティブなデータ拡張手法による新しい数学の質問が含まれ、その上でコードネストされたソリューションを合成する。外部Pythonインタプリタと統合したオープン大言語モデル(LLM)は、数学的推論能力を大幅に強化した。ステージ1では、純粋なCoTデータに基づいてLlama-2を微調整し、中間モデルを取得し、ステージ2のコードネストデータに基づいてトレーニングし、結果のMuMath-Codeを得る。
論文参考訳（メタデータ） (2024-05-13T08:32:19Z)
Cryptomite: A versatile and user-friendly library of randomness extractors [0.0]
ランダム性抽出実装のPythonライブラリであるCryptomiteを提示する。このライブラリは、パラメータ計算モジュールとともに、2つのソース、シード、決定論的ランダムネス抽出器を提供する。抽出器の実装は、実際は効率的であり、最大240>1012$ビットの入力サイズを許容する。
論文参考訳（メタデータ） (2024-02-13T17:51:04Z)
MathPile: A Billion-Token-Scale Pretraining Corpus for Math [45.163340937419214]
約950億のトークンからなる多様で高品質な数学中心コーパスであるMathPileを紹介します。精巧なデータ収集と処理には、複雑な事前処理が含まれていました。我々は、言語モデルの数学的推論能力を向上し、異なるバージョンをオープンソース化し、フィールドを前進させるためにスクリプトをプロセッシングすることを目指しています。
論文参考訳（メタデータ） (2023-12-28T16:55:40Z)
TorchProbe: Fuzzing Dynamic Deep Learning Compilers [9.324205843411352]
PyTorch 2.0はPythonで任意のディープラーニングプログラムのコンパイルをサポートする。動的特徴を含むテストケースを生成するためのコード変換を提案する。我々は、PyTorchコンパイラとその基盤となるテンソルコンパイラTritonの20の既知のバグを特定した。
論文参考訳（メタデータ） (2023-10-30T23:20:47Z)
MathCoder: Seamless Code Integration in LLMs for Enhanced Mathematical Reasoning [52.97768001837269]
本稿では,オープンソース言語モデルを微調整する手法を提案する。本稿では,問題のある新しい,高品質なデータセットを生成する手法とそのコードベースソリューションを提案する。このアプローチは、問題の解決にコードベースのソリューションを生成することができるモデルのファミリーであるMathCoderモデルを生成する。
論文参考訳（メタデータ） (2023-10-05T17:52:09Z)
Extending Source Code Pre-Trained Language Models to Summarise Decompiled Binaries [4.0484792045035505]
ソースコードの事前訓練済み言語モデルを拡張して、逆コンパイルされたバイナリ関数を要約する。このようなモデルの性能に及ぼす入力特性とデータ特性の影響について検討する。 BinT5は最先端のBLEU-4スコアを60.83、58.82、44.21で達成し、ソースを要約し、逆コンパイルし、合成的に削除した。
論文参考訳（メタデータ） (2023-01-04T16:56:33Z)
TransCMD: Cross-Modal Decoder Equipped with Transformer for RGB-D Salient Object Detection [86.94578023985677]
本研究では,グローバルな情報アライメントと変革の観点から,この課題を再考する。具体的には、トランスCMD(TransCMD)は、複数のクロスモーダル統合ユニットをカスケードして、トップダウントランスフォーマーベースの情報伝達経路を構築する。 7つのRGB-D SODベンチマークデータセットの実験結果から、単純な2ストリームエンコーダデコーダフレームワークが、最先端のCNNベースの手法を超越できることが示されている。
論文参考訳（メタデータ） (2021-12-04T15:45:34Z)
I-BERT: Integer-only BERT Quantization [78.43819756382103]
トランスフォーマーモデルのための新しい量子化手法であるI-BERTを提案する。 I-BERTは浮動小数点演算なしでエンドツーエンドの整数のみのBERT推論を実行する。いずれの場合も,I-BERTは全精度ベースラインと同等(かつ若干高い)精度が得られた。
論文参考訳（メタデータ） (2021-01-05T02:42:58Z)
Signatory: differentiable computations of the signature and logsignature transforms, on both CPU and GPU [13.503274710499971]
Signatoryは、シグネチャおよびログシグネチャ変換に関連する機能を計算し、実行するライブラリである。これは、効率的な事前計算戦略など、以前のライブラリでは利用できない新機能を実装している。ライブラリはC++のPythonラッパーとして動作し、PyTorchエコシステムと互換性がある。
論文参考訳（メタデータ） (2020-01-03T03:15:58Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。