Fugu-MT 論文翻訳(概要): A Mathematical Forum Platform for Collaborative Problem Solving and Dataset Generation for AI Reasoning

論文の概要: A Mathematical Forum Platform for Collaborative Problem Solving and Dataset Generation for AI Reasoning

arxiv url: http://arxiv.org/abs/2606.12976v1
Date: Thu, 11 Jun 2026 07:10:04 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-12 15:55:27.6289
Title: A Mathematical Forum Platform for Collaborative Problem Solving and Dataset Generation for AI Reasoning
Title（参考訳）: AI推論のための協調問題解決とデータセット生成のための数学的フォーラムプラットフォーム
Authors: Akbar Erkinov, Nurmukhammad Abdurasulov,
Abstract要約: 現在のフォーラムソフトウェアは、公式の写真からレンダリングされたポストへの統合されたパスを提供しない。本稿では,LATEX変換パイプラインに直接イメージを埋め込むことで,この摩擦を解消する統一システムを提案する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Sharing mathematical content in online forums remains a significant friction point for students and educators: writing raw LATEX is error-prone, standalone optical character recognition tools require platform switching, and current forum software offers no integrated path from a photograph of a formula to a rendered post. We present a unified system that eliminates this friction by embedding an image to LATEX conversion pipeline directly inside a forum posting interface. A user uploads or captures an image of a mathematical expression; the system routes it through the Mathpix OCR API, detects whether the returned output is LATEX or plain text containing inline math, applies the appropriate delimiter normalisation, and renders a live preview in either LATEX or Markdown mode before the post is committed to the database. The architecture is organized in three loosely coupled layers: image processing, rendering, and storage, and supports both desktop and mobile clients. A provisional US patent application has been filed covering the core methods. We describe the full system design, each component in detail, the data schema, and the key technical innovations, and we position the work against existing standalone tools and forum platforms to demonstrate the practical gap it closes. Beyond immediate usability, we argue that a deployed platform of this kind constitutes a continuously growing, community-validated dataset of mathematical problems and step-by-step solutions, a resource that can be used to train and benchmark AI systems for accurate mathematical reasoning
Abstract（参考訳）: オンラインフォーラムでの数学的内容の共有は、学生や教育者にとって大きな摩擦点である: 生のLATEXを書くことはエラーを起こしやすい、スタンドアロンの光学文字認識ツールはプラットフォーム切替を必要とし、現在のフォーラムソフトウェアは公式の写真からレンダリングされたポストへの統合パスを提供しない。本稿では,LATEX変換パイプラインに直接イメージを埋め込むことで,この摩擦を解消する統一システムを提案する。ユーザは、数学的表現の画像をアップロードまたはキャプチャし、システムは、Mathpix OCR APIを介してルーティングし、返却された出力がLATEXであるか、あるいはインライン数学を含むプレーンテキストであるかを検出し、適切なデリミタ正規化を適用し、投稿がデータベースにコミットされる前に、ライブプレビューをLATEXまたはMarkdownモードでレンダリングする。アーキテクチャは、画像処理、レンダリング、ストレージの3つの疎結合レイヤで構成され、デスクトップクライアントとモバイルクライアントの両方をサポートする。コアメソッドをカバーする仮の米国特許出願が提出された。システム設計、各コンポーネントの詳細、データスキーマ、そして重要な技術革新について説明し、既存のスタンドアロンツールやフォーラムプラットフォームに対して作業を行い、それに近い現実的なギャップを実証します。即時使用性以外にも、この種のデプロイプラットフォームは、数学的問題とステップバイステップソリューションの継続的に成長し、コミュニティに検証されたデータセットであり、正確な数学的推論のためにAIシステムのトレーニングとベンチマークに使用できるリソースである、と私たちは主張する。

関連論文リスト

Model-Native Computing Architecture: Envisioning Future System Architecture Through the Lens of Computer Architecture [3.6606890511372705]
大規模言語モデルは、モデル技術からシステム技術へ移行している。繰り返し発生するエンジニアリング問題は古典的なコンピュータシステムに似ていますコンピュータアーキテクチャから新たなモデルネイティブスタックまでの概念をマッピングします。
論文参考訳（メタデータ） (2026-05-29T19:20:16Z)
VisTIRA: Closing the Image-Text Modality Gap in Visual Math Reasoning via Structured Tool Integration [2.7403985180660784]
視覚言語モデル(VLM)は、同じ問題がテキストではなく画像として提示される場合、数学的推論においてテキストのみの言語モデルより遅れる。本稿では、与えられた数学問題を(画像として)自然言語の有理数に分解することで、構造化された問題解決を可能にするツール統合推論フレームワークであるVisTIRAを紹介する。ツール統合監視により画像ベース推論が向上し,OCRグラウンド化により,より小さなモデルのギャップをさらに狭めることができることを示す。
論文参考訳（メタデータ） (2026-01-20T19:54:49Z)
Simple Vision-Language Math Reasoning via Rendered Text [7.237955967317942]
本稿では,視覚言語モデルを学習し,数学的な問題を解くための軽量で効果的なパイプラインを提案する。この単純なテキスト・ツー・ビジョン拡張により、コンパクトなマルチモーダルアーキテクチャが最先端の推論精度を実現することができる。
論文参考訳（メタデータ） (2025-11-12T15:04:44Z)
MathCanvas: Intrinsic Visual Chain-of-Thought for Multimodal Mathematical Reasoning [58.776297011268845]
本稿では,数学の本質的なVCoT機能を備えた大規模マルチモーダルモデルを実現するための包括的フレームワークを提案する。我々のモデルであるBAGEL-canvasは、強力なLMMベースラインよりも86%の相対的な改善を実現しています。我々の研究は、LMMにおける複雑なヒューマンライクな視覚支援推論をアンロックするためのツールキット・フレームワーク、データセット、ベンチマークを完全提供する。
論文参考訳（メタデータ） (2025-10-16T17:58:58Z)
CodePlot-CoT: Mathematical Visual Reasoning by Thinking with Code-Driven Images [69.93976232543066]
本稿では,コード駆動型Chain-of-ThoughtパラダイムであるCodePlot-CoTを提案する。そこで我々はまず,視覚推論を用いた数学問題のための大規模バイリンガルデータセットとベンチマークであるMath-VRを構築した。我々のモデルは,提案したコード駆動推論パラダイムの有効性を十分に検証し,ベースモデルよりも最大で21%向上する。
論文参考訳（メタデータ） (2025-10-13T17:59:55Z)
PixelCraft: A Multi-Agent System for High-Fidelity Visual Reasoning on Structured Images [58.73779101355669]
PixelCraftは、高忠実度画像処理と、構造化画像に対する柔軟な視覚的推論のための、新しいマルチエージェントシステムである。この基盤の上に構築されたPixelCraftは、ツールの選択、エージェントの議論、自己批判といった3段階の動的なワークフローを通じて、視覚的推論を容易にする。
論文参考訳（メタデータ） (2025-09-29T17:59:49Z)
DEFT: Decompositional Efficient Fine-Tuning for Text-to-Image Models [103.18486625853099]
DEFT(Decompositional Efficient Fine-Tuning)は、事前トレーニングされた重み行列を2つのコンポーネントに分解することで適応する。パーソナライズのためのDreamboothおよびDreambench Plusデータセット、オブジェクトおよびシーン適応のためのInsDetデータセット、ユニバーサル画像生成フレームワークのためのVisualClozeデータセットについて実験を行った。
論文参考訳（メタデータ） (2025-09-26T18:01:15Z)
Table2LaTeX-RL: High-Fidelity LaTeX Code Generation from Table Images via Reinforced Multimodal Language Models [53.03670032402846]
視覚的な入力から,高品質で出版可能なテーブルの再構築を自動化することを目的として,表画像からコード生成への課題に対処する。このタスクの中心的な課題は、大きなサイズ、深くネストされた構造、セマンティックにリッチか不規則かという複雑なテーブルを正確に扱うことである。本稿では,大規模テーブル・トゥ・ラデータセット上で事前学習したMLLMを微調整する,強化型マルチモーダル大規模言語モデル(MLLM)を提案する。
論文参考訳（メタデータ） (2025-09-22T11:13:48Z)
Image deidentification in the XNAT ecosystem: use cases and solutions [0.0]
本稿では,XNATの設備を用いたDICOMデータの同定ワークフローについて述べる。私たちは、以前の経験に基づいて、識別が必要かもしれないさまざまなコンテキストをリストアップします。
論文参考訳（メタデータ） (2025-04-29T11:33:51Z)
SOLIS -- The MLOps journey from data acquisition to actionable insights [62.997667081978825]
本稿では,基本的なクロスプラットフォームテンソルフレームワークとスクリプト言語エンジンを使用しながら,すべての要件をサポートする統合デプロイメントパイプラインとフリー・ツー・オペレートアプローチを提案する。しかし、このアプローチは、実際のプロダクショングレードシステムに機械学習機能を実際にデプロイするために必要な手順やパイプラインを提供していない。
論文参考訳（メタデータ） (2021-12-22T14:45:37Z)
Mapping the Internet: Modelling Entity Interactions in Complex Heterogeneous Networks [0.0]
サンプル表現、モデル定義、トレーニングのための汎用性のある統一フレームワークHMill'を提案します。フレームワークに実装されたモデルによって実現されたすべての関数の集合に対する普遍近似定理の拡張を示す。このフレームワークを使ってサイバーセキュリティドメインから3つの異なる問題を解決する。
論文参考訳（メタデータ） (2021-04-19T21:32:44Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。