論文の概要: CrossTL: A Universal Programming Language Translator with Unified Intermediate Representation
- arxiv url: http://arxiv.org/abs/2508.21256v1
- Date: Thu, 28 Aug 2025 23:00:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-01 19:45:10.896863
- Title: CrossTL: A Universal Programming Language Translator with Unified Intermediate Representation
- Title(参考訳): CrossTL: 中間表現を統一したユニバーサルプログラミング言語トランスレータ
- Authors: Nripesh Niketan, Vaatsalya Shrivastva,
- Abstract要約: 複数の言語間の双方向翻訳が可能な汎用プログラミング言語であるCrossTLを提案する。
ソースコードをASTに変換する言語固有のレキサ/パーザ,双方向のCrossGL翻訳モジュール。
プログラム領域をまたいで包括的な評価を行い、すべてのバックエンドでコンパイルと実行を成功させる効果を実証する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present CrossTL, a universal programming language translator enabling bidirectional translation between multiple languages through a unified intermediate representation called CrossGL. Traditional approaches require separate translators for each language pair, leading to exponential complexity growth. CrossTL uses a single universal IR to facilitate translations between CUDA, HIP, Metal, DirectX HLSL, OpenGL GLSL, Vulkan SPIR-V, Rust, and Mojo, with Slang support in development. Our system consists of: language-specific lexers/parsers converting source code to ASTs, bidirectional CrossGL translation modules implementing ToCrossGLConverter classes for importing code and CodeGen classes for target generation, and comprehensive backend implementations handling full translation pipelines. We demonstrate effectiveness through comprehensive evaluation across programming domains, achieving successful compilation and execution across all supported backends. The universal IR design enables adding new languages with minimal effort, requiring only language-specific frontend/backend components. Our contributions include: (1) a unified IR capturing semantics of multiple programming paradigms, (2) a modular architecture enabling extensibility, (3) a comprehensive framework supporting GPU compute, graphics programming, and systems languages, and (4) empirical validation demonstrating practical viability of universal code translation. CrossTL represents a significant step toward language-agnostic programming, enabling write-once, deploy-everywhere development.
- Abstract(参考訳): そこで我々は,CrossGLと呼ばれる中間表現を通じて,多言語間の双方向翻訳を可能にする汎用言語トランスレータであるCrossTLを提案する。
従来のアプローチでは、言語ペアごとに別々の翻訳子が必要であるため、指数関数的な複雑性が増大する。
CrossTLはCUDA、HIP、Metal、DirectX HLSL、OpenGL GLSL、Vulkan SPIR-V、Rust、Mojo間の翻訳を容易にするために単一のユニバーサルIRを使用している。
我々のシステムは、ソースコードをASTに変換する言語固有のレキサ/パーザ、コードとターゲット生成のためのCodeGenクラスをインポートするToCrossGLConverterクラスを実装する双方向のクロスGLトランスフォーメーションモジュール、完全なトランスフォーメーションパイプラインを扱う包括的なバックエンド実装からなる。
プログラム領域全体にわたる包括的な評価を通じて,すべてのサポート対象のバックエンドに対して,コンパイルと実行を成功させる効果を実証する。
ユニバーサルIR設計により、最小限の労力で新しい言語を追加でき、言語固有のフロントエンド/バックエンドコンポーネントのみを必要とする。
コントリビューションには,(1)複数のプログラミングパラダイムの統一IRキャプチャセマンティクス,(2)拡張性を実現するモジュールアーキテクチャ,(3)GPU計算,グラフィックスプログラミング,システム言語をサポートする包括的なフレームワーク,(4)ユニバーサルコード翻訳の実用性を示す実証的検証などが含まれている。
CrossTLは言語に依存しないプログラミングへの重要なステップであり、書き込みオンスでデプロイ可能な開発を可能にする。
関連論文リスト
- Guaranteed Guess: A Language Modeling Approach for CISC-to-RISC Transpilation with Testing Guarantees [0.03994567502796063]
GG(Guaranteed Guess)は、事前学習された大規模言語モデルの翻訳能力と、確立されたソフトウェアテスト構造の厳密さを組み合わせた、ISA中心のトランスパイレーションパイプラインである。
提案手法は,あるISAから別のISAへのLSMを用いた候補翻訳を生成し,ソフトウェアテストフレームワークにそのような翻訳を組み込んで,翻訳の量的信頼性を構築する。
我々は、2つの多様なデータセットに対するGGアプローチを評価し、ユニットテストに高いコードカバレッジ(>98%)を強制し、HumanEvalプログラムで99%、BringupBenchプログラムで49%の関数的/意味的正当性を達成した。
論文 参考訳(メタデータ) (2025-06-17T15:06:54Z) - CodeGRAG: Bridging the Gap between Natural Language and Programming Language via Graphical Retrieval Augmented Generation [58.84212778960507]
CodeGRAGは、制御フローとそれらのデータフローに基づいて、コードブロックのグラフィカルなビューを構築し、プログラミングドメインの知識をよりよく解釈する。
CodeGRAGはLLMのコード生成能力を大幅に改善し、言語間コード生成のパフォーマンス向上も実現している。
論文 参考訳(メタデータ) (2024-05-03T02:48:55Z) - Forklift: An Extensible Neural Lifter [11.633770744027682]
トークンレベルのエンコーダ-デコーダ変換器を用いて,アセンブリをLLVM IRに変換する方法を学ぶ最初のニューラルリフトであるForkliftを提案する。
並列なLLVM IR、x86、ARM、RISC-Vプログラムをコンパイラや最適化レベルにわたって収集し、Forkliftをトレーニングし、入出力ベースの精度ハーネスをセットアップします。
我々は、Forkliftを2つの挑戦的なベンチマークスイートで評価し、最先端の手書きリフタよりも2.5倍、GPT-4より4.4倍のx86プログラムを翻訳し、新しいISAからの翻訳を可能にした。
論文 参考訳(メタデータ) (2024-04-01T17:27:58Z) - IRCoder: Intermediate Representations Make Language Models Robust Multilingual Code Generators [49.903001442804594]
本研究では、コンパイラ中間表現(IR)を活用して、Code-LMの多言語機能を改善する可能性について検討する。
まず,約400万のソースコードファイルからなる並列データセットであるSLTransをコンパイルする。
次に、SLTransにおける因果言語モデリングトレーニングを継続して実施し、Code-LMはIR言語を学習せざるを得なかった。
IRCoderと呼ばれる結果のモデルは、さまざまなコード生成タスクやメトリクスに対して、サイズと一貫性のあるゲインを表示します。
論文 参考訳(メタデータ) (2024-03-06T17:52:08Z) - Cross-Lingual Transfer with Target Language-Ready Task Adapters [66.5336029324059]
MAD-Xフレームワークの拡張であるBAD-Xは、MAD-Xのモジュラリティを犠牲にして転送を改善する。
我々は、ターゲット言語に適応したタスクアダプタを微調整することで、両方の世界を最大限に活用することを目指している。
論文 参考訳(メタデータ) (2023-06-05T10:46:33Z) - ERNIE-UniX2: A Unified Cross-lingual Cross-modal Framework for
Understanding and Generation [40.376625939658354]
ERNIE-UniX2は、タスクの生成と理解の両方のための言語間事前トレーニングフレームワークである。
ERNIE-UniX2はエンコーダ-デコーダアーキテクチャに基づく複数の事前学習パラダイムを統合している。
ERNIE-UniX2は、下流タスクの生成と理解のためにシームレスに微調整できる。
論文 参考訳(メタデータ) (2022-11-09T13:06:58Z) - VECO: Variable and Flexible Cross-lingual Pre-training for Language
Understanding and Generation [77.82373082024934]
我々はTransformerエンコーダにクロスアテンションモジュールを挿入し、言語間の相互依存を明確に構築する。
独自の言語でコンテキストにのみ条件付けされたマスク付き単語の予測の退化を効果的に回避することができる。
提案した言語間モデルでは,XTREMEベンチマークのさまざまな言語間理解タスクに対して,最先端の新たな結果が提供される。
論文 参考訳(メタデータ) (2020-10-30T03:41:38Z) - MAD-X: An Adapter-Based Framework for Multi-Task Cross-Lingual Transfer [136.09386219006123]
我々は、任意のタスクや言語への高いポータビリティとパラメータ効率の移行を可能にするアダプタベースのフレームワークであるMAD-Xを提案する。
MAD-Xは、名前付きエンティティ認識と因果コモンセンス推論に基づいて、タイプボロジーに多様性のある言語群を横断する言語間移動において、芸術の状態を上回ります。
論文 参考訳(メタデータ) (2020-04-30T18:54:43Z) - Multilingual Machine Translation: Closing the Gap between Shared and
Language-specific Encoder-Decoders [20.063065730835874]
最先端の多言語機械翻訳はユニバーサルエンコーダデコーダに依存している。
本稿では,言語固有のエンコーダデコーダに基づく代替手法を提案する。
論文 参考訳(メタデータ) (2020-04-14T15:02:24Z) - Bi-Decoder Augmented Network for Neural Machine Translation [108.3931242633331]
本稿では,ニューラルマシン翻訳タスクのためのBi-Decoder Augmented Network (BiDAN)を提案する。
各デコーダは入力されたテキストの表現を対応する言語に変換するため、2つの目的語と共同でトレーニングすることで、共有エンコーダは言語に依存しない意味空間を生成することができる。
論文 参考訳(メタデータ) (2020-01-14T02:05:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。