論文の概要: Parsing Fortran-77 with proprietary extensions
- arxiv url: http://arxiv.org/abs/2309.02019v1
- Date: Tue, 5 Sep 2023 07:54:02 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-23 09:16:57.814668
- Title: Parsing Fortran-77 with proprietary extensions
- Title(参考訳): プロプライエタリな拡張を備えたParsing Fortran-77
- Authors: Younoussa Sow, Larisa Safina, L\'eandre Brault, Papa Ibou Diouf,
St\'ephane Ducasse, Nicolas Anquetil
- Abstract要約: 多くの組織は、"obsolete"プログラミング言語で書かれた古いコードに依存しています。
これらの"ベテランの言語"を扱うことの難しさのひとつは、ソースコードを解析して、その表現を構築することだ。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Far from the latest innovations in software development, many organizations
still rely on old code written in "obsolete" programming languages. Because
this source code is old and proven it often contributes significantly to the
continuing success of these organizations. Yet to keep the applications
relevant and running in an evolving environment, they sometimes need to be
updated or migrated to new languages or new platforms. One difficulty of
working with these "veteran languages" is being able to parse the source code
to build a representation of it. Parsing can also allow modern software
development tools and IDEs to offer better support to these veteran languages.
We initiated a project between our group and the Framatome company to help
migrate old Fortran-77 with proprietary extensions (called Esope) into more
modern Fortran. In this paper, we explain how we parsed the Esope language with
a combination of island grammar and regular parser to build an abstract syntax
tree of the code.
- Abstract(参考訳): ソフトウェア開発における最新のイノベーションとは程遠いが、多くの組織はいまだに"obsolete"プログラミング言語で記述された古いコードに依存している。
このソースコードは古くて証明されているので、組織の継続的な成功に大きく貢献することが多い。
しかし、アプリケーションを関連づけて、進化する環境で動かすためには、更新や新しい言語や新しいプラットフォームへの移行が必要になることがある。
これらの"獣言語"を扱うことの難しさのひとつは、ソースコードを解析してその表現を構築することだ。
パーシングにより、現代のソフトウェア開発ツールやIDEがこれらのベテラン言語をより良くサポートできる。
私たちは、私たちのグループとFramatome社の間のプロジェクトを開始し、古いFortran-77をプロプライエタリな拡張(Esopeと呼ばれる)で、より現代的なFortranへの移行を支援しました。
本稿では,esope言語を島文法と正規構文解析器の組み合わせで解析し,コードの抽象構文木を構築する方法について述べる。
関連論文リスト
- StmtTree: An Easy-to-Use yet Versatile Fortran Transformation Toolkit [7.477012296839271]
私たちはこの問題に対処するための新しいFortranコード変換ツールキットであるStmtTreeを紹介します。
StmtTreeはFortran文法をステートメントツリーに抽象化し、低レベル表現操作APIと、高レベルで使いやすいクエリとミニ言語操作の両方を提供する。
実験によると、StmtTreeはレガシーなFortran-77コードによく適応しており、未使用のステートメントを削除するなどの複雑なツールは100行未満のpythonコードで開発することができる。
論文 参考訳(メタデータ) (2024-07-08T06:23:13Z) - Transforming C++11 Code to C++03 to Support Legacy Compilation Environments [1.6851123188451185]
我々は、C++11標準に従って書かれたコードを、機能的に等価なC++03変種に自動的にバックポートする、ソースコード変換フレームワークを作成します。
本稿では,トランスフォーメーションエンジンの技術的詳細と,大規模な2つのコードベースと4つのオープンソースシステムに適用した経験について報告する。
論文 参考訳(メタデータ) (2024-05-12T08:02:21Z) - CodeGRAG: Bridging the Gap between Natural Language and Programming Language via Graphical Retrieval Augmented Generation [58.84212778960507]
我々は,LLMの性能を高めるため,グラフィカル検索拡張コード生成フレームワークであるCodeGRAGを提案する。
CodeGRAGは、制御フローとデータフローに基づいて、コードブロックのグラフィカルなビューを構築し、プログラミング言語と自然言語のギャップを埋める。
ハードメタグラフプロンプト、ソフトプロンプト技術、事前訓練されたGNN専門家の目的の有効性を検証するために、C++言語とピソン言語の両方を含む4つのデータセットで様々な実験と改善が行われた。
論文 参考訳(メタデータ) (2024-05-03T02:48:55Z) - IRCoder: Intermediate Representations Make Language Models Robust Multilingual Code Generators [49.903001442804594]
本研究では、コンパイラ中間表現(IR)を活用して、Code-LMの多言語機能を改善する可能性について検討する。
まず,約400万のソースコードファイルからなる並列データセットであるSLTransをコンパイルする。
次に、SLTransにおける因果言語モデリングトレーニングを継続して実施し、Code-LMはIR言語を学習せざるを得なかった。
IRCoderと呼ばれる結果のモデルは、さまざまなコード生成タスクやメトリクスに対して、サイズと一貫性のあるゲインを表示します。
論文 参考訳(メタデータ) (2024-03-06T17:52:08Z) - ChatDev: Communicative Agents for Software Development [84.90400377131962]
ChatDevはチャットを利用したソフトウェア開発フレームワークで、特別なエージェントがコミュニケーション方法についてガイドされる。
これらのエージェントは、統一された言語ベースのコミュニケーションを通じて、設計、コーディング、テストフェーズに積極的に貢献する。
論文 参考訳(メタデータ) (2023-07-16T02:11:34Z) - COMEX: A Tool for Generating Customized Source Code Representations [7.151800146054561]
COMEXは、研究者と開発者が複数のコードビューを作成し、組み合わせることを可能にするフレームワークである。
プロシージャ内スニペットとプロシージャ間スニペットの両方を使用して、メソッドレベルのスニペットとプログラムレベルのスニペットの両方を分析することができる。
これは40以上の言語をサポートする、広く使われているインクリメンタル分析ツールであるtree-sitter上に構築されている。
論文 参考訳(メタデータ) (2023-07-10T16:46:34Z) - CodeGeeX: A Pre-Trained Model for Code Generation with Multilingual Benchmarking on HumanEval-X [50.008474888951525]
コード生成に130億のパラメータを持つ多言語モデルであるCodeGeeXを紹介する。
CodeGeeXは、23のプログラミング言語の8500億のトークンで事前訓練されている。
論文 参考訳(メタデータ) (2023-03-30T17:34:01Z) - MCoNaLa: A Benchmark for Code Generation from Multiple Natural Languages [76.93265104421559]
英語以外の自然言語コマンドからコード生成をベンチマークします。
スペイン語,日本語,ロシア語の3言語で896個のNLコードペアを注釈した。
難易度はこれらの3つの言語によって異なるが、全てのシステムは英語にかなり遅れている。
論文 参考訳(メタデータ) (2022-03-16T04:21:50Z) - Toward Modern Fortran Tooling and a Thriving Developer Community [0.0]
Fortranは最も古いハイレベルプログラミング言語であり、現在も使われている。
計算集約的な科学と工学の応用に使用される支配的な言語の1つである。
本稿では、現在までの進捗状況を報告し、次の手順を概説する。
論文 参考訳(メタデータ) (2021-09-15T15:43:06Z) - On the Evolution of Programming Languages [0.0]
新しい言語が以前の言語よりも堅牢であるという支持的な証拠を与えようとしている。
既存の言語の特徴がどのように新しいプログラミング言語の開発に影響を与えたかを強調した、最も顕著なプログラミング言語の分析結果が提示される。
最終的には、新しいマルチコアアーキテクチャの時代にプログラミング言語の世界を支配しうる実験的な言語のセットを提案する。
論文 参考訳(メタデータ) (2020-06-27T10:18:14Z) - Incorporating External Knowledge through Pre-training for Natural
Language to Code Generation [97.97049697457425]
オープンドメインコード生成は、自然言語(NL)の意図から汎用プログラミング言語でコードを生成することを目的としている。
オンラインプログラミングQAフォーラムStackOverflowとプログラミング言語APIドキュメントからNL-codeペアを自動的にマイニングする。
評価の結果,2つのソースとデータ拡張と検索ベースデータ再サンプリングを組み合わせることで,コード生成テストベッドCoNaLa上でのBLEUスコアが最大2.2%向上することがわかった。
論文 参考訳(メタデータ) (2020-04-20T01:45:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。