Fugu-MT 論文翻訳(概要): The impact of lexical and grammatical processing on generating code from natural language

論文の概要: The impact of lexical and grammatical processing on generating code from natural language

arxiv url: http://arxiv.org/abs/2202.13972v1
Date: Mon, 28 Feb 2022 17:23:30 GMT
ステータス: 翻訳完了
システム内更新日: 2022-03-01 18:53:42.762619
Title: The impact of lexical and grammatical processing on generating code from natural language
Title（参考訳）: 語彙処理と文法処理が自然言語からのコード生成に及ぼす影響
Authors: Nathana\"el Beau and Beno\^it Crabb\'e
Abstract要約: 我々は、BERTエンコーダと形式化を提供する文法ベースのデコーダに依存する最先端アーキテクチャを用いている。本稿では,現在の自然言語からコードシステムへの語彙置換コンポーネントの重要性を強調した。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Considering the seq2seq architecture of TranX for natural language to code translation, we identify four key components of importance: grammatical constraints, lexical preprocessing, input representations, and copy mechanisms. To study the impact of these components, we use a state-of-the-art architecture that relies on BERT encoder and a grammar-based decoder for which a formalization is provided. The paper highlights the importance of the lexical substitution component in the current natural language to code systems.
Abstract（参考訳）: 自然言語からコード翻訳のためのTranXのSeq2seqアーキテクチャを考えると、文法的制約、語彙前処理、入力表現、コピー機構の4つの重要な要素を識別する。これらのコンポーネントの影響を調べるために、BERTエンコーダと形式化を提供する文法ベースのデコーダに依存する最先端アーキテクチャを用いる。本稿では,現在の自然言語からコードシステムへの語彙置換コンポーネントの重要性を強調した。

関連論文リスト

Data2Concept2Text: An Explainable Multilingual Framework for Data Analysis Narration [42.95840730800478]
本稿では,データの集合を解釈し,基礎となる特徴を抽象化し,それを自然言語で記述する,完全な説明可能なシステムを提案する。このシステムは、2つの重要な段階に依存している: (i)データから出現する特性を識別し、それらを抽象概念に変換する、(ii)これらの概念を自然言語に変換する。
論文参考訳（メタデータ） (2025-02-13T11:49:48Z)
How Important Is Tokenization in French Medical Masked Language Models? [7.866517623371908]
自然言語処理(NLP)分野において,サブワードトークン化が主流となっている。本稿では,フランス生物医学領域におけるサブワードトークン化の複雑さを,多種多様なNLPタスクにまたがって探究する。従来のトークン化手法に形態素に富んだ単語セグメンテーションを統合するオリジナルトークン化戦略を導入する。
論文参考訳（メタデータ） (2024-02-22T23:11:08Z)
Benchmarking Language Models for Code Syntax Understanding [79.11525961219591]
事前学習された言語モデルは、自然言語処理とプログラム理解の両方において素晴らしい性能を示している。本研究では,プログラムの構文構造を特定するための,最先端の事前訓練モデルの最初の徹底的なベンチマークを行う。この結果から,既存のプログラミング言語の事前学習手法の限界が指摘され,構文構造をモデル化することの重要性が示唆された。
論文参考訳（メタデータ） (2022-10-26T04:47:18Z)
The Whole Truth and Nothing But the Truth: Faithful and Controllable Dialogue Response Generation with Dataflow Transduction and Constrained Decoding [65.34601470417967]
本稿では,ニューラルネットワークモデリングとルールベース生成の強みを組み合わせた対話応答生成のためのハイブリッドアーキテクチャについて述べる。本実験により, 本システムは, 流布性, 妥当性, 真理性の評価において, ルールベースおよび学習的アプローチの両方に優れることがわかった。
論文参考訳（メタデータ） (2022-09-16T09:00:49Z)
Multilingual Extraction and Categorization of Lexical Collocations with Graph-aware Transformers [86.64972552583941]
我々は,グラフ対応トランスフォーマアーキテクチャにより拡張されたBERTに基づくシーケンスタグ付けモデルを提案し,コンテキストにおけるコロケーション認識の課題について評価した。以上の結果から, モデルアーキテクチャにおける構文的依存関係を明示的に符号化することは有用であり, 英語, スペイン語, フランス語におけるコロケーションのタイプ化の差異について考察する。
論文参考訳（メタデータ） (2022-05-23T16:47:37Z)
Example-Based Machine Translation from Text to a Hierarchical Representation of Sign Language [1.3999481573773074]
本稿では,テキスト・トゥ・サイン翻訳の原本について述べる。これは、AZeeにおける手話ビデオのテキストと階層的な形式記述の間のアライメントのドメイン固有の並列コーパスを使用して、データの不足を補う。提案アルゴリズムは、ソーステキストに存在する類似性の検出に基づいて、整列セグメントのマッチングと置換を利用して、複数の候補翻訳を構築する。結果として得られる翻訳は、アバターシステムへの入力として使用されるように設計されたAZee式(英語版)の形式である。
論文参考訳（メタデータ） (2022-05-06T15:48:43Z)
Evaluating the Morphosyntactic Well-formedness of Generated Texts [88.20502652494521]
L'AMBRE – テキストのモルフォシンタク的整形性を評価する指標を提案する。形態的に豊かな言語に翻訳するシステムのダイアクロニックスタディを通じて,機械翻訳作業におけるメトリックの有効性を示す。
論文参考訳（メタデータ） (2021-03-30T18:02:58Z)
SG-Net: Syntax Guided Transformer for Language Representation [58.35672033887343]
本稿では,言語的動機づけのある単語表現のための明示的な構文制約をアテンション機構に組み込むことにより,テキストモデリングの指導に構文を用いることを提案する。詳細は、自己注意ネットワーク(SAN)が支援するTransformerベースのエンコーダについて、SANにSDOI設計の構文依存性を導入し、構文誘導型自己注意型SDOI-SANを形成する。機械読解、自然言語推論、ニューラルネットワーク翻訳などの一般的なベンチマークタスクの実験は、提案したSG-Net設計の有効性を示している。
論文参考訳（メタデータ） (2020-12-27T11:09:35Z)
New Approaches for Natural Language Understanding based on the Idea that Natural Language encodes both Information and its Processing Procedures [0.7868449549351486]
本研究では,NLUの実用的,理論的基礎および研究手法について述べる。また、人工知能(AI)領域における大規模かつ多種類の情報処理にも適用することができる。
論文参考訳（メタデータ） (2020-10-24T05:40:47Z)
Hierarchical Poset Decoding for Compositional Generalization in Language [52.13611501363484]
出力が部分的に順序付けられた集合(命題)である構造化予測タスクとして人間の言語理解を形式化する。現在のエンコーダ・デコーダアーキテクチャは意味論のポーズ構造を適切に考慮していない。本稿では,言語における合成一般化のための新しい階層型ポーズデコーディングパラダイムを提案する。
論文参考訳（メタデータ） (2020-10-15T14:34:26Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。