Fugu-MT 論文翻訳(概要): Multi-Intent Detection in User Provided Annotations for Programming by Examples Systems

論文の概要: Multi-Intent Detection in User Provided Annotations for Programming by Examples Systems

arxiv url: http://arxiv.org/abs/2307.03966v1
Date: Sat, 8 Jul 2023 12:35:10 GMT
ステータス: 翻訳完了
システム内更新日: 2023-07-11 16:18:37.101784
Title: Multi-Intent Detection in User Provided Annotations for Programming by Examples Systems
Title（参考訳）: 実例システムによるプログラミング用アノテーションのマルチインテント検出
Authors: Nischal Ashok Kumar, Nitin Gupta, Shanmukha Guttula, Hima Patel
Abstract要約: Programming by Example (PBE) は、コンピュータプログラムの自動推論を目標とし、ユーザが提供する入力および出力サンプルからフォーマットまたは文字列変換タスクを達成する技術である。本稿では,入力出力文字列を解析し,複数の目的に責任を負う特性の異なるセットにマッピングする,ディープニューラルネットワークに基づくあいまいさ予測モデルを提案する。
参考スコア（独自算出の注目度）: 3.265146857386153
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In mapping enterprise applications, data mapping remains a fundamental part of integration development, but its time consuming. An increasing number of applications lack naming standards, and nested field structures further add complexity for the integration developers. Once the mapping is done, data transformation is the next challenge for the users since each application expects data to be in a certain format. Also, while building integration flow, developers need to understand the format of the source and target data field and come up with transformation program that can change data from source to target format. The problem of automatic generation of a transformation program through program synthesis paradigm from some specifications has been studied since the early days of Artificial Intelligence (AI). Programming by Example (PBE) is one such kind of technique that targets automatic inferencing of a computer program to accomplish a format or string conversion task from user-provided input and output samples. To learn the correct intent, a diverse set of samples from the user is required. However, there is a possibility that the user fails to provide a diverse set of samples. This can lead to multiple intents or ambiguity in the input and output samples. Hence, PBE systems can get confused in generating the correct intent program. In this paper, we propose a deep neural network based ambiguity prediction model, which analyzes the input-output strings and maps them to a different set of properties responsible for multiple intent. Users can analyze these properties and accordingly can provide new samples or modify existing samples which can help in building a better PBE system for mapping enterprise applications.
Abstract（参考訳）: エンタープライズアプリケーションのマッピングでは、データマッピングは統合開発の基本部分であり続けるが、時間を要する。多くのアプリケーションが命名基準を欠いているため、ネストされたフィールド構造は統合開発者をさらに複雑にします。マッピングが完了すると、各アプリケーションが特定のフォーマットでデータを期待しているため、データ変換がユーザにとって次の課題になります。また、統合フローを構築しながら、開発者はソースとターゲットのデータフィールドのフォーマットを理解し、ソースからターゲットフォーマットへのデータ変更が可能な変換プログラムを考え出す必要がある。いくつかの仕様からプログラム合成パラダイムによる変換プログラムの自動生成の問題が人工知能(AI)の初期から研究されている。 Programming by Example (PBE) は、ユーザが提供する入力および出力サンプルからフォーマットや文字列変換タスクを達成するためのコンピュータプログラムの自動推論をターゲットにした手法である。正しい意図を学習するには、ユーザからの多様なサンプルセットが必要である。しかし、ユーザが多様なサンプルセットを提供できない可能性がある。これは入力と出力のサンプルに複数の意図や曖昧さをもたらす可能性がある。したがって、PBEシステムは正しい意図プログラムを生成する際に混乱する可能性がある。本稿では,入力出力文字列を解析し,複数の目的に責任を負う特性の異なるセットにマッピングする,ディープニューラルネットワークに基づくあいまいさ予測モデルを提案する。ユーザはこれらのプロパティを分析して、新しいサンプルを提供したり、既存のサンプルを変更したりすることで、エンタープライズアプリケーションをマッピングするためのより良いpbeシステムを構築することができる。

関連論文リスト

OpenCodeInstruct: A Large-scale Instruction Tuning Dataset for Code LLMs [62.68905180014956]
我々は,500万の多様なサンプルからなる最大オープンアクセス命令チューニングデータセットであるOpenCodeInstructを紹介した。各サンプルには、プログラミング質問、ソリューション、テストケース、実行フィードバック、LLM生成の品質評価が含まれている。 LLaMAやQwenなど,さまざまなベースモデルを,データセットを使用して複数のスケール(1B+,3B+,7B+)にわたって微調整します。
論文参考訳（メタデータ） (2025-04-05T02:52:16Z)
Conformal Prediction Sets for Deep Generative Models via Reduction to Conformal Regression [7.972619160216404]
入力に対するブラックボックス深部生成モデルから,有効かつ小さな予測セットを生成する問題を考える。我々は、生成予測セット(GPS)と呼ばれる単純で効果的な共形推論アルゴリズムを開発する。 GPSの背後にある重要な洞察は、許容可能な出力を得るのに必要な最小限のサンプル数に対して、分布内の固有の構造を利用することである。
論文参考訳（メタデータ） (2025-03-13T16:16:23Z)
Quantitative Assurance and Synthesis of Controllers from Activity Diagrams [4.419843514606336]
確率的モデル検査は、定性的および定量的な性質を自動検証するために広く用いられている形式的検証手法である。これにより、必要な知識を持っていない研究者やエンジニアにはアクセスできない。本稿では,確率時間の新しいプロファイル,品質アノテーション,3つのマルコフモデルにおけるADの意味論的解釈,アクティビティ図からPRISM言語への変換ルールのセットなど,ADの総合的な検証フレームワークを提案する。最も重要なことは、モデルをベースとした手法を用いて、完全自動検証のための変換アルゴリズムを開発し、QASCADと呼ばれるツールで実装したことです。
論文参考訳（メタデータ） (2024-02-29T22:40:39Z)
Modelling Concurrency Bugs Using Machine Learning [0.0]
このプロジェクトは、一般的な機械学習アプローチと最近の機械学習アプローチを比較することを目的としている。我々は、実生活(同時)プログラムをシミュレートする範囲で生成する合成データセットを定義する。各種機械学習モデルモデルの基本的な限界に関する仮説を定式化する。
論文参考訳（メタデータ） (2023-05-08T17:30:24Z)
PEOPL: Characterizing Privately Encoded Open Datasets with Public Labels [59.66777287810985]
プライバシとユーティリティのための情報理論スコアを導入し、不誠実なユーザの平均パフォーマンスを定量化する。次に、ランダムなディープニューラルネットワークの使用を動機付ける符号化スキームのファミリーを構築する際のプリミティブを理論的に特徴づける。
論文参考訳（メタデータ） (2023-03-31T18:03:53Z)
Dataset Interfaces: Diagnosing Model Failures Using Controllable Counterfactual Generation [85.13934713535527]
分散シフトは、機械学習モデルの主要な障害源である。入力データセットとユーザが指定したシフトを与えられたフレームワークは、望ましいシフトを示すインスタンスを返す。本稿では,このデータセットインターフェースをImageNetデータセットに適用することにより,分散シフトの多種多様さにまたがるモデル動作の学習が可能になることを示す。
論文参考訳（メタデータ） (2023-02-15T18:56:26Z)
EGG-GAE: scalable graph neural networks for tabular data imputation [8.775728170359024]
本稿では,データ計算に欠ける新しいEdGe生成グラフオートエンコーダ(EGG-GAE)を提案する。 EGG-GAEは、入力データのランダムにサンプリングされたミニバッチで動作し、各アーキテクチャ層におけるミニバッチ間の接続性を自動的に推測する。
論文参考訳（メタデータ） (2022-10-19T10:26:17Z)
Conditional Generation with a Question-Answering Blueprint [84.95981645040281]
我々は、条件生成を不透明にし、より根底的にレンダリングするための有用な中間表現としてのプランニングを提唱する。我々は、最先端の質問生成技術を利用して、自動的に青写真を得る。我々はTransformerベースのモデルを開発し、それぞれが生成した出力にブループリントを組み込む方法が異なる。
論文参考訳（メタデータ） (2022-07-01T13:10:19Z)
BatchFormer: Learning to Explore Sample Relationships for Robust Representation Learning [93.38239238988719]
本稿では,各ミニバッチからサンプル関係を学習可能なディープニューラルネットワークを提案する。 BatchFormerは各ミニバッチのバッチ次元に適用され、トレーニング中のサンプル関係を暗黙的に探索する。我々は10以上のデータセットに対して広範な実験を行い、提案手法は異なるデータ不足アプリケーションにおいて大幅な改善を実現する。
論文参考訳（メタデータ） (2022-03-03T05:31:33Z)
Unsupervised Domain Adaptive Learning via Synthetic Data for Person Re-identification [101.1886788396803]
人物再識別(re-ID)は、ビデオ監視に広く応用されているため、ますます注目を集めている。残念なことに、主流のディープラーニング手法では、モデルをトレーニングするために大量のラベル付きデータが必要です。本稿では,コンピュータゲーム内で合成されたre-IDサンプルを自動的に生成するデータコレクタを開発し,同時にアノテートするデータラベラを構築した。
論文参考訳（メタデータ） (2021-09-12T15:51:41Z)
Visual Neural Decomposition to Explain Multivariate Data Sets [13.117139248511783]
多次元データセットにおける変数間の関係を調べることは、データアナリストとエンジニアにとって共通の課題である。本稿では,入力変数と対象変数との相関関係を可視化する新しい手法を提案する。
論文参考訳（メタデータ） (2020-09-11T15:53:37Z)
Information-theoretic User Interaction: Significant Inputs for Program Synthesis [11.473616777800318]
重要質問問題を導入し、一般には困難であることを示す。我々はその問題を解決するための情報理論の欲求的アプローチを開発する。対話型プログラム合成の文脈では、上記の結果を用いてプログラム学習者を開発する。私たちのアクティブな学習者は、偽陰性と偽陽性をトレードオフし、現実のデータセット上で少数の反復に収束することができます。
論文参考訳（メタデータ） (2020-06-22T21:46:40Z)
Synthetic Datasets for Neural Program Synthesis [66.20924952964117]
本稿では,プログラムと仕様の両方で合成データ分布のバイアスを制御し,評価するための新しい手法を提案する。そこで我々は,Karel DSLと小さなCalculator DSLを用いて,これらの分布上でのディープネットワークのトレーニングにより,分散一般化性能が向上することが実証された。
論文参考訳（メタデータ） (2019-12-27T21:28:10Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。