論文の概要: Classifier-Augmented Generation for Structured Workflow Prediction
- arxiv url: http://arxiv.org/abs/2510.12825v1
- Date: Fri, 10 Oct 2025 18:38:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-16 20:13:28.334439
- Title: Classifier-Augmented Generation for Structured Workflow Prediction
- Title(参考訳): 構造化ワークフロー予測のための分類器拡張生成
- Authors: Thomas Gschwind, Shramona Chakraborty, Nitin Gupta, Sameep Mehta,
- Abstract要約: 本稿では,自然言語記述を実行可能なものに翻訳するシステムを提案する。
フローの構造と詳細な構成の両方を自動的に予測する。
これは、ステージ予測、エッジレイアウト、および自然駆動オーサリングのためのプロパティ生成にまたがって詳細な評価を行う最初のシステムである。
- 参考スコア(独自算出の注目度): 5.92079054629498
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: ETL (Extract, Transform, Load) tools such as IBM DataStage allow users to visually assemble complex data workflows, but configuring stages and their properties remains time consuming and requires deep tool knowledge. We propose a system that translates natural language descriptions into executable workflows, automatically predicting both the structure and detailed configuration of the flow. At its core lies a Classifier-Augmented Generation (CAG) approach that combines utterance decomposition with a classifier and stage-specific few-shot prompting to produce accurate stage predictions. These stages are then connected into non-linear workflows using edge prediction, and stage properties are inferred from sub-utterance context. We compare CAG against strong single-prompt and agentic baselines, showing improved accuracy and efficiency, while substantially reducing token usage. Our architecture is modular, interpretable, and capable of end-to-end workflow generation, including robust validation steps. To our knowledge, this is the first system with a detailed evaluation across stage prediction, edge layout, and property generation for natural-language-driven ETL authoring.
- Abstract(参考訳): IBM DataStageのようなETL(Extract, Transform, Load)ツールは、複雑なデータワークフローを視覚的に組み立てることができますが、ステージとプロパティの設定には時間がかかり、深いツール知識が必要です。
本稿では,自然言語記述を実行可能なワークフローに変換し,フローの構造と詳細な構成の両方を自動的に予測するシステムを提案する。
その中核には、発話分解を分類器と組み合わせた分類器-拡張生成(CAG)アプローチがあり、ステージ固有の少数ショットプロンプトが正確なステージ予測を生成する。
これらのステージはエッジ予測を用いて非線形ワークフローに接続され、サブ発話コンテキストからステージ特性が推測される。
高い単発・エージェントベースラインに対してCAGを比較し,トークン使用量を大幅に削減し,精度と効率を向上した。
私たちのアーキテクチャはモジュール化され、解釈可能で、堅牢な検証ステップを含むエンドツーエンドのワークフロー生成が可能です。
我々の知る限り、これは自然言語駆動ETLオーサリングのためのステージ予測、エッジレイアウト、プロパティ生成にまたがって詳細な評価を行う最初のシステムである。
関連論文リスト
- Operationalization of Machine Learning with Serverless Architecture: An Industrial Operationalization of Machine Learning with Serverless Architecture: An Industrial Implementation for Harmonized System Code Prediction [0.0]
本稿では、データ取り込み、トレーニング、デプロイメント、監視、再トレーニングからイベント駆動パイプラインとマネージドサービスまで、完全なMLライフサイクルをオーケストレーションするサーバレスMLOpsフレームワークを提案する。
本研究では,グローバル取引において税関当局が使用する標準化コードに,短い非構造化製品記述をマッピングするコンプライアンスクリティカルなタスクである,調和システム(HS)コード予測の産業的実装を通じて,実践的適用性を実証する。
私たちのソリューションは、複数のディープラーニングアーキテクチャを埋め込んだカスタムテキストを使用します。
論文 参考訳(メタデータ) (2026-02-19T05:59:55Z) - Autonomous Data Processing using Meta-Agents [2.3732259124656907]
我々はメタエージェント(ADP-MA)を用いたtextbf Autonomous Data Processingを提案し,データ処理パイプラインを動的に構築し,実行し,反復的に洗練するフレームワークを提案する。
ADP-MAは、コンテキスト対応の最適化、適応的なワークロード分割、拡張性のためのプログレッシブサンプリングを強調している。
ADP-MAはパイプライン構築、実行監視、代表データ処理タスク間の適応的な改善を示すインタラクティブなデモを通じてデモを行う。
論文 参考訳(メタデータ) (2026-01-30T20:58:17Z) - Cluster Workload Allocation: Semantic Soft Affinity Using Natural Language Processing [0.0]
本稿では,自然言語処理を用いたクラスタシステムのためのセマンティックな意図駆動型スケジューリングパラダイムを提案する。
このシステムは、スケジューラ拡張子を介して統合されたLarge Language Cluster Model (LLM)を使用して、ソフトアフィニティの好みに対する自然言語アロケーションヒントアノテーションを解釈する。
論文 参考訳(メタデータ) (2026-01-14T08:36:21Z) - Eliminating Agentic Workflow for Introduction Generation with Parametric Stage Tokens [3.6588919376939733]
我々は外部エージェントを排除して研究紹介を書くことを提案する。
代わりに、我々はそれらの論理構造を大きな言語モデルにパラメータ化します。
これにより、単一の推論で完全な導入が生成される。
論文 参考訳(メタデータ) (2025-12-28T12:51:36Z) - How Different Tokenization Algorithms Impact LLMs and Transformer Models for Binary Code Analysis [0.0]
その重要性にもかかわらず、アセンブリコードのコンテキストにおけるトークン化は未探索領域のままである。
我々は、アセンブリコードのユニークな特徴に合わせて、プリプロセスのカスタマイズオプションとプリトークン化ルールについて検討する。
我々は,トークン化効率,語彙圧縮,組立符号の表現忠実度に基づくトークン化器の比較を行った。
論文 参考訳(メタデータ) (2025-11-05T19:45:26Z) - A Framework for Quantifying How Pre-Training and Context Benefit In-Context Learning [52.07397258423034]
現実的な設定のクラスにおいて,ICLの性能を解析するための新しいフレームワークを提案する。
我々は、ICL性能と文脈長、および事前訓練と問合せタスク分布のKL分散の正確な関係を導出する。
論文 参考訳(メタデータ) (2025-10-26T09:21:29Z) - Context-level Language Modeling by Learning Predictive Context Embeddings [79.00607069677393]
textbfContextLMは、固有のtextbfnext-context予測目標で標準事前学習を強化するフレームワークである。
このメカニズムは、将来のトークンチャンクから派生したエラー信号を利用して、マルチトークンコンテキストの予測表現を学ぶようモデルを訓練する。
GPT2およびPythiaモデルファミリーの実験では、1.5ドルBのパラメータまでスケールし、ContextLMがパープレキシティとダウンストリームのタスクパフォーマンスの両方で一貫した改善を提供することを示した。
論文 参考訳(メタデータ) (2025-10-23T07:09:45Z) - ContextNav: Towards Agentic Multimodal In-Context Learning [85.05420047017513]
ContextNavは、自動検索のスケーラビリティと人間のようなキュレーションの品質と適応性を統合するエージェントフレームワークである。
リソースを意識したマルチモーダル埋め込みパイプラインを構築し、検索可能なベクトルデータベースを維持し、エージェント検索と構造アライメントを適用して、ノイズ耐性のあるコンテキストを構築する。
実験の結果、ContextNavはさまざまなデータセットで最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-10-06T07:49:52Z) - AgenticIE: An Adaptive Agent for Information Extraction from Complex Regulatory Documents [1.338174941551702]
EUの規制により義務付けられ、建設製品の性能を認定する文書(DoP)の宣言。
自動キー値ペア抽出(KVP)と質問応答(QA)によって、DoPと人間をアクセス可能にするには2つの課題がある。
論文 参考訳(メタデータ) (2025-09-15T10:53:05Z) - Leveraging Machine Learning and Enhanced Parallelism Detection for BPMN Model Generation from Text [75.77648333476776]
本稿では、テキストからBPMNモデルを抽出する自動パイプラインについて紹介する。
この研究の重要な貢献は、新たに注釈付けされたデータセットの導入である。
モデルトレーニング用の32のパラレルゲートウェイを含む15の注釈付き文書でデータセットを増強する。
論文 参考訳(メタデータ) (2025-07-11T07:25:55Z) - Dynamic Chunking for End-to-End Hierarchical Sequence Modeling [17.277753030570263]
本稿では,コンテンツとコンテキストに依存したセグメンテーション戦略を自動的に学習する動的チャンキング機構を実現する手法を提案する。
これを明示的な階層ネットワーク(H-Net)に組み込むことで、(単純に階層的な)トークン化-LM-detokenizationパイプラインを、完全にエンドツーエンドに学習した単一のモデルに置き換えることができる。
階層を複数のステージに反復すると、複数の抽象化レベルをモデル化することで、そのパフォーマンスがさらに向上する。
英語で事前訓練されたH-Netは、文字レベルの堅牢性を大幅に向上させ、意味のあるデータ依存のチャンキング戦略を、明確な監督なしに質的に学習する。
論文 参考訳(メタデータ) (2025-07-10T17:39:37Z) - Agentic Predictor: Performance Prediction for Agentic Workflows via Multi-View Encoding [56.565200973244146]
Agentic Predictorは、効率的なエージェントワークフロー評価のための軽量な予測器である。
Agentic Predictorはタスク成功率の近似を学ぶことで、最適なエージェントワークフロー構成の迅速かつ正確な選択を可能にする。
論文 参考訳(メタデータ) (2025-05-26T09:46:50Z) - Fine-tuning a Large Language Model for Automating Computational Fluid Dynamics Simulations [11.902947290205645]
大規模言語モデル(LLM)は高度な科学計算を持ち、CFDでの使用は自動化されている。
ドメイン固有LLM適応に着目した新しいアプローチを提案する。
マルチエージェントフレームワークはプロセスをオーケストレーションし、入力を自律的に検証し、構成を生成し、シミュレーションを実行し、エラーを修正する。
論文 参考訳(メタデータ) (2025-04-13T14:35:30Z) - Benchmarking Agentic Workflow Generation [80.74757493266057]
複数面シナリオと複雑なグラフワークフロー構造を備えた統合ワークフロー生成ベンチマークであるWorfBenchを紹介する。
また,サブシーケンスとサブグラフマッチングアルゴリズムを利用したシステム評価プロトコルWorfEvalを提案する。
我々は、生成されたタスクが下流のタスクを強化し、推論中により少ない時間で優れたパフォーマンスを達成することを観察する。
論文 参考訳(メタデータ) (2024-10-10T12:41:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。