論文の概要: LyS at SemEval 2025 Task 8: Zero-Shot Code Generation for Tabular QA
- arxiv url: http://arxiv.org/abs/2508.09012v1
- Date: Tue, 12 Aug 2025 15:25:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-13 21:07:34.47846
- Title: LyS at SemEval 2025 Task 8: Zero-Shot Code Generation for Tabular QA
- Title(参考訳): LyS at SemEval 2025 Task 8: Zero-Shot Code Generation for Tabular QA (英語)
- Authors: Adrián Gude, Roi Santos-Ríos, Francisco Prado-Valiño, Ana Ezquerro, Jesús Vilares,
- Abstract要約: 本稿では,SemEval 2025 Task 8への参加について述べる。
我々は,大規模言語モデルを利用して関連する情報を抽出できる機能コードを生成するゼロショットパイプラインを開発した。
その結果、ゼロショットコード生成はタブラルQAの有効なアプローチであり、テスト段階では53のランク33に達することがわかった。
- 参考スコア(独自算出の注目度): 0.20971479389679332
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper describes our participation in SemEval 2025 Task 8, focused on Tabular Question Answering. We developed a zero-shot pipeline that leverages an Large Language Model to generate functional code capable of extracting the relevant information from tabular data based on an input question. Our approach consists of a modular pipeline where the main code generator module is supported by additional components that identify the most relevant columns and analyze their data types to improve extraction accuracy. In the event that the generated code fails, an iterative refinement process is triggered, incorporating the error feedback into a new generation prompt to enhance robustness. Our results show that zero-shot code generation is a valid approach for Tabular QA, achieving rank 33 of 53 in the test phase despite the lack of task-specific fine-tuning.
- Abstract(参考訳): 本稿では,SemEval 2025 Task 8への参加について述べる。
我々は,大規模言語モデルを利用したゼロショットパイプラインを開発し,入力問題に基づく表データから関連情報を抽出する機能コードを生成する。
我々のアプローチはモジュールパイプラインで構成されており、主要なコードジェネレータモジュールは、最も関連性の高い列を識別し、それらのデータ型を分析して抽出精度を向上させる追加のコンポーネントによってサポートされます。
生成されたコードがフェールした場合、エラーフィードバックを新しい世代プロンプトに組み込んで、堅牢性を高めるイテレーティブな改善プロセスが起動される。
この結果から,タスク固有の微調整が欠如しているにもかかわらず,テスト段階では53のランク33を達成し,ゼロショットコード生成がタブラルQAの有効なアプローチであることが示唆された。
関連論文リスト
- Team Anotheroption at SemEval-2025 Task 8: Bridging the Gap Between Open-Source and Proprietary LLMs in Table QA [5.559427430890753]
本稿では,SemEval 2025 Task 8: Question Answering (QA) をテーブル上に構築するシステムを提案する。
提案手法は,テキストからコードへの生成モジュール,自己補正機構,検索拡張生成(RAG)など,いくつかの重要なコンポーネントを統合している。
評価段階では,提案手法は80%の精度を達成し,38チーム中13位にランクインした。
論文 参考訳(メタデータ) (2025-06-11T12:26:08Z) - UnitCoder: Scalable Iterative Code Synthesis with Unit Test Guidance [65.01483640267885]
大きな言語モデル(LLM)は、様々なタスクにおいて顕著な能力を示してきたが、コード生成は依然として大きな課題である。
私たちは、モデル生成ユニットテストを活用してコード生成プロセスのガイドと検証を行う、システマティックパイプラインであるUnitCoderを紹介します。
我々の研究は、モデル生成単体テストを利用して、事前学習コーパスから高品質なコードデータの合成を誘導するスケーラブルなアプローチを提案する。
論文 参考訳(メタデータ) (2025-02-17T05:37:02Z) - Prompting Large Language Models with Chain-of-Thought for Few-Shot
Knowledge Base Question Generation [19.327008532572645]
知識ベースに関する質問生成(KBQG)は、論理形式を自然言語の質問に変換することを目的としている。
推論のためのコンテキスト内学習戦略であるChain-of-Thoughtプロンプトを提案する。
3つのKBQGデータセットに対して広範な実験を行う。
論文 参考訳(メタデータ) (2023-10-12T15:08:14Z) - CodeCoT: Tackling Code Syntax Errors in CoT Reasoning for Code
Generation [6.139760107605468]
チェーン・オブ・シント(CoT)は、複雑な推論タスクにおいて特に有効であるとして、NLPの画期的なツールとして登場した。
コード生成のための自己検査プロセスとCoTを統合したCode Chain-of-Thought(CodeCoT)を提案する。
論文 参考訳(メタデータ) (2023-08-17T04:58:51Z) - QTSumm: Query-Focused Summarization over Tabular Data [58.62152746690958]
人々は主に、データ分析を行うか、特定の質問に答えるためにテーブルをコンサルティングします。
そこで本研究では,テキスト生成モデルに人間的な推論を行なわなければならない,クエリ中心のテーブル要約タスクを新たに定義する。
このタスクには,2,934テーブル上の7,111の人間注釈付きクエリ-サマリーペアを含む,QTSummという新しいベンチマークを導入する。
論文 参考訳(メタデータ) (2023-05-23T17:43:51Z) - Python Code Generation by Asking Clarification Questions [57.63906360576212]
本稿では,この課題に対して,より斬新で現実的なセットアップを導入する。
我々は、自然言語記述の過小評価は、明確化を問うことで解決できると仮定する。
我々は、生成した合成明確化質問と回答を含む自然言語記述とコードのペアを含む、CodeClarQAという新しいデータセットを収集し、導入する。
論文 参考訳(メタデータ) (2022-12-19T22:08:36Z) - NAPG: Non-Autoregressive Program Generation for Hybrid Tabular-Textual
Question Answering [52.10214317661547]
現在の数値推論法はプログラムシーケンスを自己回帰的にデコードする。
プログラム生成の精度は、デコードステップがエラー伝搬によって展開されるにつれて急激に低下する。
本稿では,非自己回帰型プログラム生成フレームワークを提案する。
論文 参考訳(メタデータ) (2022-11-07T11:25:21Z) - Conditional Generation with a Question-Answering Blueprint [84.95981645040281]
我々は、条件生成を不透明にし、より根底的にレンダリングするための有用な中間表現としてのプランニングを提唱する。
我々は、最先端の質問生成技術を利用して、自動的に青写真を得る。
我々はTransformerベースのモデルを開発し、それぞれが生成した出力にブループリントを組み込む方法が異なる。
論文 参考訳(メタデータ) (2022-07-01T13:10:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。