論文の概要: From Language to Action in Arabic: Reliable Structured Tool Calling via Data-Centric Fine-Tuning
- arxiv url: http://arxiv.org/abs/2603.16901v1
- Date: Wed, 04 Mar 2026 12:27:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:42.369985
- Title: From Language to Action in Arabic: Reliable Structured Tool Calling via Data-Centric Fine-Tuning
- Title(参考訳): アラビア語の言語から行動へ:データ中心ファインチューニングによる信頼性の高い構造化ツール
- Authors: Omer Nacar, Deema Alquffari, Saleh Alsharideh, Adeem AlOtaibi, Abdulaziz Alabdulkarim, Leen Alhazmi, Nada Alomar, Wareef Alzubaidi, Nada Alsultan, Ahmed Alrabghi, Demah Alhoshan, Rana Alsayyari, Hamed Alruwaili, Albaraa Jaafar, Khaled Alusmani, Abdulaziz Alsohimy, Munirah Alsubaie, Shahd Aldukhayil, Arwa Alali, Yazeed BinShihah, Razan Alsulaymi, Nourah Alhumaid, Razan Abdulsalam, Reem Alamoudi, Mohammed Alkhalifa,
- Abstract要約: AISA-AR-FunctionCallは270M-パラメータFunctionGemmaのバックボーン上に構築された生産指向のアラビア関数呼び出しフレームワークである。
ホールドアウトテストセットでは、微調整はパース失敗を87%から1%以下に減らし、関数名の精度を8倍以上に改善し、方言やドメイン間の引数アライメントを大幅に強化する。
- 参考スコア(独自算出の注目度): 0.5055477042103961
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Function-calling language models are essential for agentic AI systems that translate natural language into executable structured actions, yet existing models exhibit severe structural instability when applied to Arabic. We present AISA-AR-FunctionCall, a production-oriented Arabic function-calling framework built on a 270M-parameter FunctionGemma backbone and trained through systematic dataset auditing, schema repair, tool-aware prompt restructuring, and full-parameter supervised fine-tuning. On a held-out test set, fine-tuning reduces parse failures from 87\% to below 1\%, improves function name accuracy by more than eightfold, and substantially enhances argument alignment across dialects and domains. Error analysis reveals a transition from structural collapse to semantic misalignment, suggesting that serialization stability and decision-level reasoning are separable challenges. We further explore a reasoning-augmented LoRA variant that introduces explicit intermediate reasoning prior to tool invocation. All datasets and models are publicly released under the AISA framework.
- Abstract(参考訳): 関数呼び出し言語モデルは、自然言語を実行可能な構造化アクションに変換するエージェントAIシステムにとって不可欠であるが、既存のモデルはアラビア語に適用した場合に深刻な構造不安定性を示す。
AISA-AR-FunctionCallは270MパラメータのFunctionGemmaバックボーン上に構築され、システマティックなデータセット監査、スキーマ修復、ツール・アウェア・プロンプト再構築、フルパラメータ制御による微調整によって訓練された生産指向のアラビア関数呼び出しフレームワークである。
ホールドアウトテストセットでは、微調整はパース失敗を87\%から1\%以下に減らし、関数名精度を8倍以上に改善し、方言やドメイン間の引数アライメントを大幅に強化する。
誤り解析は、構造的崩壊から意味的ミスアライメントへの移行を明らかにし、シリアライズ安定性と決定レベルの推論が分離可能な課題であることを示唆している。
さらに、ツールの起動前に明示的な中間推論を導入した推論拡張型LoRAについても検討する。
すべてのデータセットとモデルは、AISAフレームワークの下で公開されている。
関連論文リスト
- Finding the Translation Switch: Discovering and Exploiting the Task-Initiation Features in LLMs [69.28193153685893]
大きな言語モデル(LLM)は、タスク固有の微調整なしでも、しばしば強力な翻訳能力を示す。
このプロセスをデミスティフィケートするために、スパースオートエンコーダ(SAE)を活用し、タスク固有の特徴を特定するための新しいフレームワークを導入する。
我々の研究は、LLMの翻訳機構のコアコンポーネントをデコードするだけでなく、内部モデル機構を使用してより堅牢で効率的なモデルを作成するための青写真も提供しています。
論文 参考訳(メタデータ) (2026-01-16T06:29:07Z) - Lost in Execution: On the Multilingual Robustness of Tool Calling in Large Language Models [5.6688028729584055]
大規模言語モデル(LLM)は、構造化関数呼び出しを通じて外部ツールを呼び出すエージェントとして、ますます多くデプロイされている。
診断ベンチマークであるMLCLを導入し,中国語,ヒンディー語,低リソース言語Igboを対象とした多言語ツールコールの体系的評価を行う。
論文 参考訳(メタデータ) (2026-01-08T20:44:28Z) - Fine-Tuned Language Models for Domain-Specific Summarization and Tagging [3.543800643014229]
本稿では,ドメイン固有テキスト要約とタグ付けを効率的に行うために,細調整された大言語モデル(LLM)と名前付きエンティティ認識(NER)を統合するパイプラインを提案する。
著者らは、自動化された情報抽出と法執行機関の監視を複雑にする、急速に進化するサブカルチャー言語とスラングによって引き起こされる課題に対処する。
論文 参考訳(メタデータ) (2025-10-29T12:33:48Z) - Autoformalizer with Tool Feedback [52.334957386319864]
自動形式化は、数学的問題を自然言語から形式的ステートメントに変換することによって、ATP(Automated Theorem Proving)のデータ不足に対処する。
既存のフォーミュラライザは、構文的妥当性とセマンティック一貫性を満たす有効なステートメントを一貫して生成することに苦慮している。
本稿では,ツールフィードバックを用いたオートフォーマライザ (ATF) を提案する。
論文 参考訳(メタデータ) (2025-10-08T10:25:12Z) - Structured Cognitive Loop for Behavioral Intelligence in Large Language Model Agents [0.0]
既存のフレームワークは認知、記憶、制御をひとつのプロンプトで混ぜることが多く、一貫性と予測可能性を減らす。
構造化認知ループ (Structured Cognitive Loop, SCL) は、これらの機能を分離する代替アーキテクチャとして提案されている。
SCLの平均タスク成功率は86.3%であり、ベースラインは70.5から76.8%である。
論文 参考訳(メタデータ) (2025-09-23T17:43:17Z) - Improving Large Language Models Function Calling and Interpretability via Guided-Structured Templates [56.73907811047611]
大規模言語モデル(LLM)は強力な推論とツール使用能力を示している。
LLMは、誤ったパラメータ化、悪いツールの選択、ユーザーの意図の誤解釈によって、現実世界のツールインタラクションで失敗することが多い。
我々は、構造化推論テンプレートを利用して、関数呼び出しを生成するためのより故意なステップバイステップ命令を通してLCMをガイドするカリキュラムに着想を得たフレームワークを提案する。
論文 参考訳(メタデータ) (2025-09-22T17:55:14Z) - Structured Prompting and Feedback-Guided Reasoning with LLMs for Data Interpretation [0.0]
大規模言語モデル(LLM)は、自然言語の理解とタスクの一般化において顕著な能力を示した。
本稿では、構造化されたプロンプトおよびフィードバック駆動型変換ロジック生成手法であるSTROT Frameworkを紹介する。
論文 参考訳(メタデータ) (2025-05-03T00:05:01Z) - LISA++: An Improved Baseline for Reasoning Segmentation with Large
Language Model [54.850048630298495]
既存のLISAモデルの更新であるLISA++を導入し、基本アーキテクチャをそのまま維持しながらコア機能の改善に重点を置いている。
インスタンスセグメンテーション機能が追加され、既存のマルチリージョンセグメンテーションとともに、より詳細なシーン分析が提供される。
これらの改善は、構造的変化やデータソースを追加することなく、セグメンテーションと会話スキルを強化することを目的とした、ジェネリックセグメンテーションデータセットの既存のサンプルをキュレートすることで達成される。
論文 参考訳(メタデータ) (2023-12-28T18:58:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。