論文の概要: Tool-MCoT: Tool Augmented Multimodal Chain-of-Thought for Content Safety Moderation
- arxiv url: http://arxiv.org/abs/2604.06205v1
- Date: Sun, 15 Mar 2026 19:08:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-12 18:41:08.631893
- Title: Tool-MCoT: Tool Augmented Multimodal Chain-of-Thought for Content Safety Moderation
- Title(参考訳): Tool-MCoT:コンテンツ安全性改善のためのマルチモーダルチェーン強化ツール
- Authors: Shutong Zhang, Dylan Zhou, Yinxiao Liu, Yang Yang, Huiwen Luo, Wenfei Zou,
- Abstract要約: 大規模言語モデル(LLM)は有効であるが、その高い計算コストとレイテンシは、スケーラブルなデプロイメントの課題である。
外部フレームワークを活用したコンテンツ安全モデレーションのための小型言語モデル(SLM)であるTool-MCoTを紹介する。
- 参考スコア(独自算出の注目度): 6.166444655863511
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The growth of online platforms and user content requires strong content moderation systems that can handle complex inputs from various media types. While large language models (LLMs) are effective, their high computational cost and latency present significant challenges for scalable deployment. To address this, we introduce Tool-MCoT, a small language model (SLM) fine-tuned for content safety moderation leveraging external framework. By training our model on tool-augmented chain-of-thought data generated by LLM, we demonstrate that the SLM can learn to effectively utilize these tools to improve its reasoning and decision-making. Our experiments show that the fine-tuned SLM achieves significant performance gains. Furthermore, we show that the model can learn to use these tools selectively, achieving a balance between moderation accuracy and inference efficiency by calling tools only when necessary.
- Abstract(参考訳): オンラインプラットフォームとユーザコンテンツの成長は、様々なメディアタイプからの複雑な入力を処理できる強力なコンテンツモデレーションシステムを必要とする。
大きな言語モデル(LLM)は有効であるが、その高い計算コストとレイテンシは、スケーラブルなデプロイメントにおいて重要な課題である。
そこで本稿では,外部フレームワークを活用したコンテンツ安全性調整のための小型言語モデル(SLM)であるTool-MCoTを紹介する。
LLMが生成したツール拡張チェーン・オブ・シークレットデータに基づいてモデルをトレーニングすることにより,SLMがこれらのツールを効果的に活用して推論と意思決定を改善することができることを示す。
実験の結果, 微調整SLMは高い性能向上を達成できることがわかった。
さらに,これらのツールを選択的に使用し,必要なときにのみツールを呼び出すことで,モデレーション精度と推論効率のバランスをとることができることを示す。
関連論文リスト
- Advancing SLM Tool-Use Capability using Reinforcement Learning [0.0]
ツールを効果的に利用できることは、LLM(Large Language Models)の定義機能となり、外部データや内部リソースにアクセスできるようになった。
小言語モデル(SLM)は、特にリソース制約のある設定において、ツールの使用を正確に統合する際の課題に直面します。
本研究では,強化学習,特にグループ相対的政策最適化がSLMのツール利用をいかに向上させるかを検討する。
論文 参考訳(メタデータ) (2025-09-03T07:41:14Z) - ToolACE-DEV: Self-Improving Tool Learning via Decomposition and EVolution [77.86222359025011]
ツール学習のための自己改善フレームワークであるToolACE-DEVを提案する。
まず、ツール学習の目的を、基本的なツール作成とツール利用能力を高めるサブタスクに分解する。
次に、軽量モデルによる自己改善を可能にする自己進化パラダイムを導入し、高度なLCMへの依存を減らす。
論文 参考訳(メタデータ) (2025-05-12T12:48:30Z) - ToolACE-R: Model-aware Iterative Training and Adaptive Refinement for Tool Learning [84.69651852838794]
ツール学習により、LLM(Large Language Models)は複雑なユーザタスクを解決するための外部ツールを活用することができる。
本稿では,ツール学習のための反復学習と適応的洗練の両方を含む新しいフレームワークであるToolACE-Rを提案する。
我々は、いくつかのベンチマークデータセットにわたる広範な実験を行い、ToolACE-Rが高度なAPIベースのモデルと比較して、競争力のあるパフォーマンスを実現していることを示す。
論文 参考訳(メタデータ) (2025-04-02T06:38:56Z) - Adaptive Tool Use in Large Language Models with Meta-Cognition Trigger [49.81945268343162]
我々は,外部ツール利用のための適応型意思決定戦略であるMeCoを提案する。
MeCoは、表現空間内の高レベル認知信号をキャプチャすることで、メタ認知スコアを定量化する。
MeCoは微調整不要で、最小限のコストがかかる。
論文 参考訳(メタデータ) (2025-02-18T15:45:01Z) - What Affects the Stability of Tool Learning? An Empirical Study on the Robustness of Tool Learning Frameworks [33.51887014808227]
本稿では,ツール学習フレームワークの性能に及ぼす内部要因と外部要因の影響について検討する。
今後の研究には、LCMが試行錯誤の増加から大きな恩恵を受けることができるという観察など、洞察に富んだ結論がいくつか見出される。
論文 参考訳(メタデータ) (2024-07-03T11:06:05Z) - Tool Learning in the Wild: Empowering Language Models as Automatic Tool Agents [56.822238860147024]
大規模な言語モデルを外部ツールで拡張することは、彼らのユーティリティを拡張するための有望なアプローチとして現れました。
以前のメソッドは、ツールドキュメントを手動で解析し、コンテキスト内デモを作成し、ツールをLLMがステップバイステップの推論で使用する構造化フォーマットに変換する。
LLMがツール使用ワークフローを自動化できるフレームワークであるAutoToolsを提案する。
論文 参考訳(メタデータ) (2024-05-26T11:40:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。