Fugu-MT 論文翻訳(概要): Robust Multilingual Text-to-Pictogram Mapping for Scalable Reading Rehabilitation

論文の概要: Robust Multilingual Text-to-Pictogram Mapping for Scalable Reading Rehabilitation

arxiv url: http://arxiv.org/abs/2603.24536v1
Date: Wed, 25 Mar 2026 17:12:14 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-26 21:06:11.4029
Title: Robust Multilingual Text-to-Pictogram Mapping for Scalable Reading Rehabilitation
Title（参考訳）: 可読性リハビリテーションのためのロバスト多言語テキスト・ピクトグラムマッピング
Authors: Soufiane Jhilal, Martina Galletti,
Abstract要約: 視覚的な足場でテキストを自動的に強化する多言語AIインタフェースを開発した。このシステムは鍵概念を動的に識別し、文脈的に関連するピクトグラムにマッピングする。本システムは5言語にまたがって評価した。
参考スコア（独自算出の注目度）: 0.7652576281314932
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Reading comprehension presents a significant challenge for children with Special Educational Needs and Disabilities (SEND), often requiring intensive one-on-one reading support. To assist therapists in scaling this support, we developed a multilingual, AI-powered interface that automatically enhances text with visual scaffolding. This system dynamically identifies key concepts and maps them to contextually relevant pictograms, supporting learners across languages. We evaluated the system across five typologically diverse languages (English, French, Italian, Spanish, and Arabic), through multilingual coverage analysis, expert clinical review by speech therapists and special education professionals, and latency assessment. Evaluation results indicate high pictogram coverage and visual scaffolding density across the five languages. Expert audits suggested that automatically selected pictograms were semantically appropriate, with combined correct and acceptable ratings exceeding 95% for the four European languages and approximately 90% for Arabic despite reduced pictogram repository coverage. System latency remained within interactive thresholds suitable for real-time educational use. These findings support the technical viability, semantic safety, and acceptability of automated multimodal scaffolding to improve accessibility for neurodiverse learners.
Abstract（参考訳）: 読解は、特別な教育ニーズ・障害(SEND)を持つ子供にとって重要な課題であり、しばしば1対1の読解支援を必要とする。このサポートを拡大する上でセラピストを支援するために、視覚的な足場でテキストを自動的に強化する多言語AIベースのインターフェースを開発した。本システムは,重要な概念を動的に識別し,文脈に関連のあるピクトグラムにマッピングし,言語間の学習者を支援する。多言語カバレッジ分析,言語セラピストと特別教育専門家による専門的臨床レビュー,潜時評価の5言語(英語,フランス語,イタリア語,スペイン語,アラビア語)を対象に,本システムの評価を行った。評価結果から,5言語にまたがる高いピクトグラムカバレッジと視覚的足場密度が示唆された。専門家の監査では、自動的に選択されたピクトグラムは意味的に適切であることが示唆された。システムのレイテンシは、リアルタイムの教育用途に適したインタラクティブなしきい値内に留まった。これらの知見は, 自律型マルチモーダル足場の技術的生存性, 意味的安全性, 受容性をサポートし, 神経多様性学習者へのアクセシビリティの向上に寄与する。

関連論文リスト

uCLIP: Parameter-Efficient Multilingual Extension of Vision-Language Models with Unpaired Data [3.364569898365253]
我々は多言語視覚言語アライメントのための軽量でデータ効率の良いフレームワークを提案する。本手法では,画像テキストペアやテキストペアは必要とせず,事前訓練された画像エンコーダと多言語テキストエンコーダの両方を凍結する。この最小限のトレーニング設定は、監督が限られている言語でも堅牢な多言語アライメントを可能にする。
論文参考訳（メタデータ） (2025-11-17T06:34:49Z)
Multilingual Self-Taught Faithfulness Evaluators [11.200203292660758]
合成多言語要約データからのみ学習するフレームワークである。我々のフレームワークは、最先端の英語評価器や機械翻訳に基づくアプローチなど、既存のベースラインよりも改善されている。
論文参考訳（メタデータ） (2025-07-28T12:01:59Z)
Evaluating Multimodal Language Models as Visual Assistants for Visually Impaired Users [42.132487737233845]
本稿では、視覚障害者のための補助技術として、MLLM(Multimodal Large Language Model)の有効性について検討する。このようなテクノロジでユーザが直面する採用パターンと,重要な課題を特定するために,ユーザ調査を実施しています。
論文参考訳（メタデータ） (2025-03-28T16:54:25Z)
Parrot: Multilingual Visual Instruction Tuning [66.65963606552839]
既存の手法では、視覚エンコーダを教師付き微調整(SFT)を介してMLLM(Multimodal Large Language Models)と整列させるのが一般的である。言語レベルでの視覚的トークンアライメントにテキストガイダンスを活用する新しいアプローチであるPARROTを提案する。我々は6言語、15カテゴリ、12,000の質問からなる新しいベンチマークであるMassive Multilingual Multimodal Benchmark (MMMB)を紹介する。
論文参考訳（メタデータ） (2024-06-04T17:56:28Z)
MTVQA: Benchmarking Multilingual Text-Centric Visual Question Answering [57.30218240464696]
MTVQAは、9つの異なる言語にまたがる高品質なヒューマンエキスパートアノテーションを特徴とする最初のベンチマークである。 MTVQAは9つの異なる言語にわたる高品質なヒューマンエキスパートアノテーションを特徴とする最初のベンチマークである。
論文参考訳（メタデータ） (2024-05-20T12:35:01Z)
Decomposed Prompting: Probing Multilingual Linguistic Structure Knowledge in Large Language Models [54.58989938395976]
本稿では,シーケンスラベリングタスクに対する分割プロンプト手法を提案する。提案手法は,38言語を対象としたUniversal Dependencies part-of-speech Taggedについて検証する。
論文参考訳（メタデータ） (2024-02-28T15:15:39Z)
DIALIGHT: Lightweight Multilingual Development and Evaluation of Task-Oriented Dialogue Systems with Large Language Models [76.79929883963275]
DIALIGHTは多言語タスク指向対話(ToD)システムの開発と評価のためのツールキットである。ローカル発話レベルとグローバル対話レベルの両方において、人間のきめ細かい評価のためのセキュアでユーザフレンドリーなWebインターフェースを備えている。評価の結果, PLMの微調整により精度とコヒーレンスが向上する一方, LLMベースのシステムは多様で類似した応答を生成するのに優れていた。
論文参考訳（メタデータ） (2024-01-04T11:27:48Z)
AM2iCo: Evaluating Word Meaning in Context across Low-ResourceLanguages with Adversarial Examples [51.048234591165155]
本稿では, AM2iCo, Adversarial and Multilingual Meaning in Contextを提案する。言語間文脈における単語の意味の同一性を理解するために、最先端(SotA)表現モデルを忠実に評価することを目的としている。その結果、現在のSotAプリトレーニングエンコーダは人間のパフォーマンスにかなり遅れていることが明らかとなった。
論文参考訳（メタデータ） (2021-04-17T20:23:45Z)
Scaling to Many Languages with a Triaged Multilingual Text-Dependent and Text-Independent Speaker Verification System [9.361951528451298]
これは46言語の規模でのスピーカー検証システムの最初の研究です。多言語テキスト依存およびテキスト非依存コンポーネントからなるハイブリッドセットアップの使用を検討する。
論文参考訳（メタデータ） (2021-04-05T19:48:16Z)
Evaluating Multilingual Text Encoders for Unsupervised Cross-Lingual Retrieval [51.60862829942932]
本稿では,言語間文書・文検索タスクにおける最先端多言語エンコーダの適合性に着目した体系的実証研究を行う。文レベルのCLIRでは、最先端のパフォーマンスが達成できることを実証する。しかし、ピーク性能は、汎用の多言語テキストエンコーダをオフ・ザ・シェルフで使うのではなく、文の理解タスクにさらに特化したバリエーションに依存している。
論文参考訳（メタデータ） (2021-01-21T00:15:38Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。