Fugu-MT 論文翻訳(概要): Dynamik: Syntactically-Driven Dynamic Font Sizing for Emphasis of Key Information

論文の概要: Dynamik: Syntactically-Driven Dynamic Font Sizing for Emphasis of Key Information

arxiv url: http://arxiv.org/abs/2504.09734v1
Date: Sun, 13 Apr 2025 21:46:11 GMT
ステータス: 翻訳完了
システム内更新日: 2025-04-23 02:56:24.144179
Title: Dynamik: Syntactically-Driven Dynamic Font Sizing for Emphasis of Key Information
Title（参考訳）: Dynamik: キー情報強調のための構文駆動型動的フォントサイズ
Authors: Naoto Nishida, Yoshio Ishiguro, Jun Rekiomto, Naomi Yamashita,
Abstract要約: 重要度を低くし,重要度を増大させることにより,読解時の認知負荷を低減させるシステムであるDynamikを提案する。以上の結果から,ダイナマイクは認知負荷の特定の側面,特に英語能力の低い個人における参加者のパフォーマンスと努力を減少させる可能性が示唆された。
参考スコア（独自算出の注目度）: 7.090808843042458
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: In today's globalized world, there are increasing opportunities for individuals to communicate using a common non-native language (lingua franca). Non-native speakers often have opportunities to listen to foreign languages, but may not comprehend them as fully as native speakers do. To aid real-time comprehension, live transcription of subtitles is frequently used in everyday life (e.g., during Zoom conversations, watching YouTube videos, or on social networking sites). However, simultaneously reading subtitles while listening can increase cognitive load. In this study, we propose Dynamik, a system that reduces cognitive load during reading by decreasing the size of less important words and enlarging important ones, thereby enhancing sentence contrast. Our results indicate that Dynamik can reduce certain aspects of cognitive load, specifically, participants' perceived performance and effort among individuals with low proficiency in English, as well as enhance the users' sense of comprehension, especially among people with low English ability. We further discuss our methods' applicability to other languages and potential improvements and further research directions.
Abstract（参考訳）: 今日のグローバル化した世界では、個人が共通の非ネイティブ言語(lingua Francea)を使ってコミュニケーションする機会が増えている。非ネイティブ話者はしばしば外国語を聴く機会があるが、ネイティブ話者ほど完全には理解できない。リアルタイムの理解を助けるために、字幕の字幕の書き起こしは日々の生活(Zoom会話、YouTubeビデオの視聴、ソーシャルネットワークサイトなど)で頻繁に使われる。しかし、読みながら字幕を同時に読むことは認知負荷を増加させる可能性がある。本研究では,より重要でない単語のサイズを減らし,重要な単語を拡大し,文のコントラストを高めることによって,読み上げ時の認知負荷を低減するシステムDynamikを提案する。以上の結果から、ダイナマイクは認知負荷の特定の側面、特に英語能力の低い人における参加者のパフォーマンスと努力を減らし、特に英語能力の低い人の理解度を高めることが示唆された。さらに、他の言語へのメソッドの適用性、潜在的な改善、さらなる研究の方向性について論じる。

関連論文リスト

Towards Developmentally Plausible Rewards: Communicative Success as a Learning Signal for Interactive Language Models [49.22720751953838]
本研究では,子どもの言語習得に触発された対話型環境で言語モデルを訓練する手法を提案する。この設定では、話者は1ターンの対話でリスナーに何らかの情報を伝達しようと試み、コミュニケーションの成功が達成されれば報酬を受け取る。
論文参考訳（メタデータ） (2025-05-09T11:48:36Z)
Developmental Predictive Coding Model for Early Infancy Mono and Bilingual Vocal Continual Learning [69.8008228833895]
本稿では,連続学習機構を備えた小型生成ニューラルネットワークを提案する。我々のモデルは解釈可能性を重視し,オンライン学習の利点を実証する。
論文参考訳（メタデータ） (2024-12-23T10:23:47Z)
Teaching Embodied Reinforcement Learning Agents: Informativeness and Diversity of Language Use [16.425032085699698]
具体的エージェントは、人間の言語を活用して、学習タスクの明示的または暗黙的な知識を得る能力を持つことが望ましい。タスク学習を容易にするために、リッチ言語をどのように組み込むかは明確ではない。本稿では,強化学習における言語入力の種類について検討する。
論文参考訳（メタデータ） (2024-10-31T17:59:52Z)
Is Translation All You Need? A Study on Solving Multilingual Tasks with Large Language Models [79.46179534911019]
大規模言語モデル (LLM) は多言語機能を示しているが、ほとんどは不均衡なトレーニングコーパスのため英語中心である。実世界のユーザクエリと非英語中心のLLMに評価を拡張し、多言語性能のより広範な評価を提供する。
論文参考訳（メタデータ） (2024-03-15T12:47:39Z)
Think Before You Speak: Cultivating Communication Skills of Large Language Models via Inner Monologue [73.69510478736483]
大規模言語モデル(LLM)は、流動的で一貫性があり多様な応答を生成する。しかし、それらは重要な能力、コミュニケーションスキルを欠いている。本稿は,内的モノローグによるLLMのコミュニケーション能力向上を目的としている。実験の結果,提案したCSIM戦略はバックボーンモデルを改善し,ベースラインよりも優れていた。
論文参考訳（メタデータ） (2023-11-13T16:19:42Z)
Task-Agnostic Low-Rank Adapters for Unseen English Dialects [52.88554155235167]
LLM(Large Language Models)は、標準アメリカ英語を好んで不均等に重み付けされたコーパスで訓練される。 HyperLoRAは、方言特化情報と方言横断情報を混同することにより、タスクに依存しない方法で未確認の方言への一般化を改善する。
論文参考訳（メタデータ） (2023-11-02T01:17:29Z)
TRAVID: An End-to-End Video Translation Framework [1.6131714685439382]
本稿では、音声言語を翻訳するだけでなく、翻訳された音声と話者の唇の動きを同期するエンドツーエンドのビデオ翻訳システムを提案する。本システムは,インド諸言語における教育講義の翻訳に重点を置いており,低リソースのシステム設定においても有効であるように設計されている。
論文参考訳（メタデータ） (2023-09-20T14:13:05Z)
Learning to Model the World with Language [100.76069091703505]
人間と対話し、世界で行動するためには、エージェントは人々が使用する言語の範囲を理解し、それを視覚の世界に関連付ける必要がある。私たちのキーとなるアイデアは、エージェントが将来を予測するのに役立つ信号として、このような多様な言語を解釈すべきである、ということです。我々は、将来のテキストや画像表現を予測するマルチモーダル世界モデルを学ぶエージェントであるDynalangでこれをインスタンス化する。
論文参考訳（メタデータ） (2023-07-31T17:57:49Z)
Computational Language Acquisition with Theory of Mind [84.2267302901888]
我々は、心の理論(ToM)を備えた言語学習エージェントを構築し、その学習過程への影響を測定する。重み付けされたToMリスナーコンポーネントを用いた学習話者は,画像参照ゲームの設定において,性能向上につながることがわかった。
論文参考訳（メタデータ） (2023-03-02T18:59:46Z)
Bridging the Gap: Using Deep Acoustic Representations to Learn Grounded Language from Percepts and Raw Speech [26.076534338576234]
自然言語と知覚を結びつける基底言語を理解することは、重要な研究分野である。本研究は,2つの視覚的知覚と生音声入力に基づいて,基底言語習得の実現可能性を示す。
論文参考訳（メタデータ） (2021-12-27T16:12:30Z)
Accented Speech Recognition Inspired by Human Perception [0.0]
本論文では,アクセント音声の認識のためのパフォーマンス改善の可能性を評価するために,人間の知覚に触発された手法を検討する。我々は、複数のアクセントへの事前露出、graphemeと音素に基づく発音、ドロップアウト、特にアクセントモデリングに関連付けられるニューラルネットワークのレイヤの識別の4つの手法を検討した。本研究では, 人間の知覚に基づく手法が, WER の低減と, ニューラルネットワークにおけるアクセント音声のモデル化方法の理解に有望であることを示した。
論文参考訳（メタデータ） (2021-04-09T22:35:09Z)
Self-play for Data Efficient Language Acquisition [20.86261546611472]
学習エージェントにおける言語習得の効率と品質を向上させるために,コミュニケーションの対称性を利用する。直接監督の代わりにセルフプレイを使用することで、エージェントが役割間で知識を伝達できることが示される。
論文参考訳（メタデータ） (2020-10-10T02:09:19Z)
Self-Supervised Representations Improve End-to-End Speech Translation [57.641761472372814]
自己教師付き事前学習機能により,翻訳性能が一貫的に向上することを示す。言語間の変換は、チューニングの必要なく、あるいはほとんどチューニングすることなく、さまざまな言語に拡張することができる。
論文参考訳（メタデータ） (2020-06-22T10:28:38Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。