論文の概要: Inaccuracy of an E-Dictionary and Its Influence on Chinese Language Users
- arxiv url: http://arxiv.org/abs/2504.00799v1
- Date: Tue, 01 Apr 2025 13:54:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-03 13:20:36.720334
- Title: Inaccuracy of an E-Dictionary and Its Influence on Chinese Language Users
- Title(参考訳): 辞書の不正確さと中国語利用者への影響
- Authors: Xi Wang, Fanfei Meng, Shiyang Zhang, Lan Li,
- Abstract要約: 主要なE辞書の精度はほとんど精査されておらず、そのコーパスの作り方にはほとんど注意が払われていない。
本研究は,中国で最も広く使われているE辞書のひとつであるYoudaoについて,実験,ユーザ調査,辞書評定を併用して検討する。
結果は、不完全あるいは誤解を招く定義が深刻な誤解を引き起こす可能性があることを示している。
この研究は、データ処理における問題と辞書構築におけるAIと機械学習技術の統合を強調し、そのような欠陥定義がどのように生まれたかをさらに調査する。
- 参考スコア(独自算出の注目度): 4.061449824145836
- License:
- Abstract: Electronic dictionaries have largely replaced paper dictionaries and become central tools for L2 learners seeking to expand their vocabulary. Users often assume these resources are reliable and rarely question the validity of the definitions provided. The accuracy of major E-dictionaries is seldom scrutinized, and little attention has been paid to how their corpora are constructed. Research on dictionary use, particularly the limitations of electronic dictionaries, remains scarce. This study adopts a combined method of experimentation, user survey, and dictionary critique to examine Youdao, one of the most widely used E-dictionaries in China. The experiment involved a translation task paired with retrospective reflection. Participants were asked to translate sentences containing words that are insufficiently or inaccurately defined in Youdao. Their consultation behavior was recorded to analyze how faulty definitions influenced comprehension. Results show that incomplete or misleading definitions can cause serious misunderstandings. Additionally, students exhibited problematic consultation habits. The study further explores how such flawed definitions originate, highlighting issues in data processing and the integration of AI and machine learning technologies in dictionary construction. The findings suggest a need for better training in dictionary literacy for users, as well as improvements in the underlying AI models used to build E-dictionaries.
- Abstract(参考訳): 電子辞書は、主に紙辞書に取って代わられ、語彙の拡大を目指すL2学習者の中心的なツールとなっている。
ユーザは、これらのリソースが信頼性があり、提供された定義の妥当性を疑うことは滅多にない。
主要なE辞書の精度はほとんど精査されておらず、そのコーパスの作り方にはほとんど注意が払われていない。
辞書の使用、特に電子辞書の限界に関する研究は依然として少ない。
本研究は,中国で最も広く使われているE辞書のひとつであるYoudaoについて,実験,ユーザ調査,辞書評定を併用して検討する。
実験には、リフレクションと組み合わせた翻訳タスクが含まれていた。
参加者は、Youdaoで不十分または不正確な単語を含む文を翻訳するよう求められた。
彼らの相談行動は、欠陥定義が理解にどのように影響するかを分析するために記録された。
結果は、不完全あるいは誤解を招く定義が深刻な誤解を引き起こす可能性があることを示している。
さらに、学生は問題のある相談の習慣を示した。
この研究は、データ処理における問題と辞書構築におけるAIと機械学習技術の統合を強調し、そのような欠陥定義がどのように生まれたかをさらに調査する。
この結果は、ユーザーのための辞書リテラシーのトレーニングの改善と、E辞書を構築するために使用される基盤となるAIモデルの改善の必要性を示唆している。
関連論文リスト
- An Analysis of BPE Vocabulary Trimming in Neural Machine Translation [56.383793805299234]
語彙トリミング(vocabulary trimming)は、まれなサブワードをコンポーネントサブワードに置き換える後処理のステップである。
ボキャブラリトリミングは性能向上に失敗し,さらに大きな劣化を招きやすいことを示す。
論文 参考訳(メタデータ) (2024-03-30T15:29:49Z) - Learning Interpretable Queries for Explainable Image Classification with
Information Pursuit [18.089603786027503]
Information Pursuit (IP) は、データに関する解釈可能なクエリのシーケンスを欲求的に選択する説明可能な予測アルゴリズムである。
本稿では,データセットから直接解釈可能なクエリの辞書を学習する,新しいアプローチを提案する。
論文 参考訳(メタデータ) (2023-12-16T21:43:07Z) - Biomedical Named Entity Recognition via Dictionary-based Synonym
Generalization [51.89486520806639]
本研究では,入力テキストに含まれる生物医学的概念をスパンベース予測を用いて認識する,新しいSynGenフレームワークを提案する。
提案手法を広範囲のベンチマークで広範囲に評価し,SynGenが従来の辞書ベースモデルよりも顕著なマージンで優れていることを確認した。
論文 参考訳(メタデータ) (2023-05-22T14:36:32Z) - A Survey on Zero Pronoun Translation [69.09774294082965]
ゼロ代名詞(ZP)はプロドロップ言語では省略されることが多いが、非プロドロップ言語ではリコールされるべきである。
本研究は, 神経革命後のゼロ代名詞翻訳(ZPT)における主要な研究について述べる。
1) ZPTは大規模言語モデルの発展傾向と一致している; 2) データの制限は言語やドメインの学習バイアスを引き起こす; 3) 性能改善は単一のベンチマークで報告されることが多いが、高度な手法はまだ実世界の利用には程遠い。
論文 参考訳(メタデータ) (2023-05-17T13:19:01Z) - CSED: A Chinese Semantic Error Diagnosis Corpus [52.92010408053424]
関連するデータセットが欠如している中国の意味的誤り診断(CSED)の複雑な問題について検討する。
意味的誤りの研究は、それらが非常に一般的であり、統語的不規則や理解の問題に繋がる可能性があるため重要である。
本稿では,CSEDタスクに適応する構文認識モデルを提案する。
論文 参考訳(メタデータ) (2023-05-09T05:33:31Z) - A Study of Slang Representation Methods [3.511369967593153]
我々は,スラング理解に依存した様々な下流タスクに対して,表現学習モデルと知識資源の異なる組み合わせについて検討する。
誤り解析では、語彙外単語、多意味性、分散性、アノテーションの不一致など、スラング表現学習における中核的な課題を識別する。
論文 参考訳(メタデータ) (2022-12-11T21:56:44Z) - A Linguistic Investigation of Machine Learning based Contradiction
Detection Models: An Empirical Analysis and Future Perspectives [0.34998703934432673]
本稿では,2つの自然言語推論データセットについて,その言語的特徴について分析する。
目標は、特に機械学習モデルを理解するのが難しい、構文的および意味的特性を特定することである。
論文 参考訳(メタデータ) (2022-10-19T10:06:03Z) - Rethink about the Word-level Quality Estimation for Machine Translation
from Human Judgement [57.72846454929923]
ベンチマークデータセットであるemphHJQEを作成し、専門家翻訳者が不適切な翻訳語を直接アノテートする。
本稿では,タグリファインメント戦略と木ベースのアノテーション戦略という2つのタグ補正戦略を提案し,TERベースの人工QEコーパスをemphHJQEに近づける。
その結果,提案したデータセットは人間の判断と一致しており,また,提案したタグ補正戦略の有効性も確認できた。
論文 参考訳(メタデータ) (2022-09-13T02:37:12Z) - Does He Wink or Does He Nod? A Challenging Benchmark for Evaluating Word
Understanding of Language Models [0.6091702876917281]
大規模コーパスにおける事前学習言語モデルの最近の進歩は、多くのNLPタスクにおいて大きなパフォーマンス向上をもたらした。
どのような知識が獲得されたかを評価するため、言語モデルは通常、空白スタイルのクローゼ質問を埋めてクエリすることで探索される。
単語の辞書定義を用いて単語理解を直接評価するためにWDLMProを導入する。
論文 参考訳(メタデータ) (2021-02-06T15:15:57Z) - Speakers Fill Lexical Semantic Gaps with Context [65.08205006886591]
我々は単語の語彙的あいまいさを意味のエントロピーとして運用する。
単語のあいまいさの推定値と,WordNetにおける単語の同義語数との間には,有意な相関関係が認められた。
これは、あいまいさの存在下では、話者が文脈をより情報的にすることで補うことを示唆している。
論文 参考訳(メタデータ) (2020-10-05T17:19:10Z) - The Grievance Dictionary: Understanding Threatening Language Use [0.8373151777137792]
グリーバンス辞典は、グリーヴァンスに満ちた暴力の脅威評価の文脈で言語の使用を自動的に理解するために使用することができる。
この辞書は暴力的で非暴力的な個人によって書かれたテキストに適用することで検証された。
論文 参考訳(メタデータ) (2020-09-10T12:06:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。