論文の概要: Applying FrameNet to Chinese(Poetry)
- arxiv url: http://arxiv.org/abs/2210.05772v1
- Date: Tue, 11 Oct 2022 20:28:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-13 12:52:02.285429
- Title: Applying FrameNet to Chinese(Poetry)
- Title(参考訳): FrameNetを中国語に応用する(詩)
- Authors: Zirong Chen
- Abstract要約: 中国語のような他の言語で利用可能なFrameNetデータセットはたくさんありますが、ラテンアルファベットに基づく言語とは大きく異なります。
本稿では,漢詩から現代中国語への翻訳を最初に行い,漢詩のFrameNetをさらに活用する。
その後、現代中国語からの翻訳とCFNと英語FrameNetの応用の比較を行う。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: FrameNet( Fillmore and Baker [2009] ) is well-known for its wide use for
knowledge representation in the form of inheritance-based ontologies and
lexica( Trott et al. [2020] ). Although FrameNet is usually applied to
languages like English, Spanish and Italian, there are still plenty of FrameNet
data sets available for other languages like Chinese, which differs
significantly from those languages based on Latin alphabets. In this paper, the
translation from ancient Chinese Poetry to modern Chinese will be first
conducted to further apply the Chinese FrameNet(CFN, provided by Shanxi
University). Afterwards, the translation from modern Chinese will be conducted
as well for the comparison between the applications of CFN and English
FrameNet. Finally, the overall comparison will be draw between CFN to modern
Chinese and English FrameNet.
- Abstract(参考訳): framenet(fillmore and baker [2009])は、継承に基づくオントロジーとlexica(trott et al. [2020])という形での知識表現の幅広い使用で有名である。
FrameNetは通常、英語、スペイン語、イタリア語などの言語に適用されるが、中国語のような他の言語で利用可能なFrameNetデータセットは、ラテンアルファベットに基づく言語とは大きく異なる。
本論では、漢詩から現代漢詩への翻訳を最初に行い、シャン西大学から提供された中国語フレームネット(cfn)をさらに適用する。
その後、現代中国語からの翻訳とCFNと英語FrameNetの応用の比較を行う。
最後に、cfnと現代中国語と英語のフレームネットを比較します。
関連論文リスト
- When Does Classical Chinese Help? Quantifying Cross-Lingual Transfer in Hanja and Kanbun [48.07219104902607]
古典中国語から漢語・漢文への言語間移動可能性の仮定を疑問視する。
実験の結果,漢文で書かれた古代朝鮮語文書の言語モデル性能に対する古典中国語データセットの影響は最小限であった。
論文 参考訳(メタデータ) (2024-11-07T15:59:54Z) - Chinese Text Recognition with A Pre-Trained CLIP-Like Model Through
Image-IDS Aligning [61.34060587461462]
中国語テキスト認識(CTR)のための2段階フレームワークを提案する。
印刷文字画像とIdeographic Description Sequences (IDS) の整列によるCLIP様モデルの事前学習を行う。
この事前学習段階は、漢字を認識する人間をシミュレートし、各文字の標準表現を得る。
学習された表現はCTRモデルを監督するために使用され、従来の単一文字認識はテキストライン認識に改善される。
論文 参考訳(メタデータ) (2023-09-03T05:33:16Z) - Babel-ImageNet: Massively Multilingual Evaluation of Vision-and-Language Representations [53.89380284760555]
Babel-ImageNetは,100言語へのイメージネットラベルの部分的翻訳を提供する,多言語ベンチマークである。
我々は,11の公開多言語CLIPモデルをベンチマークで評価し,イングリッシュイメージネットの性能と高ソース言語との差を顕著に示した。
パラメータ効率のよい言語特化学習を行う低リソース言語に対して,多言語CLIPの性能を劇的に向上させることができることを示す。
論文 参考訳(メタデータ) (2023-06-14T17:53:06Z) - Shuo Wen Jie Zi: Rethinking Dictionaries and Glyphs for Chinese Language
Pre-training [50.100992353488174]
辞書知識と漢字の構造を持つ中国語PLMの意味理解能力を高める新しい学習パラダイムであるCDBERTを紹介する。
我々はCDBERTの2つの中核モジュールを Shuowen と Jiezi と名付け、そこで Shuowen は中国語辞書から最も適切な意味を取り出す過程を指す。
本パラダイムは,従来の中国語PLMのタスク間における一貫した改善を実証する。
論文 参考訳(メタデータ) (2023-05-30T05:48:36Z) - WYWEB: A NLP Evaluation Benchmark For Classical Chinese [10.138128038929237]
古典中国語における9つのNLPタスクからなるWYWEB評価ベンチマークを紹介する。
我々は、このベンチマークで苦労している既存の事前学習言語モデルを評価する。
論文 参考訳(メタデータ) (2023-05-23T15:15:11Z) - Open-source Frame Semantic Parsing [0.0]
本稿では,オープンソースのPythonライブラリであるFrame Semantic Transformerについて述べる。
我々は, Propbank と FrameNet の例に微調整した T5 モデルをベースとして, FrameNet の語彙単位を用いて, 推論時に T5 にヒントを与えることによって性能を向上させる。
論文 参考訳(メタデータ) (2023-03-22T17:57:47Z) - Extending the Pre-Training of BLOOM for Improved Support of Traditional
Chinese: Models, Methods and Results [12.00277814051069]
BLOOM-zhは、2022年にBigScienceによって発表されたオープンソースのBLOOMモデルに由来する。
BLOOMの事前トレーニングを、さまざまなドメインをカバーする中国語と英語で740億のトークンを追加することで拡張した。
BLOOM-zhは、従来の中国のベンチマークにおいて、英語の能力を維持しながら、前者よりも優れています。
論文 参考訳(メタデータ) (2023-03-08T16:53:19Z) - Visually Grounded Reasoning across Languages and Cultures [27.31020761908739]
我々は、より多くの言語や文化を表すImageNetスタイルの階層を構築するための新しいプロトコルを開発する。
我々は、インドネシア語、中国語、スワヒリ語、タミル語、トルコ語など、類型的に多様な言語群に焦点を当てている。
画像のペアについて,ネイティブ話者アノテータから文を抽出することにより,多言語による視覚・言語上の多言語推論(MARVL)データセットを作成する。
論文 参考訳(メタデータ) (2021-09-28T16:51:38Z) - Sister Help: Data Augmentation for Frame-Semantic Role Labeling [9.62264668211579]
既存のフレーム固有のアノテーションを用いて、注釈のない同じフレームの他の語彙単位を自動的に注釈付けするデータ拡張手法を提案する。
本稿では,このデータ強化の重要性を示すフレーム・セマンティック・ロール・ラベリングの実験を行う。
論文 参考訳(メタデータ) (2021-09-16T05:15:29Z) - Cross-lingual Transferring of Pre-trained Contextualized Language Models [73.97131976850424]
本稿では,PRLMのための新しい言語間モデル転送フレームワークTreLMを提案する。
シンボルの順序と言語間のシーケンス長の差に対処するため,中間的なTRILayer構造を提案する。
提案手法は,スクラッチから学習した言語モデルに対して,性能と効率の両面で,限られたデータで著しく優れることを示す。
論文 参考訳(メタデータ) (2021-07-27T06:51:13Z) - Unsupervised Transfer Learning in Multilingual Neural Machine
Translation with Cross-Lingual Word Embeddings [72.69253034282035]
我々は、言語独立多言語文表現を活用し、新しい言語に容易に一般化する。
複数のロマンス言語を含むベースシステムを用いてポルトガル語から盲目的に復号し、ポルトガル語では36.4 BLEU、ロシア語では12.8 BLEUのスコアを得た。
非反復的逆翻訳によるより実用的な適応アプローチを探求し、高品質の翻訳を生産するモデルの能力を活用します。
論文 参考訳(メタデータ) (2021-03-11T14:22:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。