論文の概要: Multichannel LSTM-CNN for Telugu Technical Domain Identification
- arxiv url: http://arxiv.org/abs/2102.12179v1
- Date: Wed, 24 Feb 2021 10:15:30 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-25 18:42:50.287100
- Title: Multichannel LSTM-CNN for Telugu Technical Domain Identification
- Title(参考訳): Telugu技術ドメイン同定のためのマルチチャネルLSTM-CNN
- Authors: Sunil Gundapu, Radhika Mamidi
- Abstract要約: ドメイン識別は、機械翻訳、テキスト要約、質問応答、情報抽出、感情分析において重要な役割を果たす。
本稿では,Telugu技術領域同定のためのマルチチャネルLSTM-CNN手法を提案する。
- 参考スコア(独自算出の注目度): 9.23545668304066
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With the instantaneous growth of text information, retrieving domain-oriented
information from the text data has a broad range of applications in Information
Retrieval and Natural language Processing. Thematic keywords give a compressed
representation of the text. Usually, Domain Identification plays a significant
role in Machine Translation, Text Summarization, Question Answering,
Information Extraction, and Sentiment Analysis. In this paper, we proposed the
Multichannel LSTM-CNN methodology for Technical Domain Identification for
Telugu. This architecture was used and evaluated in the context of the ICON
shared task TechDOfication 2020 (task h), and our system got 69.9% of the F1
score on the test dataset and 90.01% on the validation set.
- Abstract(参考訳): テキスト情報の瞬時成長に伴い、テキストデータからドメイン指向情報を取得することは、情報検索や自然言語処理において幅広い応用を有する。
テーマキーワードは、テキストの圧縮表現を与える。
通常、ドメイン識別は機械翻訳、テキスト要約、質問回答、情報抽出、および感情分析において重要な役割を果たします。
本論文では,Telugu技術領域同定のためのマルチチャネルLSTM-CNN手法を提案する。
このアーキテクチャはICON共有タスクTechDOfication 2020(タスクh)のコンテキストで使用され、私たちのシステムはテストデータセットでF1スコアの69.9%、バリデーションセットで90.01%を得ました。
関連論文リスト
- Large Language Model for Multi-Domain Translation: Benchmarking and Domain CoT Fine-tuning [55.107329995417786]
大規模言語モデル(LLM)は、目覚ましい一般的な理解と生成能力を示している。
我々は、25のドイツ語$Leftrightarrow$ Englishと22の中国語$Leftrightarrow$ Englishテストセットを特徴とするマルチドメイン翻訳のベンチマークを確立する。
本稿では,LLMの内在的マルチドメインインテリジェンスを活用し,翻訳性能を向上させるためのドメインチェーン・オブ・シント(CoT)ファインチューニング手法を提案する。
論文 参考訳(メタデータ) (2024-10-03T16:15:04Z) - mTREE: Multi-Level Text-Guided Representation End-to-End Learning for Whole Slide Image Analysis [16.472295458683696]
マルチモーダル学習は視覚とテキストのデータを統合するが、その病理像やテキスト解析への応用は依然として困難である。
マルチレベルテキストガイド表現のエンド・ツー・エンド・ラーニング(mTREE)を導入する。
この新しいテキスト誘導アプローチは、テキスト病理情報からの情報を活用することで、WSI(Whole Slide Images)を効果的にキャプチャする。
論文 参考訳(メタデータ) (2024-05-28T04:47:44Z) - NaSGEC: a Multi-Domain Chinese Grammatical Error Correction Dataset from
Native Speaker Texts [51.64770549988806]
複数のドメインからのネイティブ話者テキストに対する中国語文法誤り訂正(CGEC)の研究を容易にする新しいデータセットであるNaSGECを紹介する。
対象ドメインを広げるために,3つの母国ドメイン,すなわちソーシャルメディア,科学文献,試験から12,500の文に対する複数の参照を注釈付けする。
我々は,最先端CGECモデルと異なるトレーニングデータを用いて,NaSGECのベンチマーク結果を示す。
論文 参考訳(メタデータ) (2023-05-25T13:05:52Z) - Can Domains Be Transferred Across Languages in Multi-Domain Multilingual
Neural Machine Translation? [52.27798071809941]
本稿では,多言語NMTと多言語NMTの合成において,言語間でドメイン情報を転送できるかどうかを検討する。
マルチドメイン多言語(MDML)NMTは,BLEUで0ショット変換性能を+10ゲインまで向上させることができる。
論文 参考訳(メタデータ) (2022-10-20T23:13:54Z) - Addressing Issues of Cross-Linguality in Open-Retrieval Question
Answering Systems For Emergent Domains [67.99403521976058]
新型コロナウイルスの緊急ドメインに対する言語横断的オープン検索型質問応答システムについて紹介する。
本システムでは,検索した文書の信頼性を確保するために,学術論文のコーパスを採用している。
深いセマンティック・レトリバーは、我々の英語からすべてのデータに対するトレーニングの恩恵が大きく、言語横断環境ではBM25ベースラインを大幅に上回っていることを示す。
論文 参考訳(メタデータ) (2022-01-26T19:27:32Z) - Multilingual Pre-Trained Transformers and Convolutional NN
Classification Models for Technical Domain Identification [9.23545668304066]
多言語テキストデータ上で技術ドメイン識別を行うトランスファー学習システムを提案する。
1つはトランスモデルBERTを使用し、もう1つはCNNモデルとXLM-ROBERTaをテキスト分類に使用します。
当社のシステムは,TechDOficationデータセットのサブタスク1d,1gでベストにランク付けした。
論文 参考訳(メタデータ) (2021-01-22T09:18:02Z) - FDMT: A Benchmark Dataset for Fine-grained Domain Adaptation in Machine
Translation [53.87731008029645]
機械翻訳(FDMT)における実世界のきめ細かいドメイン適応タスクを提案する。
FDMTデータセットは、自動運転車、AI教育、リアルタイムネットワーク、スマートフォンの4つのサブドメインで構成されている。
この新しい設定で定量的な実験と深い分析を行い、きめ細かいドメイン適応タスクをベンチマークします。
論文 参考訳(メタデータ) (2020-12-31T17:15:09Z) - Domain Adaptation of NMT models for English-Hindi Machine Translation
Task at AdapMT ICON 2020 [2.572404739180802]
本稿では,adapmt共有タスクアイコン2020で提示された英語ヒンディー語のニューラルマシン翻訳システムについて述べる。
我々のチームは化学・一般分野のEn-Hi翻訳タスクで第1位、AI分野のEn-Hi翻訳タスクで第2位にランクインした。
論文 参考訳(メタデータ) (2020-12-22T15:46:40Z) - An Evaluation of Recent Neural Sequence Tagging Models in Turkish Named
Entity Recognition [5.161531917413708]
本研究では,条件付きランダムフィールド層を有する変圧器ベースネットワークを提案する。
本研究は,移動学習が形態的に豊かな言語処理に与える影響を定量化する文献に寄与する。
論文 参考訳(メタデータ) (2020-05-14T06:54:07Z) - Towards Accurate Scene Text Recognition with Semantic Reasoning Networks [52.86058031919856]
本稿では,シーンテキスト認識のための意味推論ネットワーク(SRN)という,エンドツーエンドのトレーニング可能な新しいフレームワークを提案する。
GSRMはマルチウェイ並列伝送によってグローバルセマンティックコンテキストをキャプチャするために導入された。
正規テキスト,不規則テキスト,非ラテン語長文を含む7つの公開ベンチマークの結果,提案手法の有効性とロバスト性を検証した。
論文 参考訳(メタデータ) (2020-03-27T09:19:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。