論文の概要: Human Abnormality Detection Based on Bengali Text
- arxiv url: http://arxiv.org/abs/2007.10718v1
- Date: Tue, 21 Jul 2020 11:21:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-08 05:23:10.377298
- Title: Human Abnormality Detection Based on Bengali Text
- Title(参考訳): ベンガルテキストに基づく人間の異常検出
- Authors: M. F. Mridha, Md. Saifur Rahman, Abu Quwsar Ohi
- Abstract要約: 自然言語処理では、有効な意味は全ての単語によって伝達される可能性がある。
本稿では,ベンガル文字のみを用いた効率的かつ効果的な人体異常検出モデルを提案する。
本モデルでは, タイプしたベンガル文字を解析することにより, 正常状態か異常状態かを認識することができる。
- 参考スコア(独自算出の注目度): 0.2320417845168326
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the field of natural language processing and human-computer interaction,
human attitudes and sentiments have attracted the researchers. However, in the
field of human-computer interaction, human abnormality detection has not been
investigated extensively and most works depend on image-based information. In
natural language processing, effective meaning can potentially convey by all
words. Each word may bring out difficult encounters because of their semantic
connection with ideas or categories. In this paper, an efficient and effective
human abnormality detection model is introduced, that only uses Bengali text.
This proposed model can recognize whether the person is in a normal or abnormal
state by analyzing their typed Bengali text. To the best of our knowledge, this
is the first attempt in developing a text based human abnormality detection
system. We have created our Bengali dataset (contains 2000 sentences) that is
generated by voluntary conversations. We have performed the comparative
analysis by using Naive Bayes and Support Vector Machine as classifiers. Two
different feature extraction techniques count vector, and TF-IDF is used to
experiment on our constructed dataset. We have achieved a maximum 89% accuracy
and 92% F1-score with our constructed dataset in our experiment.
- Abstract(参考訳): 自然言語処理と人間とコンピュータの相互作用の分野では、人間の態度や感情が研究者を惹きつけている。
しかし、人間とコンピュータの相互作用の分野では、人間の異常検出は広く研究されておらず、ほとんどの研究は画像情報に依存している。
自然言語処理では、有効な意味は全ての単語によって伝達される可能性がある。
各単語は、アイデアやカテゴリとのセマンティックな関係から、困難な出会いをもたらす可能性がある。
本稿では,ベンガル文字のみを用いた効率的かつ効果的な人体異常検出モデルを提案する。
提案モデルでは,型づけされたベンガルテキストを分析し,正常か異常かを認識することができる。
我々の知る限りでは、これはテキストに基づく人間の異常検出システムを開発する最初の試みである。
自発的な会話によって生成されるベンガルデータセット(2000文を含む)を作成しました。
我々は,Naive Bayes と Support Vector Machine を分類器として比較分析を行った。
2つの異なる特徴抽出手法がベクトルをカウントし、TF-IDFを用いて構築したデータセットを実験する。
実験では,構築したデータセットを用いて,最大89%の精度と92%のF1スコアを達成した。
関連論文リスト
- Detecting Subtle Differences between Human and Model Languages Using Spectrum of Relative Likelihood [5.404146472517001]
本研究は、絶対値ではなく相対的確率値を用いることにより、新たな視点を提供する。
本稿では,教師型と教師型という2つの分類法を用いた検出手法を提案する。
また,人間の言語とモデル言語との微妙な差異を明らかにし,心理言語学研究の理論的ルーツを見出すことができる。
論文 参考訳(メタデータ) (2024-06-28T12:28:52Z) - Retrieval and Generative Approaches for a Pregnancy Chatbot in Nepali
with Stemmed and Non-Stemmed Data : A Comparative Study [0.0]
ネパール語のデータセットのパフォーマンスは、それぞれのアプローチで分析されている。
BERTをベースとした事前学習モデルでは,スクラッチトランスフォーマーモデルではスクラッチデータの性能が良好である。
論文 参考訳(メタデータ) (2023-11-12T17:16:46Z) - On the Possibilities of AI-Generated Text Detection [76.55825911221434]
機械が生成するテキストが人間に近い品質を近似するにつれて、検出に必要なサンプルサイズが増大すると主張している。
GPT-2, GPT-3.5-Turbo, Llama, Llama-2-13B-Chat-HF, Llama-2-70B-Chat-HFなどの最先端テキストジェネレータをoBERTa-Large/Base-Detector, GPTZeroなどの検出器に対して試験した。
論文 参考訳(メタデータ) (2023-04-10T17:47:39Z) - Real or Fake Text?: Investigating Human Ability to Detect Boundaries
Between Human-Written and Machine-Generated Text [23.622347443796183]
我々は、テキストが人間の書き起こしから始まり、最先端のニューラルネットワークモデルによって生成されるようになる、より現実的な状況について研究する。
この課題でアノテータはしばしば苦労するが、アノテータのスキルにはかなりのばらつきがあり、適切なインセンティブが与えられると、アノテータは時間とともに改善できることを示す。
論文 参考訳(メタデータ) (2022-12-24T06:40:25Z) - Naturalistic Causal Probing for Morpho-Syntax [76.83735391276547]
スペインにおける実世界のデータに対する入力レベルの介入に対する自然主義的戦略を提案する。
提案手法を用いて,共同設立者から文章中の形態・症状の特徴を抽出する。
本研究では,事前学習したモデルから抽出した文脈化表現に対する性別と数字の因果効果を解析するために,本手法を適用した。
論文 参考訳(メタデータ) (2022-05-14T11:47:58Z) - Training Language Models with Natural Language Feedback [51.36137482891037]
3段階学習アルゴリズムを用いてモデル出力の言語フィードバックから学習する。
合成実験において、まず言語モデルがフィードバックを正確に組み込んで改良を行うかどうかを評価する。
人間の手書きフィードバックのサンプルは100程度しかなく, 学習アルゴリズムはGPT-3モデルを微調整し, ほぼ人間レベルの要約を行う。
論文 参考訳(メタデータ) (2022-04-29T15:06:58Z) - On the probability-quality paradox in language generation [76.69397802617064]
我々は情報理論レンズを用いて言語生成を分析する。
人間の言語は自然文字列上の分布のエントロピーに近い量の情報を含むべきであると仮定する。
論文 参考訳(メタデータ) (2022-03-31T17:43:53Z) - Typical Decoding for Natural Language Generation [76.69397802617064]
本稿は,高確率テキストが退屈あるいは反復的である理由について考察する。
典型的なサンプリングでは,品質面での競争性能が期待できる。
論文 参考訳(メタデータ) (2022-02-01T18:58:45Z) - CBLUE: A Chinese Biomedical Language Understanding Evaluation Benchmark [51.38557174322772]
中国初のバイオメディカル言語理解評価ベンチマークを提示する。
名前付きエンティティ認識、情報抽出、臨床診断正規化、単文/文対分類を含む自然言語理解タスクのコレクションである。
本研究は,現在の11種類の中国モデルによる実験結果について報告し,その実験結果から,現在最先端のニューラルモデルがヒトの天井よりもはるかに悪い性能を示すことが示された。
論文 参考訳(メタデータ) (2021-06-15T12:25:30Z) - Personality Trait Detection Using Bagged SVM over BERT Word Embedding
Ensembles [10.425280599592865]
本稿では,テキストからの人格自動検出のための新しい深層学習手法を提案する。
我々は、自然言語理解における最先端技術、すなわちBERT言語モデルを活用して、文脈化された単語埋め込みを抽出する。
我々のモデルは、従来の最先端技術よりも1.04%優れており、同時に、トレーニングの計算効率も大幅に向上している。
論文 参考訳(メタデータ) (2020-10-03T09:25:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。