論文の概要: A Survey of Text Representation Methods and Their Genealogy
- arxiv url: http://arxiv.org/abs/2211.14591v1
- Date: Sat, 26 Nov 2022 15:22:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-29 14:35:49.616521
- Title: A Survey of Text Representation Methods and Their Genealogy
- Title(参考訳): テキスト表現法とその系譜に関する調査
- Authors: Philipp Siebers, Christian Janiesch, Patrick Zschech
- Abstract要約: 近年、高度にスケーラブルな人工神経ネットワークベースのテキスト表現法が出現し、自然言語処理の分野は前例のない成長と高度化が見られた。
我々は、系譜にそれらを配置し、テキスト表現方法の分類を概念化し、最先端の状態を検証し、説明することによって、現在のアプローチに関する調査を行う。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In recent years, with the advent of highly scalable
artificial-neural-network-based text representation methods the field of
natural language processing has seen unprecedented growth and sophistication.
It has become possible to distill complex linguistic information of text into
multidimensional dense numeric vectors with the use of the distributional
hypothesis. As a consequence, text representation methods have been evolving at
such a quick pace that the research community is struggling to retain knowledge
of the methods and their interrelations. We contribute threefold to this lack
of compilation, composition, and systematization by providing a survey of
current approaches, by arranging them in a genealogy, and by conceptualizing a
taxonomy of text representation methods to examine and explain the
state-of-the-art. Our research is a valuable guide and reference for artificial
intelligence researchers and practitioners interested in natural language
processing applications such as recommender systems, chatbots, and sentiment
analysis.
- Abstract(参考訳): 近年、高度にスケーラブルな人工神経ネットワークに基づくテキスト表現手法が出現し、自然言語処理の分野では前例のない成長と洗練が見られた。
分布仮説を用いて、テキストの複雑な言語情報を多次元密度数値ベクトルに蒸留することが可能になった。
その結果、テキスト表現手法は急速に進化しており、研究コミュニティは方法とその相互関係に関する知識を維持するのに苦労している。
我々は,現在のアプローチを系譜に整理し,テキスト表現法の分類法を概念化し,現状を検証,説明することにより,コンパイル,構成,体系化の欠如に3倍の貢献をする。
本研究は,レコメンダシステムやチャットボット,感情分析など,自然言語処理アプリケーションに興味を持つ人工知能研究者や実践者にとって,貴重なガイドであり参考となる。
関連論文リスト
- From Word Vectors to Multimodal Embeddings: Techniques, Applications, and Future Directions For Large Language Models [17.04716417556556]
本稿では,分布仮説や文脈的類似性といった基礎概念を概観する。
本稿では, ELMo, BERT, GPTなどのモデルにおいて, 静的な埋め込みと文脈的埋め込みの両方について検討する。
議論は文章や文書の埋め込みにまで拡張され、集約メソッドや生成トピックモデルをカバーする。
モデル圧縮、解釈可能性、数値エンコーディング、バイアス緩和といった高度なトピックを分析し、技術的な課題と倫理的意味の両方に対処する。
論文 参考訳(メタデータ) (2024-11-06T15:40:02Z) - Comprehensive Study on Sentiment Analysis: From Rule-based to modern LLM based system [0.0]
本研究では、感情分析の歴史的発展を考察し、レキシコンベースおよびパターンベースアプローチから、より洗練された機械学習およびディープラーニングモデルへの移行を強調した。
本稿は、最先端のアプローチをレビューし、新たなトレンドを特定し、今後の研究の方向性を概説する。
論文 参考訳(メタデータ) (2024-09-16T04:44:52Z) - A Survey on Lexical Ambiguity Detection and Word Sense Disambiguation [0.0]
本稿では自然言語処理(NLP)分野における言語におけるあいまいさの理解と解決に焦点を当てた手法について検討する。
ディープラーニング技術から、WordNetのような語彙的リソースや知識グラフの活用まで、さまざまなアプローチを概説している。
本研究は, 感覚アノテートコーパスの不足, 非公式な臨床テキストの複雑さなど, この分野における永続的な課題を明らかにした。
論文 参考訳(メタデータ) (2024-03-24T12:58:48Z) - Large Language Models for Information Retrieval: A Survey [58.30439850203101]
情報検索は、項ベースの手法から高度なニューラルモデルとの統合へと進化してきた。
近年の研究では、大規模言語モデル(LLM)を活用してIRシステムの改善が試みられている。
LLMとIRシステムの合流点を探索し、クエリリライト、リトリバー、リランカー、リーダーといった重要な側面を含む。
論文 参考訳(メタデータ) (2023-08-14T12:47:22Z) - Analysis of the Evolution of Advanced Transformer-Based Language Models:
Experiments on Opinion Mining [0.5735035463793008]
本稿では,最先端のトランスフォーマーに基づく言語モデルの意見マイニングにおける挙動について検討する。
私たちの比較研究は、フォーカスするアプローチに関して、プロダクションエンジニアがリードし、道を開く方法を示しています。
論文 参考訳(メタデータ) (2023-08-07T01:10:50Z) - Multimodal Relation Extraction with Cross-Modal Retrieval and Synthesis [89.04041100520881]
本研究は,対象物,文,画像全体に基づいて,テキストおよび視覚的証拠を検索することを提案する。
我々は,オブジェクトレベル,画像レベル,文レベル情報を合成し,同一性と異なるモダリティ間の推論を改善する新しい手法を開発した。
論文 参考訳(メタデータ) (2023-05-25T15:26:13Z) - An Inclusive Notion of Text [69.36678873492373]
テキストの概念の明確さは再現可能で一般化可能なNLPにとって不可欠である,と我々は主張する。
言語的および非言語的要素の2層分類を導入し,NLPモデリングに使用することができる。
論文 参考訳(メタデータ) (2022-11-10T14:26:43Z) - Improve Discourse Dependency Parsing with Contextualized Representations [28.916249926065273]
本稿では,異なるレベルの単位の文脈化表現を符号化するトランスフォーマーの活用を提案する。
記事間で共通に共有される記述パターンの観察に動機付けられ,談話関係の識別をシーケンスラベリングタスクとして扱う新しい手法を提案する。
論文 参考訳(メタデータ) (2022-05-04T14:35:38Z) - Faithfulness in Natural Language Generation: A Systematic Survey of
Analysis, Evaluation and Optimization Methods [48.47413103662829]
自然言語生成(NLG)は,事前学習型言語モデルなどの深層学習技術の発展により,近年大きく進歩している。
しかし、生成したテキストが通常不信または非実情報を含むという忠実性問題は、最大の課題となっている。
論文 参考訳(メタデータ) (2022-03-10T08:28:32Z) - A Latent-Variable Model for Intrinsic Probing [93.62808331764072]
固有プローブ構築のための新しい潜在変数定式化を提案する。
我々は、事前訓練された表現が言語間交互に絡み合ったモルフォシンタクスの概念を発達させる経験的証拠を見出した。
論文 参考訳(メタデータ) (2022-01-20T15:01:12Z) - From Show to Tell: A Survey on Image Captioning [48.98681267347662]
視覚と言語を結びつけることは、ジェネレーティブ・インテリジェンスにおいて重要な役割を担っている。
画像キャプションの研究はまだ結論に達していない。
本研究の目的は,画像キャプション手法の包括的概要と分類を提供することである。
論文 参考訳(メタデータ) (2021-07-14T18:00:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。