論文の概要: KeypartX: Graph-based Perception (Text) Representation
- arxiv url: http://arxiv.org/abs/2209.11844v1
- Date: Fri, 23 Sep 2022 20:15:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-27 15:38:44.950780
- Title: KeypartX: Graph-based Perception (Text) Representation
- Title(参考訳): KeypartX: グラフベースの知覚(テキスト)表現
- Authors: Peng Yang
- Abstract要約: KeypartXは、音声認識の重要部分による知覚(一般的にはテキスト)を表現するグラフベースのアプローチである。
本研究は、音声のキー部分による知覚(テキスト全般)を表現するグラフベースのアプローチであるKeypartXを提案する。
- 参考スコア(独自算出の注目度): 4.023770829140818
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The availability of big data has opened up big opportunities for individuals,
businesses and academics to view big into what is happening in their world.
Previous works of text representation mostly focused on informativeness from
massive words' frequency or cooccurrence. However, big data is a double-edged
sword which is big in volume but unstructured in format. The unstructured edge
requires specific techniques to transform 'big' into meaningful instead of
informative alone.
This study presents KeypartX, a graph-based approach to represent perception
(text in general) by key parts of speech. Different from
bag-of-words/vector-based machine learning, this technique is human-like
learning that could extracts meanings from linguistic (semantic, syntactic and
pragmatic) information. Moreover, KeypartX is big-data capable but not hungry,
which is even applicable to the minimum unit of text:sentence.
- Abstract(参考訳): ビッグデータが利用可能になったことで、個人や企業、そして学者が、自分たちの世界で起きていることを大きく見る大きな機会が開かれた。
以前のテキスト表現は、大語彙の頻度や共起からの情報性に重点が置かれていた。
しかし、ビッグデータは、ボリュームは大きいがフォーマットは構造化されていない二重刃の剣である。
構造化されていないエッジは、情報のみではなく「大きな」を意味のあるものにする特定の技術を必要とする。
本研究は、音声のキー部分による知覚(テキスト全般)を表現するグラフベースのアプローチであるKeypartXを提案する。
bag-of-words/vector-based machine learningとは異なり、この技術は言語情報(セマンティック、構文、実用的な)から意味を抽出する人間のような学習である。
さらに、KeypartXはビッグデータ能力があるが空腹ではないため、最小単位のテキスト:文にも適用できる。
関連論文リスト
- Learning High-Quality and General-Purpose Phrase Representations [9.246374019271938]
フレーズ表現は、データサイエンスと自然言語処理において重要な役割を果たす。
現在の最先端手法では、フレーズ埋め込みのための訓練済み言語モデルを微調整する。
文脈自由な方法で句表現を学習するための改良されたフレームワークを提案する。
論文 参考訳(メタデータ) (2024-01-18T22:32:31Z) - Improving Small Footprint Few-shot Keyword Spotting with Supervision on
Auxiliary Data [19.075820340282934]
本稿では,音声データの収集が容易でラベルなしの読み出しを補助的情報源として利用するフレームワークを提案する。
次に、モデルがドメイン外補助データから表現力を向上するのに役立つマルチタスク学習を採用する。
論文 参考訳(メタデータ) (2023-08-31T07:29:42Z) - Speech representation learning: Learning bidirectional encoders with
single-view, multi-view, and multi-task methods [7.1345443932276424]
この論文は、時間や空間によるシーケンスデータの表現学習に焦点を当てている。
学習した表現を用いて下流のシーケンス予測タスクを改善することを目的としている。
論文 参考訳(メタデータ) (2023-07-25T20:38:55Z) - Everything is Connected: Graph Neural Networks [0.0]
この短い調査は、グラフ表現学習の領域において、読者が重要な概念を同化できるようにすることを目的としている。
この短い調査の主な目的は、読者がその領域における重要な概念を同化させ、関連する分野との適切なコンテキストにおける位置グラフ表現学習を可能にすることである。
論文 参考訳(メタデータ) (2023-01-19T18:09:43Z) - Graph-based Semantical Extractive Text Analysis [0.0]
本研究では,テキストの部分間の意味的類似性を組み込むことで,TextRankアルゴリズムの結果を改善する。
キーワード抽出とテキスト要約とは別に,本フレームワークに基づくトピッククラスタリングアルゴリズムを開発した。
論文 参考訳(メタデータ) (2022-12-19T18:30:26Z) - Improving Keyphrase Extraction with Data Augmentation and Information
Filtering [67.43025048639333]
キーフレーズ抽出はNLPにおける文書理解に不可欠なタスクの1つである。
本稿では,Behanceプラットフォーム上でストリームされたビデオからキーフレーズを抽出するための新しいコーパスと手法を提案する。
論文 参考訳(メタデータ) (2022-09-11T22:38:02Z) - Text-Based Person Search with Limited Data [66.26504077270356]
テキストベースの人物検索(TBPS)は、画像ギャラリーから対象人物を記述的なテキストクエリで検索することを目的としている。
限られたデータによってもたらされる問題に対処する2つの新しいコンポーネントを持つフレームワークを提案する。
論文 参考訳(メタデータ) (2021-10-20T22:20:47Z) - Be More with Less: Hypergraph Attention Networks for Inductive Text
Classification [56.98218530073927]
グラフニューラルネットワーク(GNN)は、研究コミュニティで注目され、この標準タスクで有望な結果を実証している。
成功にもかかわらず、それらのパフォーマンスは、単語間の高次相互作用をキャプチャできないため、実際は大部分が危険に晒される可能性がある。
本稿では,テキスト表現学習において,少ない計算量でより表現力の高いハイパーグラフアテンションネットワーク(HyperGAT)を提案する。
論文 参考訳(メタデータ) (2020-11-01T00:21:59Z) - Vokenization: Improving Language Understanding with Contextualized,
Visual-Grounded Supervision [110.66085917826648]
我々は,言語トークンを関連画像に文脈的にマッピングすることで,言語のみのデータに対するマルチモーダルアライメントを補間する手法を開発した。
語彙化」は比較的小さな画像キャプションデータセットに基づいて訓練され、それを大規模言語コーパスのための語彙生成に適用する。
これらの文脈的に生成された語彙を用いて学習し、視覚的に制御された言語モデルにより、複数の純粋言語タスクにおいて、自己教師による代替よりも一貫した改善が示される。
論文 参考訳(メタデータ) (2020-10-14T02:11:51Z) - ENT-DESC: Entity Description Generation by Exploring Knowledge Graph [53.03778194567752]
実際には、出力記述が最も重要な知識のみをカバーするため、入力知識は十分以上である可能性がある。
我々は、KG-to-textにおけるこのような実践的なシナリオの研究を容易にするために、大規模で挑戦的なデータセットを導入する。
本稿では,元のグラフ情報をより包括的に表現できるマルチグラフ構造を提案する。
論文 参考訳(メタデータ) (2020-04-30T14:16:19Z) - Deep Learning for Learning Graph Representations [58.649784596090385]
グラフデータのマイニングはコンピュータ科学においてポピュラーな研究トピックとなっている。
ネットワークデータの膨大な量は、効率的な分析に大きな課題をもたらしている。
これはグラフ表現の出現を動機付け、グラフを低次元ベクトル空間にマッピングする。
論文 参考訳(メタデータ) (2020-01-02T02:13:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。