論文の概要: KeypartX: Graph-based Perception (Text) Representation
- arxiv url: http://arxiv.org/abs/2209.11844v1
- Date: Fri, 23 Sep 2022 20:15:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-27 15:38:44.950780
- Title: KeypartX: Graph-based Perception (Text) Representation
- Title(参考訳): KeypartX: グラフベースの知覚(テキスト)表現
- Authors: Peng Yang
- Abstract要約: KeypartXは、音声認識の重要部分による知覚(一般的にはテキスト)を表現するグラフベースのアプローチである。
本研究は、音声のキー部分による知覚(テキスト全般)を表現するグラフベースのアプローチであるKeypartXを提案する。
- 参考スコア(独自算出の注目度): 4.023770829140818
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The availability of big data has opened up big opportunities for individuals,
businesses and academics to view big into what is happening in their world.
Previous works of text representation mostly focused on informativeness from
massive words' frequency or cooccurrence. However, big data is a double-edged
sword which is big in volume but unstructured in format. The unstructured edge
requires specific techniques to transform 'big' into meaningful instead of
informative alone.
This study presents KeypartX, a graph-based approach to represent perception
(text in general) by key parts of speech. Different from
bag-of-words/vector-based machine learning, this technique is human-like
learning that could extracts meanings from linguistic (semantic, syntactic and
pragmatic) information. Moreover, KeypartX is big-data capable but not hungry,
which is even applicable to the minimum unit of text:sentence.
- Abstract(参考訳): ビッグデータが利用可能になったことで、個人や企業、そして学者が、自分たちの世界で起きていることを大きく見る大きな機会が開かれた。
以前のテキスト表現は、大語彙の頻度や共起からの情報性に重点が置かれていた。
しかし、ビッグデータは、ボリュームは大きいがフォーマットは構造化されていない二重刃の剣である。
構造化されていないエッジは、情報のみではなく「大きな」を意味のあるものにする特定の技術を必要とする。
本研究は、音声のキー部分による知覚(テキスト全般)を表現するグラフベースのアプローチであるKeypartXを提案する。
bag-of-words/vector-based machine learningとは異なり、この技術は言語情報(セマンティック、構文、実用的な)から意味を抽出する人間のような学習である。
さらに、KeypartXはビッグデータ能力があるが空腹ではないため、最小単位のテキスト:文にも適用できる。
関連論文リスト
- iText2KG: Incremental Knowledge Graphs Construction Using Large Language Models [0.7165255458140439]
iText2KGは、後処理なしで漸進的にトピックに依存しない知識グラフを構築する方法である。
提案手法は,3つのシナリオにまたがるベースライン手法と比較して,優れた性能を示す。
論文 参考訳(メタデータ) (2024-09-05T06:49:14Z) - Graphite: A Graph-based Extreme Multi-Label Short Text Classifier for Keyphrase Recommendation [3.4693396519698108]
Keyphrase Recommendationは、広告とeコマースにおいて重要な問題である。
従来のニューラルネットワークモデルは、大きなラベル空間のために実現不可能か、推論が遅いかのいずれかである。
本稿では,標準的なテキスト分類モデルに匹敵するリアルタイムなキーワードレコメンデーションを提供するグラフベースモデルを提案する。
論文 参考訳(メタデータ) (2024-07-29T23:41:26Z) - Semantic Scaling: Bayesian Ideal Point Estimates with Large Language Models [0.0]
セマンティックスケーリング(Semantic Scaling)はテキストから理想的な点推定法である。
私は、大きな言語モデルを利用して、その表現された姿勢に基づいて文書を分類し、調査のようなデータを抽出します。
Semantic Scalingは、既存のテキストベースのスケーリングメソッドを大幅に改善する。
論文 参考訳(メタデータ) (2024-05-03T20:20:15Z) - Speech representation learning: Learning bidirectional encoders with
single-view, multi-view, and multi-task methods [7.1345443932276424]
この論文は、時間や空間によるシーケンスデータの表現学習に焦点を当てている。
学習した表現を用いて下流のシーケンス予測タスクを改善することを目的としている。
論文 参考訳(メタデータ) (2023-07-25T20:38:55Z) - Graph-based Semantical Extractive Text Analysis [0.0]
本研究では,テキストの部分間の意味的類似性を組み込むことで,TextRankアルゴリズムの結果を改善する。
キーワード抽出とテキスト要約とは別に,本フレームワークに基づくトピッククラスタリングアルゴリズムを開発した。
論文 参考訳(メタデータ) (2022-12-19T18:30:26Z) - Improving Keyphrase Extraction with Data Augmentation and Information
Filtering [67.43025048639333]
キーフレーズ抽出はNLPにおける文書理解に不可欠なタスクの1つである。
本稿では,Behanceプラットフォーム上でストリームされたビデオからキーフレーズを抽出するための新しいコーパスと手法を提案する。
論文 参考訳(メタデータ) (2022-09-11T22:38:02Z) - Text-Based Person Search with Limited Data [66.26504077270356]
テキストベースの人物検索(TBPS)は、画像ギャラリーから対象人物を記述的なテキストクエリで検索することを目的としている。
限られたデータによってもたらされる問題に対処する2つの新しいコンポーネントを持つフレームワークを提案する。
論文 参考訳(メタデータ) (2021-10-20T22:20:47Z) - Be More with Less: Hypergraph Attention Networks for Inductive Text
Classification [56.98218530073927]
グラフニューラルネットワーク(GNN)は、研究コミュニティで注目され、この標準タスクで有望な結果を実証している。
成功にもかかわらず、それらのパフォーマンスは、単語間の高次相互作用をキャプチャできないため、実際は大部分が危険に晒される可能性がある。
本稿では,テキスト表現学習において,少ない計算量でより表現力の高いハイパーグラフアテンションネットワーク(HyperGAT)を提案する。
論文 参考訳(メタデータ) (2020-11-01T00:21:59Z) - Vokenization: Improving Language Understanding with Contextualized,
Visual-Grounded Supervision [110.66085917826648]
我々は,言語トークンを関連画像に文脈的にマッピングすることで,言語のみのデータに対するマルチモーダルアライメントを補間する手法を開発した。
語彙化」は比較的小さな画像キャプションデータセットに基づいて訓練され、それを大規模言語コーパスのための語彙生成に適用する。
これらの文脈的に生成された語彙を用いて学習し、視覚的に制御された言語モデルにより、複数の純粋言語タスクにおいて、自己教師による代替よりも一貫した改善が示される。
論文 参考訳(メタデータ) (2020-10-14T02:11:51Z) - ENT-DESC: Entity Description Generation by Exploring Knowledge Graph [53.03778194567752]
実際には、出力記述が最も重要な知識のみをカバーするため、入力知識は十分以上である可能性がある。
我々は、KG-to-textにおけるこのような実践的なシナリオの研究を容易にするために、大規模で挑戦的なデータセットを導入する。
本稿では,元のグラフ情報をより包括的に表現できるマルチグラフ構造を提案する。
論文 参考訳(メタデータ) (2020-04-30T14:16:19Z) - Deep Learning for Learning Graph Representations [58.649784596090385]
グラフデータのマイニングはコンピュータ科学においてポピュラーな研究トピックとなっている。
ネットワークデータの膨大な量は、効率的な分析に大きな課題をもたらしている。
これはグラフ表現の出現を動機付け、グラフを低次元ベクトル空間にマッピングする。
論文 参考訳(メタデータ) (2020-01-02T02:13:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。