論文の概要: Visualization of Extremely Sparse Contingency Table by Taxicab
Correspondence Analysis: A Case Study of Textual Data
- arxiv url: http://arxiv.org/abs/2308.03079v1
- Date: Sun, 6 Aug 2023 10:14:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-08 16:51:34.458664
- Title: Visualization of Extremely Sparse Contingency Table by Taxicab
Correspondence Analysis: A Case Study of Textual Data
- Title(参考訳): タクシー対応分析による極端にスパースな一致表の可視化:テキストデータの事例研究
- Authors: V. Choulakian and J. Allard (Universit\'e de Moncton Canada)
- Abstract要約: 本稿では, 高度にスパースな出現率表の可視化のために, 頑健な対応解析の亜種であるTaxicab対応解析の概要について述べる。
特に、サハとフォコエが最近導入した8つの神典の断片について、サイズ590×8265の極めてまばらなテキストデータセットを視覚化する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present an overview of taxicab correspondence analysis, a robust variant
of correspondence analysis, for visualization of extremely sparse ontingency
tables. In particular we visualize an extremely sparse textual data set of size
590 by 8265 concerning fragments of 8 sacred books recently introduced by Sah
and Fokou\'e (2019) and studied quite in detail by (12 + 1) dimension reduction
methods (t-SNE, UMAP, PHATE,...) by Ma, Sun and Zou (2022).
- Abstract(参考訳): 本稿では,非常に少ないオンティンジェンシー表を可視化するために,ロバストな対応解析の変種であるタキシカブ対応解析の概要を示す。
特に,sah と fokou\'e (2019) が最近導入した8冊の聖典の断片について,サイズ 590 と 8265 の極めて疎いテキストデータセットを可視化し,ma,sun,zou (2022) による (12 + 1) 次元縮小法 (t-sne, umap, phate, ...) で詳細に研究した。
関連論文リスト
- ChartThinker: A Contextual Chain-of-Thought Approach to Optimized Chart Summarization [32.19963543411396]
本研究は,各チャートに包括的チャートキャプチャペアと微調整命令の大規模データセットを構築した。
本稿では,思考の連鎖に基づいて深い分析を合成する,革新的なチャート要約手法であるChartThinkerを提案する。
キュレートされたデータセットに基づいて、トレーニングされたモデルは、チャートの要約タスクにおいて、常に優れたパフォーマンスを示します。
論文 参考訳(メタデータ) (2024-03-17T14:49:09Z) - Text2Analysis: A Benchmark of Table Question Answering with Advanced
Data Analysis and Unclear Queries [67.0083902913112]
高度な解析タスクを取り入れたText2Analysisベンチマークを開発した。
また,5つのイノベーティブかつ効果的なアノテーション手法を開発した。
3つの異なる指標を用いて5つの最先端モデルを評価する。
論文 参考訳(メタデータ) (2023-12-21T08:50:41Z) - Doc2SoarGraph: Discrete Reasoning over Visually-Rich Table-Text
Documents via Semantic-Oriented Hierarchical Graphs [79.0426838808629]
視覚的にリッチなテーブルテキスト文書に答えるTAT-DQAを提案する。
具体的には、離散推論機能を強化した新しいDoc2SoarGraphフレームワークを提案する。
我々は,TAT-DQAデータセットに関する広範な実験を行い,提案したフレームワークは,テストセット上でのエクサクティマッチ(EM)とF1スコアでそれぞれ17.73%,F1スコアで16.91%の最高のベースラインモデルを上回る結果を得た。
論文 参考訳(メタデータ) (2023-05-03T07:30:32Z) - Rooms with Text: A Dataset for Overlaying Text Detection [0.18275108630751835]
オーバレイとシーンテキストを用いた室内画像の新しいデータセットを導入し,計4836枚の注釈付き画像を25種類の製品カテゴリに分類した。
本稿では,文字領域を意識したテキスト検出フレームワークを活用して分類モデルを導出するテキスト検出のベースライン手法を提案する。
論文 参考訳(メタデータ) (2022-11-21T11:04:41Z) - A Bibliographic View on Constrained Clustering [4.705291741591329]
本稿では,制約付きクラスタリング領域とそのサブトピックの一般的な傾向について述べる。
利用可能なソフトウェアをリストアップし、参照コレクションの実験的なセクションを分析します。
私たちがレビューしたトピックの中で、アプリケーション研究は近年最も豊富でした。
論文 参考訳(メタデータ) (2022-09-22T16:11:47Z) - Unraveling the graph structure of tabular datasets through Bayesian and
spectral analysis [3.128267020893596]
ネストブロックモデル(nSBM)によって得られた階層的モジュラー構造の推論は,特徴のクラスを特定し,非自明な関係を解くのに役立つことを示す。
ブラジルの学生を対象に実施した社会経済調査: PeNSE 調査について分析した。
論文 参考訳(メタデータ) (2021-10-04T12:51:55Z) - ConvoSumm: Conversation Summarization Benchmark and Improved Abstractive
Summarization with Argument Mining [61.82562838486632]
我々は、さまざまなオンライン会話形式のニュースコメント、ディスカッションフォーラム、コミュニティ質問応答フォーラム、電子メールスレッドに関する4つの新しいデータセットをクラウドソースする。
我々は、データセットの最先端モデルをベンチマークし、データに関連する特徴を分析します。
論文 参考訳(メタデータ) (2021-06-01T22:17:13Z) - Learning Relation Prototype from Unlabeled Texts for Long-tail Relation
Extraction [84.64435075778988]
本稿では,ラベルのないテキストから関係プロトタイプを学習するための一般的なアプローチを提案する。
我々は、エンティティ間の暗黙的な要因として関係プロトタイプを学習する。
私たちは、New York TimesとGoogle Distant Supervisionの2つの公開データセットで実験を行います。
論文 参考訳(メタデータ) (2020-11-27T06:21:12Z) - Liputan6: A Large-scale Indonesian Dataset for Text Summarization [43.375797352517765]
オンラインニュースポータルであるLiputan6.comから記事を抽出し、215,827のドキュメント-要約ペアを取得する。
事前学習した言語モデルを用いて,データセット上のベンチマーク抽出および抽象的要約手法を開発する。
論文 参考訳(メタデータ) (2020-11-02T02:01:12Z) - Leveraging Graph to Improve Abstractive Multi-Document Summarization [50.62418656177642]
我々は、文書のよく知られたグラフ表現を活用することができる、抽象的多文書要約(MDS)モデルを開発する。
本モデルでは,長い文書の要約に欠かせない文書間関係を捉えるために,文書の符号化にグラフを利用する。
また,このモデルでは,要約生成プロセスの導出にグラフを利用することが可能であり,一貫性と簡潔な要約を生成するのに有用である。
論文 参考訳(メタデータ) (2020-05-20T13:39:47Z) - Agglomerative Neural Networks for Multi-view Clustering [109.55325971050154]
本稿では,最適コンセンサスを近似する凝集分析法を提案する。
本稿では,制約付きラプラシアンランクに基づくANN(Agglomerative Neural Network)を用いて,マルチビューデータをクラスタリングする。
4つの一般的なデータセットに対する最先端のマルチビュークラスタリング手法に対する我々の評価は、ANNの有望なビュー・コンセンサス分析能力を示している。
論文 参考訳(メタデータ) (2020-05-12T05:39:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。