論文の概要: FastLexRank: Efficient Lexical Ranking for Structuring Social Media Posts
- arxiv url: http://arxiv.org/abs/2410.01183v1
- Date: Wed, 2 Oct 2024 02:34:33 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-04 22:50:44.172525
- Title: FastLexRank: Efficient Lexical Ranking for Structuring Social Media Posts
- Title(参考訳): FastLexRank:ソーシャルメディアの投稿を構造化するための効率的な語彙ランク付け
- Authors: Mao Li, Frederick Conrad, Johann Gagnon-Bartsch,
- Abstract要約: FastLexRankはテキストランキングのためのLexRankアルゴリズムの効率的でスケーラブルな実装である。
文グラフの定常分布を計算するために最適化されたアプローチを用いることで、FastLexRankは元のLexRankスコアと同じ結果を維持する。
- 参考スコア(独自算出の注目度): 2.6126272668390373
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We present FastLexRank\footnote{https://github.com/LiMaoUM/FastLexRank}, an efficient and scalable implementation of the LexRank algorithm for text ranking. Designed to address the computational and memory complexities of the original LexRank method, FastLexRank significantly reduces time and memory requirements from $\mathcal{O}(n^2)$ to $\mathcal{O}(n)$ without compromising the quality or accuracy of the results. By employing an optimized approach to calculating the stationary distribution of sentence graphs, FastLexRank maintains an identical results with the original LexRank scores while enhancing computational efficiency. This paper details the algorithmic improvements that enable the processing of large datasets, such as social media corpora, in real-time. Empirical results demonstrate its effectiveness, and we propose its use in identifying central tweets, which can be further analyzed using advanced NLP techniques. FastLexRank offers a scalable solution for text centrality calculation, addressing the growing need for efficient processing of digital content.
- Abstract(参考訳): 我々は、テキストランキングのためのLexRankアルゴリズムの効率的かつスケーラブルな実装であるFastLexRank\footnote{https://github.com/LiMaoUM/FastLexRank}を提案する。
元のLexRank法の計算とメモリの複雑さに対処するために設計されたFastLexRankは、結果の品質や精度を損なうことなく、$\mathcal{O}(n^2)$から$\mathcal{O}(n)$に時間とメモリの要求を著しく削減する。
FastLexRankは、文グラフの定常分布を計算するために最適化されたアプローチを採用することで、計算効率を向上しながら、元のLexRankスコアと同じ結果を維持する。
本稿では,ソーシャルメディアコーパスなどの大規模データセットをリアルタイムに処理できるアルゴリズムの改良について述べる。
実験により,その効果を実証し,より高度なNLP技術を用いてさらに分析できる中心的ツイートの同定に利用することを提案する。
FastLexRankはテキスト中心性計算のためのスケーラブルなソリューションを提供する。
関連論文リスト
- LexBoost: Improving Lexical Document Retrieval with Nearest Neighbors [37.64658206917278]
LexBoostは、インデックス化中に密集した検索アプローチを使用して、密集した隣人(コーパスグラフ)のネットワークを構築する。
我々は、文書の語彙的関連点と隣人のスコアの両方を、文書のランク付けに用いている。
LexBoost上の再ランクは、従来の高密度リランクよりも優れており、高いレイテンシの排他的高密度検索に匹敵する結果をもたらすことを示す。
論文 参考訳(メタデータ) (2024-08-25T18:11:37Z) - LexMatcher: Dictionary-centric Data Collection for LLM-based Machine Translation [67.24113079928668]
本稿では、バイリンガル辞書に見られる感覚のカバレッジによって駆動されるデータキュレーション手法であるLexMatcherを提案する。
我々の手法は、WMT2022テストセットの確立されたベースラインよりも優れています。
論文 参考訳(メタデータ) (2024-06-03T15:30:36Z) - Provably Efficient Representation Learning with Tractable Planning in
Low-Rank POMDP [81.00800920928621]
部分的に観測可能なマルコフ決定過程(POMDP)における表現学習の研究
まず,不確実性(OFU)に直面した最大推定(MLE)と楽観性を組み合わせた復調性POMDPのアルゴリズムを提案する。
次に、このアルゴリズムをより広範な$gamma$-observable POMDPのクラスで機能させる方法を示す。
論文 参考訳(メタデータ) (2023-06-21T16:04:03Z) - Learning the Positions in CountSketch [49.57951567374372]
本稿では,まずランダムなスケッチ行列に乗じてデータを圧縮し,最適化問題を高速に解くスケッチアルゴリズムについて検討する。
本研究では,ゼロでないエントリの位置を最適化する学習ベースアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-06-11T07:28:35Z) - Balancing Lexical and Semantic Quality in Abstractive Summarization [0.38073142980733]
本稿では,リランカが語彙的品質と意味的品質のバランスをとる新しいトレーニング手法を提案する。
CNN/DailyMail と XSum のデータセットを用いた実験では,語彙的側面を著しく劣化させることなく要約の意味を推定できることがわかった。
論文 参考訳(メタデータ) (2023-05-17T02:18:31Z) - Zero-Shot Listwise Document Reranking with a Large Language Model [58.64141622176841]
本稿では,タスク固有の学習データを用いることなく,言語モデル(LRL)を用いたリスワイズ・リランカを提案する。
3つのTRECウェブサーチデータセットの実験により、LRLは第1段検索結果の再ランク付け時にゼロショットポイントワイズ法より優れるだけでなく、最終段再ランカとしても機能することが示された。
論文 参考訳(メタデータ) (2023-05-03T14:45:34Z) - Coordinate Descent for SLOPE [6.838073951329198]
SLOPE(Sorted L-One Penalized Estimation, SLOPE)は、ラッソの一般化であり、統計的に魅力的な性質を持つ。
SLOPEに適合する現在のソフトウェアパッケージは、高次元において性能の悪いアルゴリズムに依存している。
近似勾配降下と近似座標降下ステップを組み合わせたSLOPE最適化問題を高速に解くアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-10-26T15:20:30Z) - Learning-to-Rank at the Speed of Sampling: Plackett-Luce Gradient
Estimation With Minimal Computational Complexity [13.579420996461439]
本稿では,最良ソートアルゴリズムに匹敵する計算量で非バイアス勾配推定を行うPL-Rank-3アルゴリズムを提案する。
実験結果から,性能を損なうことなく,最適化に要する時間が大きく向上することが示唆された。
論文 参考訳(メタデータ) (2022-04-22T18:01:33Z) - A Fast Randomized Algorithm for Massive Text Normalization [26.602776972067936]
大規模テキストデータのクリーン化と正準化を行うスケーラブルなランダム化アルゴリズムであるFLANを提案する。
本アルゴリズムは, 単語間のジャカード類似性を利用して補正結果を提案する。
実世界のデータセットに対する実験結果は,FLANの有効性と有効性を示す。
論文 参考訳(メタデータ) (2021-10-06T19:18:17Z) - Providing Meaningful Data Summarizations Using Examplar-based Clustering
in Industry 4.0 [67.80123919697971]
我々は,従来のCPUアルゴリズムと比較して,一精度で最大72倍,半精度で最大452倍の高速化を実現していることを示す。
提案アルゴリズムは射出成形プロセスから得られた実世界のデータに適用し, 得られたサマリーが, コスト削減と不良部品製造の削減のために, この特定のプロセスのステアリングにどのように役立つかについて議論する。
論文 参考訳(メタデータ) (2021-05-25T15:55:14Z) - Estimating leverage scores via rank revealing methods and randomization [50.591267188664666]
任意のランクの正方形密度あるいはスパース行列の統計レバレッジスコアを推定するアルゴリズムについて検討した。
提案手法は,高密度およびスパースなランダム化次元性還元変換の合成と階調明細化法を組み合わせることに基づく。
論文 参考訳(メタデータ) (2021-05-23T19:21:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。