論文の概要: MultiSiam: A Multiple Input Siamese Network For Social Media Text
Classification And Duplicate Text Detection
- arxiv url: http://arxiv.org/abs/2401.06783v1
- Date: Sat, 6 Jan 2024 09:13:34 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-22 12:26:09.242066
- Title: MultiSiam: A Multiple Input Siamese Network For Social Media Text
Classification And Duplicate Text Detection
- Title(参考訳): MultiSiam:ソーシャルメディアのテキスト分類と重複テキスト検出のための複数入力シームネットワーク
- Authors: Sudhanshu Bhoi, Swapnil Markhedkar, Shruti Phadke, and Prashant
Agrawal
- Abstract要約: ソーシャルメディアのアカウントは、ますます類似したコンテンツを投稿し、プラットフォーム間のカオス体験を生み出している。
本稿ではまず,複数入力のSiameseネットワークであるMultiSiamを提案する。
この縮合されたネットワークを用いて別のモデルSMCDを提案し、重複したテキストグループ化と分類を行う。
- 参考スコア(独自算出の注目度): 1.124958340749622
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Social media accounts post increasingly similar content, creating a chaotic
experience across platforms, which makes accessing desired information
difficult. These posts can be organized by categorizing and grouping duplicates
across social handles and accounts. There can be more than one duplicate of a
post, however, a conventional Siamese neural network only considers a pair of
inputs for duplicate text detection. In this paper, we first propose a
multiple-input Siamese network, MultiSiam. This condensed network is then used
to propose another model, SMCD (Social Media Classification and Duplication
Model) to perform both duplicate text grouping and categorization. The
MultiSiam network, just like the Siamese, can be used in multiple applications
by changing the sub-network appropriately.
- Abstract(参考訳): ソーシャルメディアのアカウントはますます似たようなコンテンツを投稿し、プラットフォーム間のカオスな体験を生み出し、望ましい情報へのアクセスを困難にしている。
これらの投稿は、ソーシャルハンドルとアカウントをまたいで重複を分類しグループ化することで整理することができる。
投稿の重複は複数あるが、従来のsiamのニューラルネットワークでは、重複したテキスト検出のために1対の入力しか考慮していない。
本稿ではまず,複数入力のSiameseネットワークであるMultiSiamを提案する。
次に、この縮合されたネットワークを用いて、重複テキストグループ化と分類の両方を行う別のモデルSMCD(Social Media Classification and Duplication Model)を提案する。
siameseと同様に、multisiamネットワークはサブネットワークを適切に変更することで、複数のアプリケーションで使用できる。
関連論文リスト
- Encoding Multi-Domain Scientific Papers by Ensembling Multiple CLS
Tokens [48.925698497311835]
Multi2SPEは、複数のCLSトークンのそれぞれに、トークンの埋め込みを集約するさまざまな方法を学ぶことを奨励する。
また,Multi2SPEは,マルチドメイン励磁予測において最大25%の誤差を減少させることを示した。
論文 参考訳(メタデータ) (2023-09-08T14:00:29Z) - Single-branch Network for Multimodal Training [19.690844799632327]
本稿では,ネットワークを変更することなく,一助詞の識別表現とマルチモーダルタスクを学習できる新しい単一ブランチネットワークを提案する。
本提案手法は,クロスモーダル検証と各種損失定式化タスクの整合性に挑戦するマルチモーダル問題(対面音声アソシエーション)に基づいて,提案したシングルブランチネットワークの評価を行う。
論文 参考訳(メタデータ) (2023-03-10T18:48:40Z) - SWAT: Spatial Structure Within and Among Tokens [53.525469741515884]
我々は,トークン化時に空間構造が保存される場合,モデルが顕著な利得が得られることを論じる。
本研究では,(1)構造認識のトークン化と(2)構造認識のミキシングという2つの重要なコントリビューションを提案する。
論文 参考訳(メタデータ) (2021-11-26T18:59:38Z) - MixMo: Mixing Multiple Inputs for Multiple Outputs via Deep Subnetworks [97.08677678499075]
マルチインプットマルチアウトプットディープワークを学ぶための新しいフレームワークであるMixMoを紹介します。
機能、特にCutMixのパッチによるバイナリの混合は、ワークをより強く、より多様なものにすることによって、結果を向上します。
実装が容易で、推論にコストがかかることに加えて、我々のモデルはよりコストの高いデータ拡張深層アンサンブルよりも優れています。
論文 参考訳(メタデータ) (2021-03-10T15:31:02Z) - Minimally-Supervised Structure-Rich Text Categorization via Learning on
Text-Rich Networks [61.23408995934415]
テキストリッチネットワークから学習することで,最小限に教師付き分類を行う新しいフレームワークを提案する。
具体的には、テキスト理解のためのテキスト解析モジュールと、クラス差別的でスケーラブルなネットワーク学習のためのネットワーク学習モジュールの2つのモジュールを共同でトレーニングします。
実験の結果,1つのカテゴリに3つのシード文書しか与えられず,その精度は約92%であった。
論文 参考訳(メタデータ) (2021-02-23T04:14:34Z) - Who will accept my request? Predicting response of link initiation in
two-way relation networks [7.547803601922528]
本稿では、双方向ネットワークにおけるリンク開始フィードバックの予測方法である、ソーシャルネットワーク分析とマイニングにおける重要な問題に対処する。
双方向ネットワークにおける2つの個人間の関係には、招待者が受け入れた場合に確立されたリンクとなる1人の個人からのリンク招待が含まれる。
本稿では,この多層的手法によるリンク開始フィードバック予測問題を解く手法を提案する。
論文 参考訳(メタデータ) (2020-12-21T08:14:37Z) - Evaluation of Siamese Networks for Semantic Code Search [9.302773716125955]
我々は,シームズネットワークが,コードやテキストからリッチな情報を抽出するネットワーク上で,強力なレギュレータとして機能することを示す。
また、これらのネットワークの埋め込み空間を解析し、シームズネットワークのパワーをセマンティックコード検索に活用するための方向性を提供する。
論文 参考訳(メタデータ) (2020-10-12T06:07:39Z) - Improve Document Embedding for Text Categorization Through Deep Siamese
Neural Network [2.398608007786179]
テキストの低次元表現は、効率的な自然言語処理タスクにおける主要な課題の1つである。
ベクトル空間表現において、類似したトピックを持つ文書を類似した空間にマッピングするために、ディープ・シームズニューラルネットワークの利用を提案する。
提案した表現は,本データセットのテキスト分類タスクにおいて,従来型および最先端の表現よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-05-31T17:51:08Z) - Detecting Communities in Heterogeneous Multi-Relational Networks:A
Message Passing based Approach [89.19237792558687]
コミュニティは、ソーシャルネットワーク、生物学的ネットワーク、コンピュータおよび情報ネットワークを含むネットワークの共通の特徴である。
我々は,全同種ネットワークのコミュニティを同時に検出する効率的なメッセージパッシングに基づくアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-04-06T17:36:24Z) - Multi-view Deep Subspace Clustering Networks [64.29227045376359]
マルチビューサブスペースクラスタリングは、相補的な情報の複数のビューを融合することによって、データ固有の構造を発見することを目的としている。
本稿では,MvDSCN(Multi-view Deep Subspace Clustering Networks)を提案する。
MvDSCNはクラスタリング性能を高めるために複数のバックボーンを統合する。
論文 参考訳(メタデータ) (2019-08-06T06:44:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。