論文の概要: GRITv2: Efficient and Light-weight Social Relation Recognition
- arxiv url: http://arxiv.org/abs/2403.06895v1
- Date: Mon, 11 Mar 2024 16:49:59 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-12 18:03:55.424345
- Title: GRITv2: Efficient and Light-weight Social Relation Recognition
- Title(参考訳): GRITv2: 効率的かつ軽量な社会関係認識
- Authors: N K Sagar Reddy, Neeraj Kasera, Avinash Thakur
- Abstract要約: 本研究は、グラフベースリレーショナル推論変換器(GRIT)の解析と改善に焦点を当てる。
PISC-fine データセットを用いて総合的アブレーション研究を行い,GRITv2 の効率と性能の改善について検討した。
GRITモデルにいくつかの特徴を導入し、新しいベンチマークをGRITv2-L(大型)とGRITv2-S(小型)の2つのバージョンで分析する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Our research focuses on the analysis and improvement of the Graph-based
Relation Inference Transformer (GRIT), which serves as an important benchmark
in the field. We conduct a comprehensive ablation study using the PISC-fine
dataset, to find and explore improvement in efficiency and performance of
GRITv2. Our research has provided a new state-of-the-art relation recognition
model on the PISC relation dataset. We introduce several features in the GRIT
model and analyse our new benchmarks in two versions: GRITv2-L (large) and
GRITv2-S (small). Our proposed GRITv2-L surpasses existing methods on relation
recognition and the GRITv2-S is within 2% performance gap of GRITv2-L, which
has only 0.0625x the model size and parameters of GRITv2-L. Furthermore, we
also address the need for model compression, an area crucial for deploying
efficient models on resource-constrained platforms. By applying quantization
techniques, we efficiently reduced the GRITv2-S size to 22MB and deployed it on
the flagship OnePlus 12 mobile which still surpasses the PISC-fine benchmarks
in performance, highlighting the practical viability and improved efficiency of
our model on mobile devices.
- Abstract(参考訳): 本研究は、グラフベースの関係推論変換器(GRIT)の分析と改善に焦点を当て、この分野における重要なベンチマークとして機能する。
PISC-fine データセットを用いて総合的アブレーション研究を行い,GRITv2 の効率と性能の改善について検討した。
本研究は,PISC関係データセットに基づく最先端関係認識モデルを提案する。
GRITモデルにいくつかの機能を導入し、新しいベンチマークをGRITv2-L(大型)とGRITv2-S(小型)の2つのバージョンで分析する。
提案したGRITv2-Lは既存の関係認識手法を超越し,GRITv2-SはGRITv2-Lのモデルサイズとパラメータのわずか0.0625倍である。
さらに,資源制約のあるプラットフォーム上で効率的なモデルをデプロイする上で重要な領域であるモデル圧縮の必要性にも対処する。
量子化技術を適用することで,GRITv2-Sサイズを22MBに効率よく削減し,PISC-fineベンチマークをいまだに超越しているフラッグシップのOnePlus 12モバイルにデプロイした。
関連論文リスト
- Spectral Subspace Clustering for Attributed Graphs [3.974852803981998]
部分空間クラスタリングは、n 個のデータポイントの集合を k (kn) グループに分割する部分空間を同定しようとする。
本稿では,SCAG計算に有効な2つのアルゴリズム,S2CAGとM-S2CAGを提案する。
論文 参考訳(メタデータ) (2024-11-17T13:22:15Z) - Enhancing Heterogeneous Knowledge Graph Completion with a Novel GAT-based Approach [3.8357926394952306]
異種知識グラフのための新しいGATベースの知識グラフ補完法を提案する。
GATHには2つの異なるアテンションネットワークモジュールが組み込まれている。
我々のモデルは、FB15K-237データセットで5.2%と5.2%、WN18RRデータセットで4.5%と14.6%の性能を改善する。
論文 参考訳(メタデータ) (2024-08-05T13:28:51Z) - Once for Both: Single Stage of Importance and Sparsity Search for Vision Transformer Compression [63.23578860867408]
重要度評価と疎度評価を1段階にまとめる方法について検討する。
重要度と疎度の両方を同時に評価するコスト効率の高いOFBを提案する。
実験により、OFBは最先端のサーチベースおよびプルーニングベース手法よりも優れた圧縮性能が得られることが示された。
論文 参考訳(メタデータ) (2024-03-23T13:22:36Z) - Optimization Efficient Open-World Visual Region Recognition [55.76437190434433]
RegionSpotは、ローカライゼーション基盤モデルから位置認識ローカライゼーション知識と、ViLモデルからのセマンティック情報を統合する。
オープンワールドオブジェクト認識の実験では、私たちのRereaSpotは、以前の代替よりも大きなパフォーマンス向上を実現しています。
論文 参考訳(メタデータ) (2023-11-02T16:31:49Z) - DiffNAS: Bootstrapping Diffusion Models by Prompting for Better
Architectures [63.12993314908957]
そこで我々は,DiffNASと呼ばれるベースモデル探索手法を提案する。
GPT-4をスーパーネットとして利用して検索を高速化し,検索メモリを補足して結果を向上する。
厳密な実験により,GPTに基づくシナリオでは,探索効率を2倍に向上できることが示された。
論文 参考訳(メタデータ) (2023-10-07T09:10:28Z) - Challenging the Myth of Graph Collaborative Filtering: a Reasoned and Reproducibility-driven Analysis [50.972595036856035]
本稿では,6つの人気グラフと最近のグラフ推薦モデルの結果を再現するコードを提案する。
これらのグラフモデルと従来の協調フィルタリングモデルを比較する。
ユーザの近所からの情報フローを調べることにより,データセット構造における内在的特徴にどのようなモデルが影響するかを同定することを目的とする。
論文 参考訳(メタデータ) (2023-08-01T09:31:44Z) - Adaptive Depth Graph Attention Networks [19.673509341792606]
グラフアテンションネットワーク(GAT)は、グラフ表現のための最も高度な学習アーキテクチャであると考えられている。
層数の増加に伴ってGATモデルの精度が制限される主な要因は,オーバーカッシング現象である。
本稿では,グラフの空間性に基づいた階層数を適応的に選択するGAT変種モデル-ADGATを提案する。
論文 参考訳(メタデータ) (2023-01-16T05:22:29Z) - GOHSP: A Unified Framework of Graph and Optimization-based Heterogeneous
Structured Pruning for Vision Transformer [76.2625311630021]
視覚変換器(ViT)は、様々なコンピュータビジョンタスクにおいて非常に印象的な経験的性能を示している。
この問題を緩和するために、構造化プルーニングはモデルサイズを圧縮し、実用的な効率を実現するための有望な解決策である。
グラフと最適化に基づく構造的プルーニング(Structured Pruning)を統合化したフレームワークであるGOHSPを提案する。
論文 参考訳(メタデータ) (2023-01-13T00:40:24Z) - CascadER: Cross-Modal Cascading for Knowledge Graph Link Prediction [22.96768147978534]
本稿では,効率を向上しつつ,完全アンサンブルのランキング精度を維持するための階層型ランキングアーキテクチャCascaderを提案する。
CascadER は LM を用いて、より効率的な KGE の出力を再現し、KGE の精度向上を最大化しつつ、LM を最小限に呼び出すための適応的なサブセット選択方式に依存している。
実験により, モデル間の多様性と個々のモデルの信頼性信号の保存がカスケーダの有効性を説明するのに有効であることがわかった。
論文 参考訳(メタデータ) (2022-05-16T22:55:45Z) - SPLADE v2: Sparse Lexical and Expansion Model for Information Retrieval [11.38022203865326]
SPLADEモデルは、最先端の高密度かつスパースなアプローチに関して、高度にスパースな表現と競争結果を提供する。
我々は、プール機構を変更し、文書拡張のみに基づいてモデルをベンチマークし、蒸留で訓練されたモデルを導入する。
全体として、SPLADEはTREC DL 2019のNDCG@10で9ドル以上のゲインで大幅に改善され、BEIRベンチマークで最先端の結果が得られた。
論文 参考訳(メタデータ) (2021-09-21T10:43:42Z) - How Knowledge Graph and Attention Help? A Quantitative Analysis into
Bag-level Relation Extraction [66.09605613944201]
バッグレベルの関係抽出(RE)における注意と知識グラフの効果を定量的に評価する。
その結果,(1)注目精度の向上は,エンティティ参照特徴を抽出するモデルの性能を損なう可能性があること,(2)注目性能は様々なノイズ分布パターンの影響が大きいこと,(3)KG強化された注目はRE性能を向上するが,その効果は注目度を向上させるだけでなく,先行するエンティティを組み込むことによっても改善することがわかった。
論文 参考訳(メタデータ) (2021-07-26T09:38:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。