論文の概要: The ACL OCL Corpus: advancing Open science in Computational Linguistics
- arxiv url: http://arxiv.org/abs/2305.14996v1
- Date: Wed, 24 May 2023 10:35:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-25 17:05:28.175361
- Title: The ACL OCL Corpus: advancing Open science in Computational Linguistics
- Title(参考訳): ACL OCL Corpus:Computational Linguisticsにおけるオープンサイエンスの進歩
- Authors: Shaurya Rohatgi, Yanxia Qin, Benjamin Aw, Niranjana Unnithan, Min-Yen
Kan
- Abstract要約: 我々はACLアンソロジーの学術コーパスを提示し、ACL OCLと命名された計算言語学領域におけるオープン科学研究を支援する。
以前のARC版やAAN版と比較すると、ACL OCLは論理セクション、数字への参照、大きな知識リソース(意味学者)へのリンクを含む構造化フルテキストを含んでいる。
- 参考スコア(独自算出の注目度): 14.372217770674778
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a scholarly corpus from the ACL Anthology to assist Open
scientific research in the Computational Linguistics domain, named as ACL OCL.
Compared with previous ARC and AAN versions, ACL OCL includes structured
full-texts with logical sections, references to figures, and links to a large
knowledge resource (semantic scholar). ACL OCL contains 74k scientific papers,
together with 210k figures extracted up to September 2022. To observe the
development in the computational linguistics domain, we detect the topics of
all OCL papers with a supervised neural model. We observe ''Syntax: Tagging,
Chunking and Parsing'' topic is significantly shrinking and ''Natural Language
Generation'' is resurging. Our dataset is open and available to download from
HuggingFace in https://huggingface.co/datasets/ACL-OCL/ACL-OCL-Corpus.
- Abstract(参考訳): 我々はACLアンソロジーの学術コーパスを提示し、ACL OCLと命名された計算言語学領域におけるオープン科学研究を支援する。
以前のARC版やAAN版と比較すると、ACL OCLは論理セクション、数字への参照、大きな知識リソース(意味学者)へのリンクを含む構造化フルテキストを含んでいる。
ACL OCLには74kの科学論文と2022年9月までに抽出された210kの論文が含まれている。
計算言語学領域の発展を観察するために,全ocl論文のトピックを教師付きニューラルモデルを用いて検出する。
我々は'syntax: Tagging, Chunking and Parsing'というトピックが大幅に縮小し、'Natural Language Generation'が復活しているのを観察する。
私たちのデータセットはオープンで、https://huggingface.co/datasets/ACL-OCL/ACL-OCL-Corpusでダウンロードできます。
関連論文リスト
- LATEX-GCL: Large Language Models (LLMs)-Based Data Augmentation for Text-Attributed Graph Contrastive Learning [35.69403361648343]
Text-Attributed Graphs (TAG)で学ぶためのGCLはまだ検討されていない。
GCLをTAGに適用するための簡単な戦略は、テキスト属性を言語モデルを通じて機能埋め込みにエンコードすることだ。
本稿では,LATEX-GCLという新しいGCLフレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-02T10:30:55Z) - ACL Anthology Helper: A Tool to Retrieve and Manage Literature from ACL
Anthology [30.962672279263778]
ACL Anthology Helperは、メタ情報とともに論文のパースとダウンロードのプロセスを自動化する。
これにより、"where"、"group"、"order"など、幅広い操作を使用して、ローカルペーパーの効率的な管理が可能になる。
論文 参考訳(メタデータ) (2023-10-31T13:59:05Z) - In-Context Learning Learns Label Relationships but Is Not Conventional
Learning [60.891931501449726]
大規模言語モデルの文脈内学習(ICL)能力について、現時点では合意が得られていない。
ICLがラベル情報をどのように活用するかという新たな洞察を提供し、機能と制限の両方を明らかにします。
実験の結果, ICLの予測はコンテキスト内ラベルにほぼ常に依存しており, ICLはコンテキスト内における真に新しいタスクを学習できることがわかった。
論文 参考訳(メタデータ) (2023-07-23T16:54:41Z) - HomoGCL: Rethinking Homophily in Graph Contrastive Learning [64.85392028383164]
HomoGCL はモデルに依存しないフレームワークで、近隣のノードに固有の意味を持つ正の集合を拡大する。
我々は、HomoGCLが6つの公開データセットにまたがって複数の最先端結果をもたらすことを示す。
論文 参考訳(メタデータ) (2023-06-16T04:06:52Z) - Label Words are Anchors: An Information Flow Perspective for
Understanding In-Context Learning [77.7070536959126]
大規模言語モデル(LLM)の有望な能力としてインコンテキスト学習(ICL)が出現する
本稿では,情報フローレンズを用いたICLの動作機構について検討する。
本稿では,ICL性能向上のためのアンカー再重み付け手法,推論の高速化のための実演圧縮手法,GPT2-XLにおけるICLエラーの診断のための解析フレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-23T15:26:20Z) - On Codex Prompt Engineering for OCL Generation: An Empirical Study [10.184056098238765]
Object Constraint Language (OCL)は、MOFモデルに制約とオブジェクトクエリ式を追加する宣言型言語である。
GPT-3のような最近のLPMの進歩は、多くのNLPタスクにおいてその能力を示している。
自然言語仕様からCodexが生成するOCL制約の信頼性について検討する。
論文 参考訳(メタデータ) (2023-03-28T18:50:51Z) - OpenICL: An Open-Source Framework for In-context Learning [48.75452105457122]
In-context Learning (ICL) と大規模言語モデル評価のためのオープンソースツールキット OpenICL を紹介する。
OpenICLは、ユーザが自分のニーズに合ったさまざまなコンポーネントを簡単に組み合わせられるように、非常に柔軟なアーキテクチャで研究に親しみやすい。
OpenICLの有効性は、分類、QA、機械翻訳、意味解析を含む幅広いNLPタスクで検証されている。
論文 参考訳(メタデータ) (2023-03-06T06:20:25Z) - ACL-Fig: A Dataset for Scientific Figure Classification [15.241086410108512]
科学文献から図形と表を抽出するパイプラインと、視覚的特徴を用いて科学的図形を分類するディープラーニングベースのフレームワークを開発する。
ACLアンソロジーにおける56K研究論文から抽出された112,052の科学的資料からなる,最初の大規模自動注釈コーパスであるACL-Figを構築した。
ACL-Fig-Pilotデータセットには、19のカテゴリに属する1,671の科学的数字が含まれている。
論文 参考訳(メタデータ) (2023-01-28T20:27:35Z) - A Survey on In-context Learning [77.78614055956365]
In-context Learning (ICL) は自然言語処理(NLP)の新しいパラダイムとして登場した。
まず、ICLの形式的定義を示し、関連する研究との相関を明らかにする。
次に、トレーニング戦略、迅速なデザイン戦略、関連する分析を含む高度なテクニックを組織化し、議論する。
論文 参考訳(メタデータ) (2022-12-31T15:57:09Z) - DenseCLIP: Extract Free Dense Labels from CLIP [130.3830819077699]
対照的に、CLIP(Contrastive Language- Image Pre-Training)は、オープンボキャブラリゼロショット画像認識において画期的な進歩を遂げた。
DenseCLIP+はSOTAトランスダクティブなゼロショットセマンティックセグメンテーション法を大きなマージンで上回る。
我々の発見は、DenseCLIPが高密度予測タスクの信頼性の高い新たな監視源となることを示唆している。
論文 参考訳(メタデータ) (2021-12-02T09:23:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。