論文の概要: The ACL OCL Corpus: Advancing Open Science in Computational Linguistics
- arxiv url: http://arxiv.org/abs/2305.14996v2
- Date: Tue, 24 Oct 2023 05:18:32 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-26 00:32:57.562388
- Title: The ACL OCL Corpus: Advancing Open Science in Computational Linguistics
- Title(参考訳): ACL OCL Corpus:計算言語学におけるオープンサイエンスの推進
- Authors: Shaurya Rohatgi, Yanxia Qin, Benjamin Aw, Niranjana Unnithan, Min-Yen
Kan
- Abstract要約: ACL OCLは70年間に渡り、73Kの論文と210Kの数字を含んでいる。
教師付きニューラルモデルで論文のトピックを検出することで、"Syntax: Tagging, Chunking and Parsing"への関心が薄れ、"hugging Language Generation"が復活しつつあることに注意する。
- 参考スコア(独自算出の注目度): 19.282407097200917
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present ACL OCL, a scholarly corpus derived from the ACL Anthology to
assist Open scientific research in the Computational Linguistics domain.
Integrating and enhancing the previous versions of the ACL Anthology, the ACL
OCL contributes metadata, PDF files, citation graphs and additional structured
full texts with sections, figures, and links to a large knowledge resource
(Semantic Scholar). The ACL OCL spans seven decades, containing 73K papers,
alongside 210K figures.
We spotlight how ACL OCL applies to observe trends in computational
linguistics. By detecting paper topics with a supervised neural model, we note
that interest in "Syntax: Tagging, Chunking and Parsing" is waning and "Natural
Language Generation" is resurging. Our dataset is available from HuggingFace
(https://huggingface.co/datasets/WINGNUS/ACL-OCL).
- Abstract(参考訳): 本稿では、ACLアンソロジーから派生した学術コーパスであるACL OCLを紹介し、計算言語学領域におけるオープン科学研究を支援する。
ACLアンソロジーの以前のバージョンの統合と拡張により、ACL OCLはメタデータ、PDFファイル、引用グラフ、セクション、数字、大きな知識リソースへのリンクを含む構造化されたフルテキストをコントリビュートする(Semantic Scholar)。
ACL OCLは、73Kの論文と210Kの数字を含む70年に及ぶ。
我々は、ACL OCLが計算言語学の傾向を観察するためにどのように適用されているかに注目する。
教師付きニューラルモデルを用いて論文のトピックを検出することで、"Syntax: Tagging, Chunking and Parsing"への関心が薄れ、"Natural Language Generation"が復活しつつあることに注意する。
私たちのデータセットはHuggingFace (https://huggingface.co/datasets/WINGNUS/ACL-OCL)から入手可能です。
関連論文リスト
- LATEX-GCL: Large Language Models (LLMs)-Based Data Augmentation for Text-Attributed Graph Contrastive Learning [35.69403361648343]
Text-Attributed Graphs (TAG)で学ぶためのGCLはまだ検討されていない。
GCLをTAGに適用するための簡単な戦略は、テキスト属性を言語モデルを通じて機能埋め込みにエンコードすることだ。
本稿では,LATEX-GCLという新しいGCLフレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-02T10:30:55Z) - ACL Anthology Helper: A Tool to Retrieve and Manage Literature from ACL
Anthology [30.962672279263778]
ACL Anthology Helperは、メタ情報とともに論文のパースとダウンロードのプロセスを自動化する。
これにより、"where"、"group"、"order"など、幅広い操作を使用して、ローカルペーパーの効率的な管理が可能になる。
論文 参考訳(メタデータ) (2023-10-31T13:59:05Z) - In-Context Learning Learns Label Relationships but Is Not Conventional
Learning [60.891931501449726]
大規模言語モデルの文脈内学習(ICL)能力について、現時点では合意が得られていない。
ICLがラベル情報をどのように活用するかという新たな洞察を提供し、機能と制限の両方を明らかにします。
実験の結果, ICLの予測はコンテキスト内ラベルにほぼ常に依存しており, ICLはコンテキスト内における真に新しいタスクを学習できることがわかった。
論文 参考訳(メタデータ) (2023-07-23T16:54:41Z) - HomoGCL: Rethinking Homophily in Graph Contrastive Learning [64.85392028383164]
HomoGCL はモデルに依存しないフレームワークで、近隣のノードに固有の意味を持つ正の集合を拡大する。
我々は、HomoGCLが6つの公開データセットにまたがって複数の最先端結果をもたらすことを示す。
論文 参考訳(メタデータ) (2023-06-16T04:06:52Z) - Label Words are Anchors: An Information Flow Perspective for
Understanding In-Context Learning [77.7070536959126]
大規模言語モデル(LLM)の有望な能力としてインコンテキスト学習(ICL)が出現する
本稿では,情報フローレンズを用いたICLの動作機構について検討する。
本稿では,ICL性能向上のためのアンカー再重み付け手法,推論の高速化のための実演圧縮手法,GPT2-XLにおけるICLエラーの診断のための解析フレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-23T15:26:20Z) - On Codex Prompt Engineering for OCL Generation: An Empirical Study [10.184056098238765]
Object Constraint Language (OCL)は、MOFモデルに制約とオブジェクトクエリ式を追加する宣言型言語である。
GPT-3のような最近のLPMの進歩は、多くのNLPタスクにおいてその能力を示している。
自然言語仕様からCodexが生成するOCL制約の信頼性について検討する。
論文 参考訳(メタデータ) (2023-03-28T18:50:51Z) - OpenICL: An Open-Source Framework for In-context Learning [48.75452105457122]
In-context Learning (ICL) と大規模言語モデル評価のためのオープンソースツールキット OpenICL を紹介する。
OpenICLは、ユーザが自分のニーズに合ったさまざまなコンポーネントを簡単に組み合わせられるように、非常に柔軟なアーキテクチャで研究に親しみやすい。
OpenICLの有効性は、分類、QA、機械翻訳、意味解析を含む幅広いNLPタスクで検証されている。
論文 参考訳(メタデータ) (2023-03-06T06:20:25Z) - ACL-Fig: A Dataset for Scientific Figure Classification [15.241086410108512]
科学文献から図形と表を抽出するパイプラインと、視覚的特徴を用いて科学的図形を分類するディープラーニングベースのフレームワークを開発する。
ACLアンソロジーにおける56K研究論文から抽出された112,052の科学的資料からなる,最初の大規模自動注釈コーパスであるACL-Figを構築した。
ACL-Fig-Pilotデータセットには、19のカテゴリに属する1,671の科学的数字が含まれている。
論文 参考訳(メタデータ) (2023-01-28T20:27:35Z) - A Survey on In-context Learning [77.78614055956365]
In-context Learning (ICL) は自然言語処理(NLP)の新しいパラダイムとして登場した。
まず、ICLの形式的定義を示し、関連する研究との相関を明らかにする。
次に、トレーニング戦略、迅速なデザイン戦略、関連する分析を含む高度なテクニックを組織化し、議論する。
論文 参考訳(メタデータ) (2022-12-31T15:57:09Z) - DenseCLIP: Extract Free Dense Labels from CLIP [130.3830819077699]
対照的に、CLIP(Contrastive Language- Image Pre-Training)は、オープンボキャブラリゼロショット画像認識において画期的な進歩を遂げた。
DenseCLIP+はSOTAトランスダクティブなゼロショットセマンティックセグメンテーション法を大きなマージンで上回る。
我々の発見は、DenseCLIPが高密度予測タスクの信頼性の高い新たな監視源となることを示唆している。
論文 参考訳(メタデータ) (2021-12-02T09:23:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。