entropy2333

NLP From Scratch Without Large-Scale Pretraining: A Simple and Efficient Framework

发表于 2021-11-14 更新于 2022-01-23 分类于 Paper

本文字数： 1.9k

提出了一种简单有效的学习框架TLM，其不需要大规模的预训练。

阅读全文 »

《自然语言处理入门》

发表于 2021-11-02 更新于 2022-01-23 分类于思维导图

本文字数： 145

《自然语言处理入门》思维导图

阅读全文 »

Query2Label: A Simple Transformer Way to Multi-Label Classification

发表于 2021-10-10 更新于 2022-01-29 分类于 Paper

本文字数： 2.3k

来自清华-博世机器学习研究中心，将Transformer解码器用于多标签分类，将label embedding作为query，计算与feature map的cross-attention。在MS-COCO、PASCAL VOC、NUS-WIDE和Visual Genome上进行了实验，取得了SOTA结果。

阅读全文 »

Lawformer: A Pre-trained Language Model for Chinese Legal Long Documents

发表于 2021-08-25 更新于 2022-01-23 分类于 Paper

本文字数： 1.1k

来自清华刘知远老师组，release了针对法律长文件的预训练语言模型。

阅读全文 »

Label-Specific Dual Graph Neural Network for Multi-Label Text Classification

发表于 2021-08-23 更新于 2022-02-15 分类于 Paper

本文字数： 1.5k

ACL2021，来自中国科学院大学。提出LDGN，融入类别信息，基于label occurrence和dynamic reconstruction使用GCN建模。

阅读全文 »

SimCSE: Simple Contrastive Learning of Sentence Embeddings

发表于 2021-07-06 更新于 2022-01-23 分类于 Paper

本文字数： 1.2k

来自陈丹琦（https://github.com/danqi）组的文章，利用Dropout作为数据增强，进行对比学习得到句子向量表示，在无监督和有监督的语义表示上刷新SOTA。

阅读全文 »

Do Transformers Really Perform Bad for Graph Representation?

发表于 2021-06-20 更新于 2022-01-23 分类于 Paper

本文字数： 2.3k

Graphormer：KDD Cup2021 OGB-LSC赛道的冠军方案

阅读全文 »

CSAPP Chap7: 链接

发表于 2021-04-26 更新于 2022-01-23

本文字数： 0

CSAPP Chap6: 存储器层次结构

发表于 2021-04-26 更新于 2022-01-23

本文字数： 0

CSAPP Chap5: 优化程序性能

发表于 2021-04-26 更新于 2022-01-23

本文字数： 0