entropy2333

  • 首页
  • 关于
  • 标签
  • 分类
  • 归档
  • 搜索
  • 文章目录
  • 站点概览
entropy2333

entropy2333

Cyber Security, SJTU
77 日志
9 分类
68 标签
GitHub RSS
Links
  • ainevsia
  • entropy2333
  • rooki3ray
  • thomas-li
  • schenk
0%

NLP From Scratch Without Large-Scale Pretraining: A Simple and Efficient Framework

发表于 2021-11-14 更新于 2022-01-23 分类于 Paper
本文字数: 1.9k

提出了一种简单有效的学习框架TLM,其不需要大规模的预训练。

image-20211114205822246

阅读全文 »

《自然语言处理入门》

发表于 2021-11-02 更新于 2022-01-23 分类于 思维导图
本文字数: 145

《自然语言处理入门》思维导图

阅读全文 »

Query2Label: A Simple Transformer Way to Multi-Label Classification

发表于 2021-10-10 更新于 2022-01-29 分类于 Paper
本文字数: 2.3k

来自清华-博世机器学习研究中心,将Transformer解码器用于多标签分类,将label embedding作为query,计算与feature map的cross-attention。在MS-COCO、PASCAL VOC、NUS-WIDE和Visual Genome上进行了实验,取得了SOTA结果。

image-20211010113901822

阅读全文 »

Lawformer: A Pre-trained Language Model for Chinese Legal Long Documents

发表于 2021-08-25 更新于 2022-01-23 分类于 Paper
本文字数: 1.1k

来自清华刘知远老师组,release了针对法律长文件的预训练语言模型。

image-20210825160718281

阅读全文 »

Label-Specific Dual Graph Neural Network for Multi-Label Text Classification

发表于 2021-08-23 更新于 2022-02-15 分类于 Paper
本文字数: 1.5k

ACL2021,来自中国科学院大学。提出LDGN,融入类别信息,基于label occurrence和dynamic reconstruction使用GCN建模。

image-20210823103052567

阅读全文 »

SimCSE: Simple Contrastive Learning of Sentence Embeddings

发表于 2021-07-06 更新于 2022-01-23 分类于 Paper
本文字数: 1.2k

来自陈丹琦(https://github.com/danqi)组的文章,利用Dropout作为数据增强,进行对比学习得到句子向量表示,在无监督和有监督的语义表示上刷新SOTA。

image-20210706175923388

阅读全文 »

Do Transformers Really Perform Bad for Graph Representation?

发表于 2021-06-20 更新于 2022-01-23 分类于 Paper
本文字数: 2.3k

Graphormer:KDD Cup2021 OGB-LSC赛道的冠军方案

image-20210620141421029

阅读全文 »

CSAPP Chap7: 链接

发表于 2021-04-26 更新于 2022-01-23
本文字数: 0

CSAPP Chap6: 存储器层次结构

发表于 2021-04-26 更新于 2022-01-23
本文字数: 0

CSAPP Chap5: 优化程序性能

发表于 2021-04-26 更新于 2022-01-23
本文字数: 0
1…345…8
© 2020 – 2023 entropy2333
158k