Logo
Loading...
清华大学刘知远教授个人主页
GAIR DAO 2025-04-30



刘知远

清华大学计算机系自然语言处理实验室, 副教授

email: liuzy [at] tsinghua.edu.cn

phone:62777701 

地址: 北京市海淀区清华大学FIT大楼4-506, 100084

谷歌学术主页



个人简介

刘知远,清华大学计算机系副教授、博士生导师。主要研究方向为自然语言处理、基础模型。2011年获得清华大学博士学位,已在ACL、EMNLP、IJCAI、AAAI等人工智能领域的著名国际期刊和会议发表相关论文200余篇,Google Scholar统计引用超过3.3万次。曾获教育部自然科学一等奖(第2完成人)、中国中文信息学会钱伟长中文信息处理科学技术奖一等奖(第2完成人)、中国中文信息学会汉王青年创新奖,入选国家青年人才项目、北京智源研究院青年科学家、2020-2022连续三年Elsevier中国高被引学者、《麻省理工科技评论》中国区35岁以下科技创新35人榜单、中国科协青年人才托举工程。担任中文信息学会理事、社会媒体处理专委会副主任,期刊AI Open副主编,ACL、EMNLP、WWW、CIKM、COLING等国际著名会议领域主席。


研究方向

知识图谱与语义计算, 社会计算与计算社会科学.


教育经历

  • 2017年12月 - 至今. 清华大学计算机系, 教研系列准聘副教授.

  • 2016年8月 - 2017年12月. 清华大学计算机系, 教研系列助理教授.

  • 2013年12月 - 2016年8月. 清华大学计算机系, 助理研究员.

  • 2011年8月 - 2013年12月. 清华大学计算机系, 博士后.

  • 2006年8月 - 2011年7月. 清华大学计算机系, 博士.

  • 2002年8月 - 2006年7月. 清华大学计算机系, 本科.


研究项目

  • 项目负责人. 大规模知识图谱的分布式表示学习、知识获取与推理应用(61572273). 国家自然科学基金 (NSFC)面上基金项目, 2016-2019.

  • 项目负责人. Robust Full-document Entity Recognition and Disambiguation with Large-Scale Knowledge Bases. 清华大学媒体与网络技术教育部-微软重点实验室. 2014-2015.

  • 项目负责人. Efficient Chinese Entity Linking for Large-scale Web Corpus to Heterogeneous Entity Networks. 清华大学媒体与网络技术教育部-微软重点实验室. 2013-2014.

  • 项目负责人. 基于协同语义计算的社交媒体信息扩散与可信性研究(61202140). 国家自然科学基金 (NSFC)青年基金项目, 2013-2015.

  • 项目参与人. 关键词抽取与社会标签推荐相结合的中文文本主题词自动标注方法研究. 国家自然科学基金 (NSFC)面上项目, 2012-2015.

  • 项目参与人. 汉语复杂网络的性质、结构、演化及其典型应用研究. 国家自然科学基金 (NSFC)面上项目, 2009-2011.

  • 项目参与人. 大规模网络图文数据的语义分类和适度理解技术研究. 863项目, 2007-2009.


个人奖项

2023年高等学校科学研究优秀成果奖(科学技术)自然科学一等奖,排名第2 (2023)

世界人工智能大会青年优秀论文奖 (2023)

2023年世界互联网大会领先科技奖 (2023)

2021-2022年度清华大学“刘冰奖” (2022)

“大规模知识图表示学习的体系化基础算法及开源工具”入选世界互联网领先科技成果 (2022)

Frontiers of Computer Science期刊2019-2020年度优秀青年AE (2021)

教育部高等学校科学研究优秀成果奖(科学技术)自然科学奖一等奖 - 结构化知识表示学习方法 (2020)

中国中文信息学会科学技术奖/钱伟长中文信息处理科学技术奖 - 大规模中文词汇语义分析关键技术及其开源应用 (2020)

中国精品科技期刊顶尖学术论文(F5000, 论文题目: 知识表示学习研究进展) (2020)《中国科学: 信息科学》2019年热点论文奖(论文题目: 网络表示学习综述) (2020)

《清华大学学报(自然科学版)》优秀审稿人 (2020)

AI 2000人工智能全球最具影响力学者 (2020)

清华大学先进工作者 (2020)

中国计算机学会杰出演讲者 (2019)

北京智源人工智能研究院青年科学家 (2019)

中国新闻传播学年鉴优秀论文奖(论文题目: 社交媒体平台谣言的早期自动检测) (2019)

MIT TR 35中国区榜单 (2018)

中国科协青年人才托举计划 (2017)

中国中文信息学会-钱伟长中文信息处理科学技术奖青年创新一等奖 (2016)

CCF-Intel 青年学者提升计划 (2015)


个人论文

Highly Cited:

Zhou, Jie, et al. "Graph neural networks: A review of methods and applications." AI open 1 (2020): 57-81.

Lin, Yankai, et al. "Learning entity and relation embeddings for knowledge graph completion." Proceedings of the AAAI conference on artificial intelligence. Vol. 29. No. 1. 2015.

Zhang, Zhengyan, et al. "ERNIE: Enhanced language representation with informative entities." arXiv preprint arXiv:1905.07129 (2019).

Yang, Cheng, et al. "Network representation learning with rich text information." IJCAI. Vol. 2015. 2015.

Lin, Yankai, et al. "Neural relation extraction with selective attention over instances." Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers). 2016.

Zhou, Chunting, Chonglin Sun, Zhiyuan Liu, and Francis Lau. "A C-LSTM neural network for text classification." arXiv preprint arXiv:1511.08630 (2015).


Click here for more publications.


Recent Publication

[1] Parameter-efficient fine-tuning of large-scale pre-trained language models. Ning Ding, Yujia Qin, Guang Yang, Fuchao Wei, Zonghan Yang, Yusheng Su, Shengding Hu, Yulin Chen, Chi-Min Chan, Weize Chen, Jing Yi, Weilin Zhao, Xiaozhi Wang, Zhiyuan Liu, Hai-Tao Zheng, Jianfei Chen, Yang Liu, Jie Tang, Juanzi Li, Maosong Sun. Nature Machine Intelligence, 2023.

[2] Transcription between human-readable synthetic descriptions and machine-executable instructions: an application of the latest pre-training technology. Zheni Zeng, Yi-Chen Nie, Ning Ding, Qian-Jun Ding, Wei-Ting Ye, Cheng Yang, Maosong Sun, E Weinan, Rong Zhu, Zhiyuan Liu. Chemical Science, 2023.

[3] WebCPM: Interactive Web Search for Chinese Long-form Question Answering. Yujia Qin, Zihan Cai, Dian Jin, Lan Yan, Shihao Liang, Kunlun Zhu, Yankai Lin, Xu Han, Ning Ding, Huadong Wang, Ruobing Xie, Fanchao Qi, Zhiyuan Liu, Maosong Sun, Jie Zhou. ACL, 2023.

[4] Augmentation-Adapted Retriever Improves Generalization of Language Models as Generic Plug-In. Xinze Li, Zhenghao Liu, Chenyan Xiong, Shi Yu, Yu Gu, Zhiyuan Liu, Ge Yu. ACL, 2023.

[5] Exploring Lottery Prompts for Pre-trained Language Models. Yulin Chen, Ning Ding, Xiaobin Wang, Shengding Hu, Haitao Zheng, Zhiyuan Liu, Pengjun Xie. ACL, 2023.

[6] Parameter-efficient Weight Ensembling Facilitates Task-level Knowledge Transfer. Xingtai Lv, Ning Ding, Yujia Qin, Zhiyuan Liu and Maosong Sun. ACL, 2023.

[7] Plug-and-Play Knowledge Injection for Pre-trained Language Models. Zhengyan Zhang, Zhiyuan Zeng, Yankai Lin, Huadong Wang, Deming Ye, Chaojun Xiao, Xu Han, Zhiyuan Liu, Peng Li, Maosong Sun, Jie Zhou. ACL, 2023.

[8] READIN: A Chinese Multi-Task Benchmark with Realistic and Diverse Input Noises. Chenglei Si, Zhengyan Zhang, Yingfa Chen, Xiaozhi Wang, Zhiyuan Liu and Maosong Sun. ACL, 2023.

[9] Decoder Tuning: Efficient Language Understanding as Decoding. Ganqu Cui, Wentao Li, Ning Ding, Longtao Huang, Zhiyuan Liu, Maosong Sun. ACL, 2023.

[10] A Close Look into the Calibration of Pre-trained Language Models. Yangyi Chen, Lifan Yuan, Ganqu Cui, Zhiyuan Liu, Heng Ji. ACL, 2023.


媒体报道

独家对话刘知远:AGI 是一场技术理想与商业现实的「持久战」

这是一个与「朱啸虎们」相反的 AGI 叙事。


当李大海遇上刘知远:知乎和面壁的「大模型」故事
李大海和刘知远,6年前种下的种子,终于在大模型时代开花结果。

清华刘知远:大模型「十问」,寻找新范式下的研究方向


刘知远、赵鑫、施柏鑫:AI青年科研人员成长之路


清华刘知远 | 流言能止于智者吗?网络虚假信息的特征与检测


清华刘知远:好的研究想法从哪里来

清华大学刘知远:在 NLP 领域「做事」兼「发声」

中国 VC 谈大模型:AGI 是「理想国」,还是「乌托邦」?

AI 大模型开源之困:垄断、围墙与算力之殇
从新兴技术转变为AI基础设施,大模型开源很重要,但也很难。


相关业者

孙茂松(清华大学):清华大学自然语言处理实验室(THUNLP)的负责人;与刘知远教授共同在自然语言处理、知识图谱和社会计算等领域开展研究,合著《知识图谱与深度学习》(2020年),共同参与国家自然科学基金重点项目“面向大规模知识图谱的表示学习与推理”,提出知识图谱嵌入模型(如TransE改进算法)。
钱忱(清华大学):清华大学博士后,他的合作导师包括孙茂松教授和刘知远教授。
黄民烈(清华大学):与刘知远教授共同参与了大规模预训练模型的研究,并在相关领域发表了多篇论文,如共同指导OpenDialKG项目,构建对话与知识图谱结合的开放数据集。
赵军(中国科学院自动化研究所):与刘知远教授共同提出动态时序知识图谱模型DyERNIE(TKDE 2021),解决实体关系随时间演化的问题。
周国栋(苏州大学):苏州大学特聘教授,与刘知远教授共同研究了信息抽取和机器翻译等课题。
刘洋(清华大学):清华大学自然语言处理实验室的另一位重要成员,与刘知远教授并称为“二刘老师”。两人在自然语言处理领域有长期的合作
车万翔(哈尔滨工业大学):与刘知远教授共同举办了多次学术交流活动。
陈浩(中国香港科技大学):中国香港科技大学计算机科学与工程系的教授,与刘知远教授合作开发基于多模态医学知识的问答系统MedQA,融合临床指南和影像报告(Nature Communications Medicine 2023)。