自然语言处理（2026春国科大计算机学院专业核心课）

王石、资康莉、刘瑜, 课程编号：180086085404P2009Y, 2026

本课程重点介绍基于大模型的自然语言处理基础知识、核心技术以及应用方法，并简要介绍传统自然语言处理的相关知识。内容以深入浅出方式展开，对基础知识适当展开回顾，同时及时更新最新研究论文内容，旨在让学生系统地掌握大模型为主的自然语言处理技术，适合于从事该领域研究、工程应用的研究生或相关从业人员。

课程安排：

1-18周：玉泉路校区教学楼阶一5，5-7节（13:30-16:10）
第4/8/12周周日加课：玉泉路校区教学楼阶二5，5-7节（13:30-16:10）
教学日历（期末考试：18周周五（7月3日）13：30-15：30，阶二5）
PPT下载（提取码: im2q）

[第一部分基础知识]

01 Hello, NLP!

人人都爱NLP
Hello，NLP！
NLP任务概览
大语言模型

02 神经网络

神经网络原理（MLP）
训练神经网络（BP）
常见网络结构（RNN/LSTM/GRU）
Encoder-Decoder架构

03 注意力

带注意力的Encoder-Decoder
自注意力
位置编码
Transformers

04 词嵌入

什么是词嵌入
Word2Vec
Glove
词元Token

练习1 - 从入门到变形

手搓异或网络
PyTorch版异或网络
NNLM
Transformer

[第二部分大语言模型]

05 预训练

什么是预训练
预训练方法
预训练大语言模型

06 提示

什么是prompt
提示工程
提示学习

07 微调

全量微调
参数高效微调
指令微调

08 推理（Inference）优化

KV缓存
注意力优化
模型瘦身(量化/稀疏/蒸馏)
混合专家MOE
批处理

09 对齐

大模型对齐
强化学习
偏好优化
对齐评测

10 推理（Reasoning）

什么是推理模型
推理方式
训练方法
典型模型

练习2 - MiniMind：从零训练一个小大语言模型

Pretrain
SFT
RL
Take Home

[第三部分大语言模型应用]

11 RAG

RAG整体框架
文档处理
文档检索
GraphRAG

12 智能体

什么是Agent
感知
规划
记忆
工具调用

13 多智能体

多智能体概述
多智能体协作
智能体社会仿真

练习3 - 试一试智能体框架

LangChain/LangGraph
AgentScope
OpenClaw
Hermes

[第四部分温故知新]

14 Hello again, NLP!

文本分类
文本匹配
序列标注
文本生成

15 安全

概述
内生安全
衍生安全

16 多模态大模型

简介
预训练
评测
展望

17 前沿讲座

合影留念

Twitter Facebook LinkedIn