10月31日,我院在南坝校区学术报告厅举办“低资源序列标注”人工智能技术讲座,由唐詹博士主讲,各年级学生积极参与,现场氛围浓厚。活动旨在搭建 AI 前沿技术与学生的沟通桥梁,助力学子理解自然语言处理核心应用,激发探索热情。

讲座开篇,唐詹博士解析 “序列标注”:“本质是将无结构文本转化为带语义的结构化数据,通过打标签传递结构化信息。” 他以豆包、文心一言为例,说明 AI 工具的交互流程正是自然语言处理的典型应用,而这也是大模型的技术根基。
在核心知识环节,唐詹博士介绍词性标注、命名实体识别、语言角色标注三大任务,以 “我爱北京天安门” 拆解成分(如 “我” 为人称代词、“北京天安门” 为专有名词),让技术具象化。他还对比两类标注方法:基于规则的方法简单低成本,但难应对 “活语言”;基于统计的方法可弥补这一不足。
讲座尾声,唐詹博士展望三大发展趋势:一是技术融合,基于 Transformer 探索高效结构,未来数十年或持续在此框架内优化;二是多任务学习,通过联合训练(如同时完成实体识别与翻译)增强模型泛化能力;三是轻量化,强调 “不盲目堆参量”,以低参量、低硬件要求的高效 AI 工具为例,凸显轻量化价值。
此次讲座为学子搭建自然语言处理与序列标注认知框架,拓宽学术视野。未来,我院将持续聚焦 AI 前沿,举办更多高质量活动,为学生搭建学习交流平台,助力科技探索。
撰稿:向琴;兰博文
初审:彭小利
终审:杨成福
图片来源:新闻中心