自然语言处理(NLP)
基础:语言模型
ChatGPT能力
语言理解和生成能力
抽象能力
强大的学习和泛化能力
自然语言处理
交叉学科:计算机科学、人工智能/机器学习、语言学等
自然语言理解:理解文字的含义
自然语言生成:用文字表达特定的意图和思想
利用计算机对自然语言进行各种加工处理、信息提取及应用的技术,实现人与机器之间的自然语言交互
自然语言的歧义性 -> 自然语言处理困难
词法、句法、篇章、语义
NLP任务类型
文本分类
- 输入:文本 \(x\)
- 输出:文本 \(x\) 所属的标签 \(y\)
文本匹配
- 输入:文本 \(x_a\) 和文本 \(x_b\)
- 输出:文本 \(x_a\) 和文本 \(x_b\) 的关系标签 \(y\)
序列化标注
- 输入:文本 \(x\)
- 输出:文本 \(x\) 中每个单词 \(x_i\) 的标签 \(y_i\)
机器阅读理解
- 输入:文本 \(x_p\) 和问题 \(x_q\)
- 输出:根据文本 \(x_p\) 生成问题 \(x_q\) 对应的答案
序列到序列
- 输入:文本 \(x\)
- 输出:文本 \(x\) 对应的文本 \(y\)
情绪智能
人机交互与情绪智能
研究价值:
-
建立分析与理解人类情感的理论和方法。
-
推动自然语言处理技术的发展。
-
促进交叉学科研究:情感、认知、社会之间的复杂关系。
应用价值:
- 个人:情绪支持、消费策略等
- 企业:企业决策、广告营销、产品改进等
- 国家:舆情分析、情绪管理、政策制定等
- 国际:舆论对抗、情绪操纵等
研究动机:
- 已有工作忽略了文本中的感性评价(用户)和理性评价(商品)。
- 感性评价和理性评价从不同角度影响文本的情感极性。
基于用户&商品注意力的情感分类框架[AAAI 2018]
面向属性的观点词抽取[NAACL 2019]
- 面向属性的观点词抽取:给定属性词,从文本中抽取属性对应的观点词。
- 研究细粒度情感分析中重要属性词-观点词对应关系。
- 观点词可以作为属性情感的原因,提供决策依据。
统一的细粒度观点抽取框架[EMNLP 2020]
细粒度观点词抽取
- 从文本中抽取所有的观点三元词组<方面目标,观点词,情感极性>。
- 流水线方案存在错误传播问题。
- 涉及多个元素抽取、配对任务,很难端到端求解。
解决方案:网格标注方案(Grid Tagging Scheme, GTS):将抽取、分类等不同形式的子任务转换为统一的词对标注任务。
- 抽取:属性词抽取、观点词抽取。
- 分类:情感分类、属性词和观点词的配对分类。
面向目标的多模态情感分类[COLING 2022]
任务定义:给定一对文本和图片以及文本中待分析的目标对象,判断目标对象的情感极性。
研究动机:
- 文本不一定包含情感信息,有时需要从图片获得精确的情感区域来帮助判断情感极性。
- 在小规模训练数据集上,很难获得精确的情感对齐信息。
知识增强的多模态情感分类框架
- Adjective Noun Pairs(ANP)[Borth et al., 2013]:利用大规模视觉知识提取工具抽取图片中的形容词-名词对。
- 名词能帮助对其文本中的目标对象,形容词能帮助判断目标对象的情感极性。
大模型性格控制[2024]
研究动机
- 不同大模型展示出不同的合成性格,有时表现出冒犯性和攻击性。
- 模型架构、训练数据、训练方法对大模型合成性格的影响不得而知,无法控制。
研究展望1:多模态情感理解与推理
- 多个对象的情感分别是什么?
- 他们的情感是否有关联?
- 他们的情感是如何影响并相互转化的?
研究展望2:情感/个性化对话与生成
- 生成带有情感/个性化的对话回复
- 个性化Chatbot
- 医疗:同理心回复,抑郁康复
- ......
研究展望3:情绪激发
- 将目标对象的情绪激发至特定的状态。
- 教育:激发学习兴趣
- 医疗:抑郁康复
- 商业:广告营销
- 军事:情绪操纵
- ......