自然语言处理(NLP)
"自然语言处理(Natural Language Processing, NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。"
自然语言处理有啥用
- 智能问答
- 智能对话
在线点咖啡 - 机器同传
同声传译:https://tongchuan.baidu.com/
自然语言处理的挑战
- 多样性
怎么抓蛐蛐、蟋蟀的捕捉方法 - 歧义性
什么颜色加什么颜色等于灰色、什么颜色加灰色等于什么颜色
关于『理解』的标准
人类C同时和电脑A,人类B进行交流,A\B之间有分隔。C发出一个查询时,同时收到两份结果,人类C已经不能区分具体是A的还是B的结果时,说明通过了问答的图灵测试。对话、翻译测试同理
自然语言处理技术发展
统计学习方法-特征工程
需要专家对任务的理解,撰写任务的特征,计算机根据这些特征进行学习训练,得到模型。依赖专家的知识和任务的理解
如:情感分析。一段评论,判断是正向还是负向的。专家就会撰写一些特征如,包括喜欢等关键词就是正向的。包括讨厌等负向词,机器就认为是负向的。
耗费人力、专家的理解很难枚举全。
深度学习方法-表示学习
自动学习,更多的精力放在了任务本身,如何建模、优化模型。降低了人力上的成本,研发效率也得到了很大的提升