011.自然语言处理入门

011.自然语言处理入门

作为一个NLPer,读过一些市面上的NLP书籍,也关注着最新的NLP书籍。今天带来一本HanNLP作者的NLP入门书——《自然语言处理入门》。

自然语言处理入门

本书的口号是:一本可以在地铁上也能学会NLP开发的图书,那我们来看看是怎么做到通俗易懂的。

  1. 它的定位是NLP入门,内容都是NLP的基础技术,涉及的主要是文本处理方法和传统的机器学习,深度学习并不多。这也是此书的一个缺点,深度不够,这和此书的定位有一些关系。

  2. NLP的书,必然有理论和公式,但是此书只允许必不可少的公式出现,降低了一些门槛,容易上手。我是觉得此书的理论有一些欠缺,介绍得不全面。

  3. 以开源项目HanNLP的代码实现为基础,讲解基础的自然语言基础技术,提供了Python和Java的关键实现。HanNLP库我没有用过,但是有一些地方有种库文档的感觉,关键Python还是Python2的代码,确实有一些欠妥。

此书有一个附加的思维导图,我觉得很好,如下图所示,读者可以根据这个导图来构建完整的知识结构。

观点

最近看了一篇文章,里面讲到AI的下一个战场,认知智能。

现在人工智能主要的特点就是数据驱动。先对数据进行一些处理,做分类,检测等,然后再做一些决策,这种研究其实并不是理解,只是一个非常表现的匹配。

现在流行的深度学习都是基于数据的方法,属于归纳的方法,不具有可解释性,要从感知智能走到认知智能,依靠深度学习远远不够。

那怎么才能走到认知智能呢?像人一样,有归纳能力,有推理能力,有运用知识的能力。

以后的认知智能一定是一个多学科的融合,而NLP是人工智能从计算智能、感知智能走向认知智能的关键。

总结

  • 推荐理由: 自然语言处理入门,但不够深入
  • 总体打分: 四星(值得读)