《自然语言处理入门》 是一本务实的NLP入门书,助你零起点上手自然语言处理。
本书基础理论与生产代码并重,Python与Java双实现。从基本概念出发,逐步介绍中文分词、词性标注、命名实体识别、信息抽取、文本聚类、文本分类、句法分析这几个热门问题的算法原理与工程实现。书中通过对多种算法的讲解,比较了它们的优缺点和适用场景,同时详细演示生产级成熟代码,助你真正将自然语言处理应用在生产环境中。

  • 京东: 《自然语言处理入门 Python/Java双代码实现(图灵出品)》(何晗)【摘要 书评 试读】- 京东图书
  • 当当: 《自然语言处理入门》(何晗)【简介_书评_在线阅读】 - 当当图书
  • 图灵: https://www.ituring.com.cn/book/2706

    配书代码:

  • Java: https://github.com/hankcs/HanLP/tree/1.x/src/test/java/com/hankcs/book
  • Python: https://github.com/hankcs/pyhanlp/tree/master/tests/book Install

    随着拙作的流行,一些没有编程基础的读者也开始阅读 《自然语言处理入门》 。若遇到pyhanlp安装运行问题,请按照 教程视频 一步步来,实在没能力的请直接使用 傻瓜安装包

    https://od.hankcs.com/?/book/intro_nlp/%E5%AE%89%E8%A3%85%E5%8C%85/pyhanlp%20Win10%E5%AE%89%E8%A3%85%E6%95%99%E7%A8%8B.mp4

    随着对本书的学习,你将从普通程序员晋级为机器学习工程师,最后进化到自然语言处理工程师。

    疑问1: P347:倒数第二段,“人们尚不知道人类思考与推理问题的过程、信达雅地遣词造句的机理,所以无法手工选择合理的特征”,其中“信达雅”应该是写错了把?

    疑问2:P352:一张1280*800的24位彩色图片是一个262144000维的向量?
    这是怎么计算的?

  •