NLTK配套书《用Python进行自然语言处理》(Natural Language Processing with Python)已经出版好几年了,但是国内一直没有翻译的中文版,虽然读英文原版是最好的选择,但是对于多数读者,如果有中文版,一定是不错的。下午在微博上看到 陈涛sean 同学提供了NLTK配套书的中译本下载,就追问了一下,之后译者和我私信联系,并交流了一下,才发现是作者无偿翻译的,并且没有出版计划的。翻译是个很苦的差事,向译者致敬,另外译者说里面有一些错误,希望能得到nlper们的指正,大家一起来修正这个珍贵的NLTK中文版吧。另外译者希望在“52nlp”上做个推荐,这事是造福nlper的好事,我已经在“资源”里更新了本书的链接,以下是书的下载地址:

PYTHON自然语言处理中文翻译-NLTK Natural Language Processing with Python 中文版

翻看了一下翻译版,且不说翻译质量,单看排版就让人觉得向一本正式的翻译书籍,说明译者是非常有心的。以下是从翻译版中摘录的“译者的话”:

作为一个自然语言处理的初学者,看书看到“训练模型”,这模型那模型的,一直不知
道模型究竟是什么东西。看了这本书,从预处理数据到提取特征集,训练模型,测试修改等,一步一步实际操作了之后,才对模型一词有了直观的认识(算法的中间结果,存储在计算机中的一个个pkl 文件,测试的时候直接用,前面计算过的就省了)。以后听人谈“模型”的时候也有了底气。当然,模型还有很多其他含义。还有动词的“配价”、各种搭配、客观逻辑对根据文法生成的句子的约束如何实现?不上机动手做做,很难真正领悟。

自然语言处理理论书籍很多,讲实际操作的不多,能讲的这么系统的更少。从这个角度
讲,本书是目前世界上最好的自然语言处理实践教程。初学者若在看过理论之后能精读本书,必定会有获益。这也是翻译本书的目的之一。

本书是译者课余英文翻译练习,抛砖引玉。书中存在很多问题,尤其是第10 章命题逻
辑和一阶逻辑推理在自然语言处理中的应用。希望大家多多指教。可以在微博上找到我(w
eibo.com/chentao1999)。虽然读中文翻译速度更快,但直接读原文更能了解作者的本意。

原书作者在书的最后列出了迫切需要帮助改进的条目,对翻译本书建议使用目标语言的
例子,目前本书还只能照搬英文的例子,希望有志愿者能加入本书的中文化进程中,为中文
自然语言处理做出贡献。

将本书作学习和研究之用,欢迎传播、复制、修改。山寨产品请留下译者姓名和微博。

翻译:陈涛(weibo.com/chentao1999)

2012 年4 月7 日

最后希望大家在读这本书的过程中,记录一下需要勘误的地方,可以在“评论”中给出勘误建议,一起来修正这本书。谢谢!

相关文章:

  1. Free Online Stanford Course on NLP
  2. “知行合一”与自然语言处理
  3. Python自然语言处理工具NLTK学习导引及相关资料
  4. 自然语言处理工具包spaCy介绍
  5. 非常感谢译者~~
    提个小小的校正建议..刚刚看到第17页:
    “它是一个 string 对象,包含用来把字 符串分割成词的 split()方法(或叫操作、函数)。我们在对象名称后面写句号(点)再写方 法名称就可以调用对象的一个方法,即 line.splie()。"
    最后的splie是不是应该是split呢?..

    [ 回复 ]

    52nlp 回复:

    谢谢,应该是split,最快的勘误者!

    [ 回复 ]

    看中文的好处是 ?不解?

    [ 回复 ]

    52nlp 回复:

    个人认为,能看英文尽量看英文,但是还是有很多读者有中文版需求的,要照顾多数。

    [ 回复 ]

    goog 回复:

    hi! 随便问下,我不是数学专业的,请问有什么crf资料可以让我看懂其原理啊 thx!

    [ 回复 ]

    52nlp 回复:

    建议看看"pgm"课程。

    @goog
    可能这篇paper对你理解crf比较有帮助,我当初是参考的这篇paper
    http://www.scai.fraunhofer.de/fileadmin/images/bio/data_mining/paper/crf_klinger_tomanek.pdf

    [ 回复 ]

    Pasenture 回复:

    感动到哭。。一直在看crf。。对于一个基础入门的小博来说看了一些paper,表示能看懂大概理论,凡是涉及到数学公式或者类似的东西立马就跪了!求大神给点建议。。

    [ 回复 ]

    刚刚开始读,遇到个问题不知道有什么相关的论坛可以提问,所以冒昧来这里留个言:
    我在试运行Babelizer的时候显示错误:
    BabelfishChangedError: Can't recognize translated string.
    在nltk的网上也没有发现相应的排错说明,恳请各位帮忙~谢谢!

    [ 回复 ]

    52nlp 回复:

    建议直接问 @陈涛sean 同学。

    [ 回复 ]

    楼主,有个问题,我安装nltk_data时,总有两个包安装不成功,我甚至自己下载了,也同样不行,这两个包是:propbank.zip和nombank.1.0.zip。同时,还有一个问题,在输入text3.generate(),出现Building ngram index...AssertionError:的错误信息,这是怎么回事呀

    [ 回复 ]

    52nlp 回复:

    抱歉,我大概三年前玩过NLTK,已经很久没碰了,你的问题,不太清楚,建议你直接在微博上问 @陈涛sean 同学吧。

    [ 回复 ]

    致敬,我是一开始想找一个Linux下语音处理软件,查到了HTK;不知HTK为何,查到了HMM;不知什么是隐式马尔科夫模型,查到了wiki,百度空间;百度空间介绍的内容据说链接自这里,最终才来到这个神秘的博客群!很酷的博客,内容真的不错,很多惊喜,想学习人工智能,偏于应用的,不知有什么推荐的方向或指导?

    [ 回复 ]

    52nlp 回复:

    这个博客不神秘,呵呵。自然语言处理就是一个很偏应用的方向,当然机器人也是激动人心的方向。

    [ 回复 ]

    楼主你好,该书链接已经失效,请问能否重新提供一下下载链接?

    [ 回复 ]

    52nlp 回复:

    这个链接是译者陈涛同学留的,可以微博上联系他问一下: http://weibo.com/chentao1999

    [ 回复 ]

    链接失效了,可以发给我一份吗?十分感谢。邮箱:2451260711@qq.com

    [ 回复 ]

    52nlp 回复:

    链接: http://pan.baidu.com/s/1i3DvwFV 密码: oxne

    [ 回复 ]

    链接失效了,可以发给我一份吗?十分感谢。邮箱:330707908@qq.com

    [ 回复 ]

    52nlp 回复:

    仔细看上面的评论,其实我留了一份百度网盘的备份:链接: http://pan.baidu.com/s/1i3DvwFV 密码: oxne

    [ 回复 ]

    百度云链接失效了,有没有好心人重新发一下呢

    [ 回复 ]

    52nlp 回复:

    这个版本译者应该是重新校正翻译出版了,直接去买一本吧,中文书不贵,另外正式版应该fix了很多小问题。

    [ 回复 ]

    你好 这本书中文版链接失效啦 可以重新分享一下嘛 多谢啦

    [ 回复 ]

    52nlp 回复:

    关注“AINLP”公众号,回复"nltk"获取

    [ 回复 ]