老齐教室

《数据准备和特征工程》读后感

作者:洪贤斌

有幸第一时间拜读了齐老师的新书《数据准备和特征工程》,深感每位数据科学初学者都应该将其列入必备书单。市面上关于机器学习、深度学习的书籍多如繁星,但数据处理这一更为重要的环节却鲜有涉及。有感还未入门数据科学的朋友往往只对高深莫测的算法模型趋之若鹜,而将数据采集和处理视作“脏活”、“累活”。但真正的资深数据科学从业者,都会不厌其烦地强调数据准备的重要性。可以说,对于每一个现实生活中的落地项目来说,最大的投入往往在数据准备阶段,这也是最具决定性的阶段。数据的缺陷,是难以通过模型改进来解决的。而反之,如果数据足够多,足够准,无论你用多简单的模型,也能获得一个令人满意的成果。

而对于初学者来说,在进行数据分析或者训练模型之前,第一关就是数据的处理。只有对数据处理得心应手,你才能深入学习高深的算法。

  • 通读本书,你能够熟练地将各种数据载入计算机,之后就可以继续探索数据科学的世界了。
  • 你的数据可能是一个Excel表格,可能是一个SQL数据库,可能是一个网页的条目,如果你不知道如何将它们导入你的计算机,这本书会给你答案。
  • 如果你不知道如何将你的数据转化为算法模型可以接受的格式,看完这本书你就能信手拈来。
  • 如果你想实施特征提取,那这本书将教会你最基本的处理方式,为后续的算法学习打好基础。

在阅读此书的过程中,常常是想到要了解某个知识点,书中就恰到好处地出现了对应内容。可以说这本书充分考虑到了初学者经常遇到的各种问题,面面俱到却不显冗长。书内每个知识点都有对应的代码实例,手把手带你入门,算是非常“傻瓜化”了。书内每页的注释也非常实用,排版简洁易读,可以说是本书的另一大亮点。

总的来说,这应该是数据科学初学者人手一本的入门引导书籍,无论你是处理日常办公的数据,还是想深入学习人工智能,此书都能为你的发展打下坚实的基础。


老齐回复:

非常感谢洪博士对本书的评价。

《数据准备和特征工程》一书已经由电子工业出版社出版发行,扫描如下二维码进入「电子工业出版社天猫旗舰店」购买。

另外,与本书相配套的学习资源,可以通过如下二维码获取。

搜索技术问答的公众号:老齐教室

在公众号中回复:老齐,可查看所有文章、书籍、课程。

觉得好看,就点赞转发

使用支付宝打赏
使用微信打赏

若你觉得我的文章对你有帮助,欢迎点击上方按钮对我打赏

关注微信公众号,读文章、听课程,提升技能