这是一个不定期更新的to_read list主要分为书籍及文档地址。
BOOK
数据库
Oracle PL/SQL程序设计(第6版)(上下册)(异步图书出品)
此书是我配合实践项目半年内学习完成的,上册主要是一些基础,下册是pl/sql的提高。
T-SQL编程入门经典涵盖SQL Server 2008&2005
本书是一些基础的t-sql语法介绍,知识点涵盖全面。
高性能MySQL(第3版)
本书非常深入的刨析了mysql。多说一句,新人入门我只推荐oracle,虽然对新手不是很友好,但是文档丰富,对于学习数据库和理解数据库都是不二的选择。
Postgresql 内幕
作者是日本的铃木广信,中文版的书籍已经上市。 如果是DBA,或者有志于postgresql生态开源代码贡献者,这本书是非常好的选择。 在这里你可以详细了解各种数据库技术的实现原理,以及系统性的学习pg的底层架构。 记得前Oracle首席架构师吐槽过mysql的底层一坨屎,建议大家转向pg.
Python
Python学习手册(套装上下册)(原书第5版) [Learning Python]
Learning python 是我的python入门书籍,由浅入深的带你走入python世界
Python Cookbook(第3版)中文版(异步图书出品)
python Cookbook 是python的魔法书,里面介绍了各种python技巧,至今翻看,仍然是趣味横生。
利用Python进行数据分析(原书第2版) [Python for Data Analysis: Data Wrangling with Pand]
除了pandas 官方文档,最好的pandas学习和入门书籍,作者Wes McKinney 是pandas库的创建者之一,目前仍然活跃在社区
机器学习及算法
机器学习实战(图灵出品) [Machine learning in action]
机器学习实战没有复杂的理论介绍,直接带你用python实现一遍,对于初学机器学习的同学比较友好,但是代码要吐槽一下,不是非常优美。当然,作为demo_code,不错了。
机器学习
周志华老师的西瓜书,经典!
精通特征工程
特征工程位于数据和模型之间,是非常重要的一环。
Excel
别怕,Excel VBA其实很简单(第3版)
这本书由国内最大的excel学习论坛excel home 集体编著,对于入门vba的同学有很大的帮助哦
Excel专业开发-Microsoft Excel及VBA应用开发指南-第2版
本书阅读是要有一定vba基础的,不适合新手,甚至你需要有点开发经验。excel也可以快速开发出易于部署的专业软件。
算法及相关
漫画算法:小灰的算法之旅(全彩)
我一般是在公众号上看小灰的请假套路:D,轻松诙谐的入门算法!
大数据
Hadoop权威指南:大数据的存储与分析(第4版)
hadoop 的经典书籍,handbook,搞清楚hadoop及其组件的原理。
Hive编程指南(异步图书出品) [Programming Hive]
hive的学习曲线相较pig比较平滑,适合dba和数据库开发等熟悉sql的人员快速上手。
HBase权威指南(异步图书出品) [HBase: The Definitive Guide]
HBase 列式存储的基本概念和原理
Spark快速大数据分析
spark 的RDD等概念和实战
Scala学习手册
scala 是大数据首选语言,有python的味道,又是出自于java jvm的静态语言,兼顾开发与性能,必学!
数据算法:Hadoop/Spark大数据处理技巧
spark生态成熟,应用广泛,自带scala和pyspark这样的接口,大数据算法走起!
分布式系统应用设计 [Designing Distributed Systems]
大数据架构师必读,设计和编写分布式应用的同学可以参考
数据密集型应用系统设计 [Designing Data-Intensive Applications]
同上,架构师和分布式设计人员的handbook
Kafka入门与实践(异步图书出品)
kafka入门书籍
DOCUMENT
PANDAS
新版的pandas文档,分了四部分,这个是pandas api的文档,熟悉python数据处理,pandas是绕不开的库。
NUMPY
调包侠和调参侠让你失去对机器学习的乐趣,来吧,用numpy实现一遍 :D
MATPLOTLIB
python 数据分析三件套中的可视化部分,虽然也有seaborn这样优秀的库,但是还是matplotlib经典
Django
虽然我更喜欢flask,但是对于新手,全家桶真的是不错的选择,文档更是没得说,可以说,django的文档是我看过最好的文档。:D
kafka
kafka 文档能够让你快速理解这个MQ,让你快速上手kafka.
scala
scala 的官方文档
python
python的官方文档,如果python是你的第二门语言,我建议直接读官方文档
scikit-learn
机器学习经典框架,3行代码训练模型,调参侠的最爱。
Pytorch
Pytorch 更动态,当然现在tf做的和pytorch没啥区别了,如果入门机器学习/平时写一些小case,请入门。
Pycharm
磨刀不误砍柴工,脑浆公司带你飞,另外还有一个DataGrip数据库IDE产品也是非常非常推荐的~:D
oracle spatial and graph data model
oracle 空间及图数据模型的官方文档,这部分是空间数据模型的文档,主要讲解笛卡尔坐标系中点,面,和多边形等的运算,当然,如果你感兴趣,完全可以实现一下,主要是使用点积和三角学知识。
Greenplum 数据库中文文档
Greenplum数据库是一种shared nothing的分析型MPP数据库
其他一些有趣的网站
wolframalpha.com
非常有趣的一个搜索引擎
leetcode
当我自满得意的时候,我就会上这个网站挨打
visualgo
数据结构有疑问?可视化帮助你理解数据结构
vs_Algorithms
旧金山大学的免费算法可视化地址,不懂btree如何构造?嗯,看这个。
IANA Service Name and Transport Protocol Port Number Registry
当你想看看端口默认是什么服务的时候,来这里。
CVE LIST v5
漏洞数据列表
ACM Transactions on Database Systems (TODS)
ACM 数据库系统相关出版物
评论区