谈谈转行数据分析以及工作的心得

2018-02-27 11:12:43来源:https://www.jianshu.com/p/79cdda55596e作者:凡人求索人点击

分享


由于两个月前写了一篇文章叫《自己找数据分析工作时所犯的错误》,然后这期间就一直有人问我找到工作了吗?面试的时候,面试官都是问你的什么呢?你工作之后主要干什么呢?所以想在这里为大家分别解答下。


首先回答下,我确实是找到工作了(感谢我遇到的贵人)。这是我辞职回到家写的一篇文章----为什么转行数据分析。其中写了一个计划,让自己有了方向,希望大家也尽量写一个详尽的计划,这在学习的过程中不会因为方向不明确而产生焦虑。仔细的一算,我是大概辞职两个月后找到了工作,难道我真的是从零基础学习两个月找到工作的吗?当然不是,我不能为了吹嘘自己给大家带来误导。


下面我会尽可能的为大家描述下自己学习的整个过程,以及我自己犯得一些错误。然后回答,面试的一些问题,以及大家想知道的数据分析工作到底是怎么样的问题(以自己的工作为例)


开始接触编程

大概介绍下自己,一个在2017年6月份毕业的工科男生,专业是建筑环境与能源应用工程。开始正题了,说到开始接触Python应该是2016年12月26日(刚刚考完研),这一天主要做的就是安装Python,当时安装的是Python的原生包,麻烦一些,在配置环境变量的时候一直出错,结果安装了两天,才打印出了“Hello World!”,其实说真的自己差点放弃。学习Python这也是起源于得到专栏万维刚老师的一期文章,提到了编程,说编程是如此之美,比学习钢琴绘画还能提高人的审美。所以万老师的粉丝也是我的启蒙老师(升哥),主动就开始带领我们一起学习了Python,他要求我们如果碰到了问题,要先把问题给弄清楚了,所以这也就强迫自己使用搜索工具 ,查找自己犯的错误是什么,其实在这个过程中,思路将会越来越清楚,自己的问题也就能解决了一大半了。所以大家在学习的时候,一定经常使用搜索工具(谷歌),自己每进行搜索一次,就能提高自己搜索关键词能力。另一方面你向别人请教问题的时候,别人能够方便的问答你的问题,为别人着想,其实也就是在为自己着想,难道不是吗?


学习Python时应该注意的问题


如果大家刚接触Python,碰到的第一个问题肯定是安装问题,这其中遇到的麻烦估计就是配置环境变量了(不难,就是一不小心会错);所以建议大家,直接安装Anaconda(官网下载),在安装的过程中,会有类似是否默认设置环境变量,点击是,剩下的默认就可以。


我刚开始学习的时候,当时的目标是把别人的代码抄下来,只要不报错就好了。那时间自己有一个非常不好的习惯,就是抄代码,从来不自己亲手写代码。总是想快速学习完,其实是没有经过自己思考的沉淀,过不了两天就会忘记了代码的逻辑。所以也建议大家能够自己写,然后再与别人的代码比较进行修改。点击Python的菜鸟世界会有一些简单的例子,大家可以用来参考学习的。


学习编程,真的不要麻烦,肯定会出错,但是只要能够把错误的原因找出,一点点积累,肯定是进步很大。


对于从事数据分析工作的话,刚开始先掌握函数式编程即可了。


对于学习爬虫

我原来是按照崔庆才博主的视频课程学习的,把他视频课程的代码给抄了一遍,当时自己真是太愚蠢了,只是想得到结果,没有自己找一个网站爬虫练习下,更加没有思考。
其实简单来讲爬虫就分为三个部分:


取出要爬取的URL
根据URL请求服务器,下载HTML页面
分析页面内容,找出网页中里的其他URL,继续爬虫直到结束

如果大家打算写一个爬虫程序作为自己找工作的项目实践,推荐使用requests库和lxml库,再加上QQ浏览器上扩展程序XPath Helper,将会是非常的方便。如果大家没有这个学习资料的话,点击传智播客就业班视频。有一点还请注意,这是一个LINUX下的教程,关于学习爬虫方面,其实涉及到的LINUX命令只有进入一个文件进行编写,复制一个文件,简单的几个命令。


对于学习数据分析

在我快要辞职的时候(九月十几日左右),我就开始想要从事什么职业,当时确实想做开发的,因为当时自己知道只要努力学习,半年之后是有很大的机会找到一份不错的工作的,可是自己并不是太想做开发。在自己无助的时候,幸运的是,我到知乎上看到卡牌大师还秦路老师关于转行数据分析的回答,让自己有了数据分析的学习方向。如何快速成为数据分析师?,这张帖子确实帮助了像我一样无助的好多人。


总结下来主要学习概率统计、Excel、SQL、python中的numpy包、pandas包、matplotlib包。我的做法是直接按照博主秦路的文章学习,按照他的文章代码实现下(抄了几遍遍),然后自己想想看看有没有其他需求给实现下。对于SQL的学习可能在安装上会遇到问题,这篇文章-SQL入门学习能够给你写帮助;在这里多一句,很多人认为数据挖掘的机器学习部分,是需要很好的数学基础的,其实并不是。这篇文章会给你解答--入门机器学习到底需要多少数学知识


不同类型的工作要求(根据面试所得)

第一种我是感觉类似于数据运营,就是学会EXCEL,SQL、概率统计也就好了。我的了解是,这样的工作基本上是在互联网公司,给没有数据部门的产品经理打个下手,要求的技术并不是太高,主要是针对产品经理提出的需求来做分析。比如说,我当时面试的一家互联网教育机构,他们的要求就是用EXCEL整理学生买课的信息,看看哪一门课程最受大家喜欢之类的。这种职位的大概薪资在一线城市的话大概税前有6000到7000块(以下说的薪资范围也都是针对一线城市的。这里的结论是我面试时、或与朋友讨论、或是在某些课程上看到的,可能观察的样本不大,大家也应该多面试几家,感受下数据分析工作到底需要哪些技能。)


第二种是真正的数据分析职业,最起码是公司里有专门的数据分析部门,并且还能用到编程语言。这时候需要掌握的技能算着EXCEL,SQL,概率统计,还有一门编程语言Python或者是R语言,建议大家先学习Python语言,我碰到一个面试官说其实公司里面使用Python做数据分析的较多。这样一阵下来,公司就能上升到8000-1000,如果能够学习几个机器学习算法模型肯定都是加分项。


第三种就是数据挖掘职位了,这个就需要掌握的技能比较多了,EXCEL,SQL,概率统计,Python或者R语言,数据挖掘、机器学习 Hadoop,Spark Java,python,c++ 推荐系统、自然语言处理等。编程语言,还有熟练掌握机器学习的算法(这个一定要自己推导几遍),这个工资就不用说了,15000+。


关于这方面,自己写过一篇文章——《自己找数据分析工作时所犯的错误》。其实面试的时候,前两种类要求业务知识要一些,后一种就偏向技术多一些,面试官问的时候也是按照对应的顺序。


对于购买课程或者加入社群

我现在关于购买课程或是加入社群有一点点见解。我认为现在的数据分析社群之所以存在是帮助大家解决了下面三个问题:


学习的方向,对于一个好的社群,能够为你提供一个学习路线。(其实按照我上文提到完全是可以的)
可以解决大家的恐慌问题,因为我们都是要转行的人,对会未来会感到很大的不确定性。(有一点大家要注意,这只能解决自己暂时的恐慌,关键是一定要坚信做对的事情,长期来看一定会带来更大的复利,并且长期一定是没有自己想的那么长)
加入社群之后,社群里总会有一些活跃的人能够帮你解答问题,在社群里确实降低了与人的沟通成本。

关于加入社群,我自己犯得错误是,本来按照自己原定的计划在学习,学习两周之后就开始怀疑自己这样学习可以找到工作吗?我应该把其中的一个知识点学习到什么程度呢?这时候就开始到知乎或者到简书上寻找答案,结果反倒是越看越恐慌,再后来为了找到认可就又加了一个新群,开始立下誓言,又努力了两周,紧接着又是恐慌,然后买了一堆到现在还没有看完的课程(这里给大家提醒下,现在市面上并没有太成熟的课程,并且开发的课程是仅能够带我们入门的,或许这也就够找工作了,我的意思是说不把希望全放在一个课程上,因为我就是交了这方面的学费)


总而言之,加入一个社群也是可以的,大家还是要记住关键只能靠自己。


我最近工作用到了什么

工作中我的主要职责是,根据甲方提供的数据和需求,或是根据甲方的数据提出对他们有价值的需求,然后选择建立的算法模型,并进行数据分析。由于现在工作是刚入职一个月,工作是不太固定的,这段时间都用到了下面的知识。


python 爬虫
Linux 命令
Python 的正则表达式
聚类算法和spark MLlib

自己罗嗦着说了这么多,真的希望能够给大家一些帮助。其实,转行数据分析的文章,大家估计也是看了不少,但是有时可能是缺少一些鼓励,心里总是有些恐慌,不知道自己这样是不是可行的。朋友们,想信我,只要按照自己学习就可以了,那一天肯定会到来的。(PS:如果大家需要鼓励,还要再了解下我的情况的话,可发私信加我微信,如果你方便的话,我会语音解答你的疑问。)








最新文章

123

最新摄影

微信扫一扫

第七城市微信公众平台