大神面试京东数据挖掘和机器学习岗位成功拿到offer

时间:11-18编辑:佚名 职场法则

【23xiu.com-爱上秀-教育信息门户网】

关于面京东,感触只有一个,虐的快吐血了。首先说京东分四个板块,有京东商城、京东金融、京东刚收购的拍拍和海外事业部。我这个职位主要是在金融部数据组做数据挖掘和机器学习,还有推荐系统。面试是在周一,本身也没打算正经去面试的,结果被虐了整整一个下午。。。。。。

  实话实说,京东在整个互联网行业里待遇基本是最低的,唯独平台好,每天有10亿新的用户行为数据,对于DM而言,再好不过了。教主让我多面试几家,虽然某狗给13k,但是实在顶不住快被虐的吐血的压力,某狗、优x和乐x就在等等吧。

  面试经过,好痛苦。。。上来先自我介绍什么的就不说了,接着就是问推荐系统。还好我周末花了两天的时间把项亮老师写的《推荐系统实战》过了一边,于是我就开始扯架构,然后说了说相关算法,比如User协同过滤和Item协同过滤,还有如果遇到冷启动问题该如何处理神马的。说完推荐,就问我编码能力怎么样,我说还行,又问sql怎么样,我说以前做过购物网站,一般的CRUD还凑合,于是就让我写一个sql的嵌套查询来输出一下在一段时间内每个用户最后一次的购买的物品和购买时间,恩。。。没错。。。写坏了。。。limit写成了top,还好我机智,解释说top是sqlserver的,mysql里用limit。最左面的面试官批评我说:“以后不能只写那种简单的,稍微复杂一点的也要多写写,这张纸你拿回去吧,在你数据库里运行试试”,我心想“完了,这就回去了??!!!”不过还好没有。。。接着最右面的面试官(加我qq的那个小leader)说:“你说你以前搞过算法竞赛,你能写写堆排序么?”我一愣,哎呀妈呀,只记得算法过程了。。。好吧,“那你就写个堆排序吧”,于是面试官们就出去了。。。好忐忑啊,手机在旁边就是不敢百度啊,硬着头皮写吧。。。过了一会儿,面试官们回来了,我基本也写完了,然后他们就拿着来回看啊。。。我心里七上八下。。。。。。。不过还好,好像写的没什么问题。接着就问我数据分析处理怎么样,我说跟着老师学过一点DM,参加过天猫大数据竞赛,可惜rank 1300+,相关工具用过Weka,大数据平台hadoop正在自学,我自学能力很强。他们表示无法证明我自学能力强,还好我有准备,这个专业top1在这里放着呢哈哈~。然后就是关于机器学习的问题了。问我会什么,我说分类聚类、分词、关联规则什么的。“那你分类都会什么”,我说k近邻(当时说成了k邻近,其实我到现在都没注意到底是k近邻还是k邻近,反正当时面试官愣了一下,我还不如直接说knn)、朴素贝叶斯、SVM什么的,神经一抽还很脑残地把kmeans说进去了,这明明是无监督的聚类。。。然后问我他们有什么区别,我只说了NB是基于概率统计的算法模型,其他的是基于空间分割的。在SVM方面问的不是很深,万幸没有细问到四个kernal,要不我估计就好pass掉了。一个面试官说,你谢写写NB分类吧,好家伙。。。继续硬着头皮写,写完以后解释了一下算法思想,先验概率和后验概率神马的。最后还有什么不记得了,只记得最最最后,数据组高级项目组长来了,然后又问了我毕业设计爬虫是单线程的么,我说是单进程多线程,还问了问余弦聚类特征向量是如何取的,我说用tf-idf,取前20词,在比较时构成40维的向量,还问堆排序为什么是nlogn的效率,这个我跪了。。。结束后,几个在场的面试官都说可以,问我待遇有什么要求,我说我是应届生,而且我同学做的都是以开发为主,我也不太懂行情,你们看着给吧,于是。。。!!!!就是这么坑!!!!早知道我就多要点了,刘强东一定是把钱都给奶茶妹妹花了!!!不过后来leader说不满意的话周三可以找人力的聊聊,结果我周二下午就去了,人力老大跟我笑着聊了一下午互联网金融,听得我是个晕头转向。邻近下班的时候才说到正题,我重新提了要求,他说他们回去再商量一下,一周内给回复。我心想,你要是不满足我的新要求我就不去了呢!(开玩笑。。。毕竟JD也不小,我更看好这个平台。)

  总结,计算机工程专业!=计算机专业,要不是我们学校这么坑非要把我们忘软件外包方向推从而提高就业率,很多有志骚年们还是有多种出路的。编码不一定必须搞软件开发,数据挖掘、机器学习、推荐、图形图像处理、云计算都是很好的方向,虽然本科教学过程中一般没有这些,但是大量的课余时间都可以用来自学。一开始我是找王金龙博士了解DM这个方向,然后王导给我推荐了一些书以及相关的资料,不过后来王导忙着出国也不理我了。关于机器学习,《集体编程智慧》、《统计学习方法》是非常好的入门书籍,我很推荐。其实这些入门书籍要是吃透了,尤其是《统计学习方法》里面的数学推导搞懂了,拿ML的offer很轻松。其他方面,数学很重要,除了高数线代概率,还有凸优化,这个数学在本科阶段基本没有讲,《矩阵论》也可以看看。网易斯坦福大学公开课、Coursea的ML课都非常好,讲师都是Andrew Ng(敢不认识他?)。数据挖掘方面,我也不是很深入,我只看过《数据挖掘导论》,浙江大学的那个数据挖掘视频太老了。。。

  其他的,编码能力要很好,数据结构算法一定要弄清,尽量都会写;sql语句是硬功夫;多搞算法还是很有好处的。写的很乱,各位将就看。

12
【猜你喜欢】 【为你推荐】