博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
大数据开发工程师面试主要面试哪些内容
阅读量:3514 次
发布时间:2019-05-20

本文共 975 字,大约阅读时间需要 3 分钟。

作者:喵感数据

不同岗位、不同公司、不同面试官问的内容是不一样的。

大数据开发包括Hadoop(ETL,Mapreduce),Spark(SparkSql和SparkStreaming),Python等,看你偏向的技术了。另外大数据开发看是否偏向数仓开发和数据分析,又会不一样。不同的面试官和公司用到的技术栈也不一样,问的问题也会有很大差别的。

我说说我面试大数据开发岗面试官常问的问题吧。因为我简历项目项目经验注重实时流处理这方面,在面试时,面试会在这些方面问的比较深,我前后梳理一遍吧。一般上来就是自我介绍,谈下工作经历和项目经验,面试官会根据你的项目经验对你进行技术面试。

1,Java是必问的,不过问的不深,把Javase部分吃透,足以应付Java部分的面试。

2,Hadoop生态,Yarn、Zookeeper、HDFS这些底层原理要懂,面试经常被问。

3,Mapreduce的shuffle过程这个也是面试被常问的。

4,Hbase和HIve,搞大数据这些不懂真的说不过去。

5,Mysql、Oracle和Postgres数据库操作要回,Sql要会写。

6,linux操作系统,这个简单得命令必须要懂,会写shell脚本更好了。

7,Kettle或Sqoop这种数据处理工具至少要会一个。

8,数据仓库建模、数据模型的问题。

上面这些更偏向数仓方面,这些能回答明白足以找一份大数据开发工作了,当然想谋求更好发展,还要了解下面的。

1,SparkSql和SparkStreaming,底层原理、内核、提交任务的过程等等,尽量深入内幕,这个经常会跟MapReduce作比较的。当然也要了解Storm和Flink,Flink这个建议要学会,以后用处会越来越广。

2,Redis、Kafka、ElasticSearch这些都得懂原理,深入了解,会使用,会操作,会调优。

3,impala和kylin这些尽量也要了解会用

4,Python这个要是有能力,有精力,建议也要往深处学习,我目前正在自学中。

5,集群的问题,包括一些简单的运维知识。

6,大数据数据倾斜的问题,包括Spark JVM内存调优问题等等。

我以前找工作面试很多家公司,这些都会问到,当然不同的公司问的技术是不一样的,大体上都是围绕着上面来问的。

了解更多技术内容欢迎关注小编!

转载地址:http://txgmj.baihongyu.com/

你可能感兴趣的文章
JWT 快速了解
查看>>
实习日志一
查看>>
排序算法稳定性
查看>>
图算法总结(判断有环、最短路径)
查看>>
spring中的类
查看>>
python练习编程网址
查看>>
Python练习小程序1
查看>>
pytorch用于多标签分类的bceloss
查看>>
C++程序设计:打印杨辉三角形
查看>>
C# 方法内改变参数的引用 不影响方法外的值
查看>>
C# vs2019 智能提示中文突然变成英文
查看>>
linux开机引导和启动过程(详细)(含配置文件解读)
查看>>
Vue学习笔记——常见简写&修饰符
查看>>
vue-element-admin源码解读——项目启动过程
查看>>
zcmu 1577 食堂的蛋饼(思维)
查看>>
zcmu 1796 wjw的数学题 (唯一分解定理+排列组合)
查看>>
hdu 4135 Co-prime(分解质因数+容斥定理)
查看>>
hdu 4407 Sum(分解质因数+容斥定理)
查看>>
HihoCoder - 1631 Cats and Fish(思维)
查看>>
HihoCoder - 1632 Secret Poems(规律题)
查看>>