大数据专业的本科生想进大厂需要重视哪些内容?
现在两套体系比较吃香spark和阿里大力支持的Flink体系
一些大数据开发相关的小伙伴:
主要是Hadoop、Kafka、Hive,也要会MySQL~~目前工作中我接触到的有hive,Spark,shell,Kafka,presto,flink,clickhouse。其他像什么Druid,hbase的也有,但是基本没接触过。spark占大部分。7月26号截止今天,已学java,mysql,maven,hive,hadoop,spark,scala,采集,数仓4.0,hbase,flume,kafka,linux,shell,zookeeper,git,redis,全程敲代码搞大数据大体分为做数据处理和基础架构。前者重业务,后者重技术基础。无论哪个都需要先学好技术。
大数据粗略可以分为hadoop系列的离线处理,flink一类的实时处理,部分公司也包含elasticsearch。还有其他组件暂不列举。无论是hadoop系列,spark系列,flink系列还是elasticsearch系列,皆是JVM上运行的。所以编程最好学Java。大数据的要求普遍偏高,至少得把Java做到很了解(包括底层原理),至少其中一个系列很了解(比如elasticsearch的底层原理),再加上不错的算法能力,才有竞争力。Copyright © 广州京杭网络科技有限公司 2005-2025 版权所有 粤ICP备16019765号
广州京杭网络科技有限公司 版权所有