技能标签
专业技能
精通Hadoop全栈技术体系(HDFS/YARN/MapReduce),熟练掌握Spark生态(Spark SQL/Spark Streaming),具备Hive数仓开发经验(HiveQL/Partition/ACID),熟悉Kafka实时数据管道构建。精通Python数据处理与分析,掌握Java开发(Spring Boot/MyBatis),具备Oracle数据库设计与优化能力。熟练使用IDEA/Git进行版本控制与代码开发,具备Linux系统调优经验。
工作履历(脱敏处理)
专注于大数据平台架构设计与开发,主导搭建基于Hadoop的分布式计算框架,实现日均PB级数据处理能力。设计并实施Spark Streaming实时数据处理方案,将数据延迟降低至秒级。开发Hive数仓分层架构(OD/SD/DWD/DWS),建立统一的数据资产管理体系。搭建Kafka消息队列系统,实现多源异构数据的实时采集与分发。开发Java后端服务对接业务系统,优化Oracle数据库索引与查询计划,提升数据查询效率30%以上。
项目经验(脱敏处理)
某食品企业云数仓建设项目:基于腾讯EMR集群搭建企业级数据仓库,整合ERP、CRM等12个业务系统数据源。设计分层数据仓库架构(OD/SD/DWD/DWS),通过Hive ETL流程实现日均5亿条数据的离线处理。开发Spark Streaming实时数据管道,利用Kafka实现秒级数据采集与处理,支撑实时报表系统。优化Hive查询性能,通过分区与分桶策略使查询效率提升40%。设计数据质量监控体系,建立数据血缘追踪机制,确保数据准确性与可追溯性。
驻场外包优势
服从性高
严格遵守甲方管理制度
技术扎实
1年项目实战经验
可长期驻场
接受异地项目外派
快速响应
24小时内可到岗
企业人才对接
专业IT人力外包服务
如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。
合作热线
18969108718
商务邮箱
ntit@163.com
微信扫码咨询
扫描二维码添加商务对接