IT人力外包人才简历库

返回列表

Python开发工程师(爬虫方向)

驻场外包人员
工作年限:2年 意向城市:杭州 浏览:3次 发布时间:近期

技能标签

Python Scrapy Redis MySQL 分布式爬虫 正则表达式 XPath解析 HTTP协议 Linux运维 数据清洗 分布式任务调度 网络通信 数据库优化 自动化运维 爬虫反反爬

专业技能

精通Python爬虫开发,熟悉Scrapy、Requests、Selenium等主流框架,具备分布式爬虫架构设计能力。熟练掌握MySQL数据库设计与优化,精通SQL查询与索引优化。掌握正则表达式、XPath、CSSSelector等网页解析技术,熟悉Redis缓存机制与分布式任务调度。深入理解HTTP协议及TCP/IP网络通信原理,具备Linux系统运维能力,熟练使用Shell脚本进行自动化运维。

工作履历(脱敏处理)

专注于爬虫系统开发与数据采集领域,主导设计并实现分布式爬虫架构,采用Scrapy-Redis实现任务分发与状态管理,解决反爬虫机制下的数据采集难题。优化数据清洗流程,设计高效的数据存储方案,通过MySQL分库分表策略提升数据处理效率。开发自动化运维脚本,实现爬虫任务监控与异常告警功能。持续优化爬虫性能,提升数据采集效率30%以上。

项目经验(脱敏处理)

项目名称:企业信用信息数据采集系统

项目描述:基于Scrapy-Redis构建分布式爬虫系统,实现对政府公开信息平台的批量数据采集。采用分布式架构处理高并发请求,通过XPath与正则表达式解析复杂网页结构,设计数据清洗规则确保数据质量。开发数据同步模块,将采集数据通过MySQL主从复制机制进行持久化存储。项目实现日均百万级数据采集,系统可扩展性提升50%。

技术挑战:应对反爬虫机制,设计请求头随机化策略与验证码识别模块;解决分布式任务调度中的数据一致性问题,采用Redis事务保证数据完整性;优化数据存储性能,通过索引优化与批量插入策略提升写入效率30%。

驻场外包优势

服从性高

严格遵守甲方管理制度

技术扎实

2年项目实战经验

可长期驻场

接受异地项目外派

快速响应

24小时内可到岗

企业人才对接

专业IT人力外包服务

如果贵公司有IT项目人手缺口、需要工程师驻场开发、短期人力支援需求,欢迎联系洽谈合作。

合作热线

18969108718

商务邮箱

ntit@163.com

微信扫码咨询

微信咨询二维码

扫描二维码添加商务对接

立即申请人才对接