大数据

大数据人才岗位能力要求:数据采集工程师

2023-12-27 16:00:11 | 来源:企业IT培训

数据采集工程师岗位职责:应负责数据调研、采集、归类、预处理、归类存储等工作。

数据采集工程师初级能力要求具体如下:

a) 专业知识:

1) 网络爬虫知识,

2) 离线数据采集知识,

3) 实时数据采集知识,

4) 作业调度知识,

5) 文件系统数据存储知识,

6) 关系型数据库知识,

7) 非关系型数据库知识,

8) 数据清洗知识,

9) 数据 ETL 知识,

10) 数据库基础操作知识,

11) SQL 函数知识,

12) 结构化、半结构化与非结构化知识,

13) 分布式计算知识,

14) 内存计算知识,

15) 数据结构封装知识,

16) 关键业务指标知识,

17) OLAP 系统应用知识,

18) 数据检索知识,

19) 交互式计算知识,

20) 报表制作知识。

b) 专业技能:

1) 能根据业务需求进行网络、离线、实时数据采集;

2) 能根据调度策略使用框架设置调度作业;

3) 能根据存储策略进行数据存储;

4) 能根据业务需求对遗漏数据、噪音数据、不一致数据等进行清洗;

5) 能根据业务需求对不同数据源数据进行整合;

6) 能根据业务规则对数据格式进行转换;

7) 能根据数据归一性原则对数据进行单位、数值规约;

8) 能根据业务需求编写批量、实时数据计算作业;

9) 能根据数据特征计算数据标签并进行汇总;

10) 能根据数据指标规则计算关键业务指标;

11) 能根据数据平台构建联机事务分析系统并进行即席查询;

12) 能根据检索引擎创建索引库并进行数据检索;

13) 能使用交互式查询工具创建数据接口并提供对外服务接口;

14) 能使用交互式查询平台制作报表及展示图表。

c) 经验:

1) 累计从事本岗位工作 1 年以上。

数据采集工程师中级能力要求具体如下:

a) 专业知识:

1) 信息系统配置知识,

2) 数据监测与迁移知识,

3) 数据存储策略知识,

4) 常用算法与数据结构知识,

5) 数据画像知识,

6) 数据倾斜知识,

7) 大规模并行分析数据库知识,

8) 数据立方知识,

9) 查询引擎知识,

10) 数据分词知识。

b) 专业技能:

1) 能根据业务需求进行网络、离线、实时数据采集,并配置数据缓存及消息队列;

2) 能根据业务需求参与制定数据迁移方案;

3) 能制定调度策略;

4) 能制定存储策略并指导初级工程师存储数据;

5) 能根据业务需求编写批量、实时数据计算作业并优化作业参数;

6) 能根据业务规则设计相应标签库并进行标签管理;

7) 能根据业务规则设计相应数据指标计算算法;

8) 能根据业务规则对关系对象进行图计算;

9) 能使用大规模并行分析数据库优化联机事务分析系统性能;

10) 能使用计算引擎优化数据查询效率;

11) 能通过计算平台构建检索分析系统。

c) 经验:

1) 具备一定的采集相关项目经验;

2) 累计从事本岗位工作 3 年以上。

数据采集工程师高级能力要求具体如下:

a) 专业知识:

1) 数据采集与迁移策略,

2) 依赖调度原理知识,

3) 存储架构知识,

4) 数据算法设计,

5) 数据分区及缓存知识,

6) 外部程序管道知识,

7) 计算引擎优化知识,

8) 索引优化知识,

9) 数据加盐知识,

10) 驱动器与执行器知识。

b) 专业技能:

1) 能根据业务场景制定数据采集策略并监控采集情况;

2) 能根据业务场景制定数据迁移策略并监测迁移情况;

3) 能根据业务及性能需求设计消息传输及推送方案;

4) 能根据业务需求及依赖关系设计调度方案;

5) 能根据业务需求及存储应用设计存储策略;

6) 能根据业务需求设计离线或实时数据计算算法;

7) 能制定数据标签库管理及规范;

8) 能制定数据计算开发流程及规范;

9) 能制定数据查询操作流程及规范;

10) 能深入计算引擎对底层代码进行优化以提升查询性能;

11) 能制定对外数据接口规范及权限。

c) 经验:

1) 具备数据采集相关项目经验;

2) 累计从事本岗位工作 5 年以上。