大数据平台运维

为行业信息化提供整体解决方案,为客户持续创造价值

支撑大数据应用系统正常运行且精准分析的技术能力

产品简介

随着大数据技术的发展,各大中型企业陆续建立起自己的大数据平台,依托大数据平台的海量数据存储处理能力和数据分析能力,研发各种大数据应用,但大数据平台与传统信息系统有着较大差异,需要对以往的运维体系进行调整,才能更好的适应大数据平台的运维需求。

数据处理能力

数据处理(一)

通过技术手段发现并纠正数据文件中可识别的错误,包括检查数据的一致性,处理无效值和缺失值等,其中也包括不完整的数据和重复的数据。

数据处理(二)

将传统的数据分析方法与处理大量数据的复杂算法相结合,从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用信息和知识的过程。

数据处理(三)

数据挖掘的任务主要分为4类:建模预测、关联分析、聚类分析、异常监测。

技术优势

HADOOP集群运维

实现对海量数据的存储和分布式计算,数据通过hadoop的集群处理后,得到结果。其中包括:数据优化、数据搭建、加节点、备份恢复、本地搭建hadoop集群等。

数据仓库管理工具

主题数据库包括原数据维护管理,ETL工具(数据抽取、转换、加载),数据维护管理、数据分析工具和系统日志五个部分。该工具为多渠道来源的数据整合,数据存储,数据分析,为数据挖掘提供了高质量的数据基础。

网络爬虫工具

网络爬虫工具包括:管理工具、爬虫工具和爬虫数据库三个部分组成,该工具可用于舆情监控、市场分析、产品研发、风险预测等多种业务使用场景。

数据采集

数据采集包括:第三方数据采集、业务数据采集、本地数据库数据采集、网络爬虫数据采集、物联网数据采集等。

数据分析

主数据分析包括数据的描述性分析、线性回归分析、方差分析、主成分分析、典型相关分析、判别分析、聚类分析、弹性分析、Bayes统计分析等。

数据存储

云平台,包括私有云和公有云;本地存储。