12年专注教学一体机定制工厂

国家高新技术企业 | 中央电化教育馆产品检测

瑞禾首页 > 瑞禾资讯 > 行业动态 >

Spark“变形记”——大数据一体机让数据处理更轻松

中誉瑞禾

2018-01-16

说起Spark,熟悉大数据架构的人一定不会陌生,它已是继Hadoop之后最活跃的开源项目之一。作为发源于美国加州大学伯克利分校AMPLab的集群计算平台,Spark立足于内存计算,并以多迭代批量处理出发,兼收并蓄数据仓库、流处理和图计算等多种计算形式得到了行业的肯定。作为国内IT行业领军厂商,浪潮早在2012年就推出了采用Hadoop+Spark架构的大数据一体机,如今这款产品已经应用于金融、电信、公安、交通、卫生等各个行业领域,成为用户大数据分析处理平台的理想之选。

Hadoop+Spark的数据架构模式

据了解,云海大数据一体机就是采用了业内主流的Hadoop+Spark的架构形式,搭建了国内外领先的大数据分析平台CloudCanyon,通过Spark计算框架消除了传统Map/Reduce计算框架的弊病,实现了高效的内存计算。Hadoop经过多年的发展,大家对其性能已经是耳熟能详;但是对于Spark,许许多人还觉得有些陌生。

经过复杂的系统调优和的改进,浪潮云海大数据一体机具有高性能、稳定性好、功能丰富、易管理等特征,采用不同的数据处理的架构来提供对不同行业应用的支撑。通过新型的数据处理架构,实现了计算随数据分布的数据本地化,保证了业务的连续性,即使三到四千个计算单元重载节点情况下,还能够实现相对比较好的扩展性。

浪潮云海大数据一体机的性能优势

从技术角度来说,浪潮云海大数据一体机支持高性能Apache Spark作为缺省执行引擎,可比原生的Hadoop Map/Reduce快;其次,通过建立独立与Spark的分布式列存缓存层,可以有效防止GC的影响,消除Spark的性能波动,同时在列式缓存上实现索引机制,进一步提高了执行性能;再次,在SQL执行计划优化方面,实现了基于代价的优化器(Cost based optimizer)以及多种优化策略,性能可比原生Spark快数倍;最后通过全新的方法解决数据倾斜或者数据量过大的问题,使得处理超大数据量时也游刃有余。

大数据一体机让数据处理更轻松

自贡市中誉瑞禾实业有限公司主要致力于教育设备、触摸一体机、互动卓、显示器、电子书包等,公司以创新为宗旨,依托在深圳的研发中心,以工匠精神打造电子产业新高地,把公司建设而成为行业领跑的现代化企业。网址:http://www.sczyrh.cn/


扫一扫

手机浏览

证券代码:810413

定制热线:13990097337

地址:四川省自贡市沿滩区高新工业园区金川东路13号

扫一扫 关注我们

©2020-2022四川中誉瑞禾实业有限公司 All Rights Reserved   蜀ICP备18006009号-1   技术支持:四川百信智创科技有限公司