1、大数据组件很多,而在欧拉社区Bigdata sig中目前还只有几个大数据组件,现在要增加大数据平台经常使用的如Sparkhive等一些组件

----对于一些组件欢迎大家按照需要或者爱好增加。

如何增加,有没有相关的指导和操作流程?或者是否可先指导如增加Spark组件?

 

2、现在针对大数据核心组件如SparkHbaseHive等组件进行优化,如何把优化代码合入到欧拉大数据 sig对应的组件中,体现欧拉社区大数据组件的竞争力

----这些优化我觉得可以先列一下具体是什么优化,如针对哪个软件的什么架构的优化,有什么效果

 

主体的优化:针对架构或算法库等都有优化,如Spark MLlib库的一些算法,Kmeans优化后性能相对优化前可提升3+PCA提升50%+等; Spark SQL实现架构优化,SQL1-99平均性能提升15%+,最高SQL可提升40%+;目前对于HadoopSparkHiveHbase等常用组件都有优化。针对这些优化准备推送到欧拉社区,提升ARM和欧拉社区的竞争力;欧拉社区是否接受对架构或库的一些修改,对于这些优化如何进行合入?

     

 

 

 

发件人: 正心 [mailto:sinever@126.com]
发送时间: 2021117 23:43
收件人: Yangjian (nt) <yangjian.yx@huawei.com>
抄送: tc <tc@openeuler.org>; dev <dev@openeuler.org>; sig-ai-bigdata <sig-ai-bigdata@openeuler.org>; Wuzeyi (Iverson) <wuzeyi1@huawei.com>
主题: Re:[Sig-ai-bigdata] 欧拉社区AI-BigData sig中增加新的大数据组件和合入新优化代码问题

 

非常欢迎加入社区。

社区是开放的,也需要大家更多的参与进来不断完善。

1、大数据组件很多,而在欧拉社区Bigdata sig中目前还只有几个大数据组件,现在要增加大数据平台经常使用的如Sparkhive等一些组件

对于一些组件欢迎大家按照需要或者爱好增加。

2、现在针对大数据核心组件如SparkHbaseHive等组件进行优化,如何把优化代码合入到欧拉大数据 sig对应的组件中,体现欧拉社区大数据组件的竞争力

这些优化我觉得可以先列一下具体是什么优化,如针对哪个软件的什么架构的优化,有什么效果。

 

 

 

 

 

2021-11-05 14:09:23"Yangjian (nt)" <yangjian.yx@huawei.com> 写道:

Hi ALL

 

    针对欧拉社区Bigdata sig大数据组件两个问题:

 

1、大数据组件很多,而在欧拉社区Bigdata sig中目前还只有几个大数据组件,现在要增加大数据平台经常使用的如Sparkhive等一些组件

 

2、现在针对大数据核心组件如SparkHbaseHive等组件进行优化,如何把优化代码合入到欧拉大数据 sig对应的组件中,体现欧拉社区大数据组件的竞争力

 

   目前还是初步才了解欧拉社区,对欧拉社区的运作机制和管理要求还不是非常清楚,为了欧拉社区大数据 sig生态和发展,后续也想参与到欧拉社区贡献