欧拉社区AI-BigData sig中增加新的大数据组件和合入新优化代码问题

Hi ALL: 针对欧拉社区Bigdata sig中大数据组件两个问题: 1、大数据组件很多,而在欧拉社区Bigdata sig中目前还只有几个大数据组件,现在要增加大数据平台经常使用的如Spark、hive等一些组件 2、现在针对大数据核心组件如Spark、Hbase、Hive等组件进行优化,如何把优化代码合入到欧拉大数据 sig对应的组件中,体现欧拉社区大数据组件的竞争力 目前还是初步才了解欧拉社区,对欧拉社区的运作机制和管理要求还不是非常清楚,为了欧拉社区大数据 sig的生态和发展,后续也想参与到欧拉社区贡献。

非常欢迎加入社区。 社区是开放的,也需要大家更多的参与进来不断完善。 1、大数据组件很多,而在欧拉社区Bigdata sig中目前还只有几个大数据组件,现在要增加大数据平台经常使用的如Spark、hive等一些组件 对于一些组件欢迎大家按照需要或者爱好增加。 2、现在针对大数据核心组件如Spark、Hbase、Hive等组件进行优化,如何把优化代码合入到欧拉大数据 sig对应的组件中,体现欧拉社区大数据组件的竞争力 这些优化我觉得可以先列一下具体是什么优化,如针对哪个软件的什么架构的优化,有什么效果。 在 2021-11-05 14:09:23,"Yangjian (nt)" <yangjian.yx@huawei.com> 写道: Hi ALL: 针对欧拉社区Bigdata sig中大数据组件两个问题: 1、大数据组件很多,而在欧拉社区Bigdata sig中目前还只有几个大数据组件,现在要增加大数据平台经常使用的如Spark、hive等一些组件 2、现在针对大数据核心组件如Spark、Hbase、Hive等组件进行优化,如何把优化代码合入到欧拉大数据 sig对应的组件中,体现欧拉社区大数据组件的竞争力 目前还是初步才了解欧拉社区,对欧拉社区的运作机制和管理要求还不是非常清楚,为了欧拉社区大数据 sig的生态和发展,后续也想参与到欧拉社区贡献。

1、大数据组件很多,而在欧拉社区Bigdata sig中目前还只有几个大数据组件,现在要增加大数据平台经常使用的如Spark、hive等一些组件 ----对于一些组件欢迎大家按照需要或者爱好增加。 如何增加,有没有相关的指导和操作流程?或者是否可先指导如增加Spark组件? 2、现在针对大数据核心组件如Spark、Hbase、Hive等组件进行优化,如何把优化代码合入到欧拉大数据 sig对应的组件中,体现欧拉社区大数据组件的竞争力 ----这些优化我觉得可以先列一下具体是什么优化,如针对哪个软件的什么架构的优化,有什么效果 主体的优化:针对架构或算法库等都有优化,如Spark MLlib库的一些算法,Kmeans优化后性能相对优化前可提升3倍+,PCA提升50%+等; 如Spark SQL实现架构优化,SQL1-99平均性能提升15%+,最高SQL可提升40%+;目前对于Hadoop、Spark、Hive、Hbase等常用组件都有优化。针对这些优化准备推送到欧拉社区,提升ARM和欧拉社区的竞争力;欧拉社区是否接受对架构或库的一些修改,对于这些优化如何进行合入? 发件人: 正心 [mailto:sinever@126.com] 发送时间: 2021年11月7日 23:43 收件人: Yangjian (nt) <yangjian.yx@huawei.com> 抄送: tc <tc@openeuler.org>; dev <dev@openeuler.org>; sig-ai-bigdata <sig-ai-bigdata@openeuler.org>; Wuzeyi (Iverson) <wuzeyi1@huawei.com> 主题: Re:[Sig-ai-bigdata] 欧拉社区AI-BigData sig中增加新的大数据组件和合入新优化代码问题 非常欢迎加入社区。 社区是开放的,也需要大家更多的参与进来不断完善。 1、大数据组件很多,而在欧拉社区Bigdata sig中目前还只有几个大数据组件,现在要增加大数据平台经常使用的如Spark、hive等一些组件 对于一些组件欢迎大家按照需要或者爱好增加。 2、现在针对大数据核心组件如Spark、Hbase、Hive等组件进行优化,如何把优化代码合入到欧拉大数据 sig对应的组件中,体现欧拉社区大数据组件的竞争力 这些优化我觉得可以先列一下具体是什么优化,如针对哪个软件的什么架构的优化,有什么效果。 在 2021-11-05 14:09:23,"Yangjian (nt)" <yangjian.yx@huawei.com<mailto:yangjian.yx@huawei.com>> 写道: Hi ALL: 针对欧拉社区Bigdata sig中大数据组件两个问题: 1、大数据组件很多,而在欧拉社区Bigdata sig中目前还只有几个大数据组件,现在要增加大数据平台经常使用的如Spark、hive等一些组件 2、现在针对大数据核心组件如Spark、Hbase、Hive等组件进行优化,如何把优化代码合入到欧拉大数据 sig对应的组件中,体现欧拉社区大数据组件的竞争力 目前还是初步才了解欧拉社区,对欧拉社区的运作机制和管理要求还不是非常清楚,为了欧拉社区大数据 sig的生态和发展,后续也想参与到欧拉社区贡献。
participants (3)
-
myeuler@163.com
-
Yangjian (nt)
-
正心