会议纪要: 2024年6月4日 10:00 am 双周例会 轮值主持:吴兴义 参与者(gitee id):华为-王增亮,华为-刘秦飞(liuqinfei),Linaro- 刘新良(xin3liang),联通-吴兴义 ,朱超 1,社区需求进展 22.03 LTS SP4 lustre rpm进展(刘新良) SP4分支已完成更新,工程已经加到每日发布版本中 http://121.36.84.172/dailybuild/EBS-openEuler-22.03-LTS-SP4/openeuler-2024-0... Lustre性能优化创新项目(刘新良) 调整IRQ绑核,mpirun --bind-to numa单节点有几分提高,由原来21分提高到24分 接下来重点分析一下mdtest-hard fastblock创新项目开发进展 (吴兴义) 编写集群的一键部署脚本,可快速部署出一个集群并在虚拟机和物理服务器上进行了初步验证; 禁止使用相同osd id重复启动同名osd; 修复 rpc 的 heap buffer overflow的问题,将rpc模块的压力测试脚本优化,后期更多测试脚本会加入CI系统; 修复了make install时无法安装systemctl的service文件到/etc目录的问题; 修复了osd重启后处理append raft entry失败,导致触发重复选举的bug; 常规故障下(osd正常kill、osd强制退出等),能够进行pg状态变更、pg重新分配等; 在较大规模的压测中发现ubuntu 22.04的内核会出现ofed驱动打印错误日志、rdma read被卡住导致心跳rpc丢失等问题,而openeuler 22.03没出现类似问题,后期主要还是在openeuler 22.03上进行验证开发; 本周开始进行集群运行时状态导出原型开发,可通过简单命令行导出诸如pg信息、iops和带宽等信息; 目前已满足故障测试、性能测试的要求,Q2末发布的版本中计划包含roce和ib网络下测试报告; Ceph18.2.2在openEuler24.03-LTS的适配验证 (王增亮) 目前整体用例通过率70%+ ,后续通过优化磁盘,网络环境来验证 项目管理工具 (朱超) 输出redmine的使用指导文档 研究自定义链接的字段