[Dev] 答复: 关于A-tune的tuning功能源码一些疑问

2 Dec 2020


      问题一：在atune-adm tuning命令server端是否只执行benchmark脚本，其他控制的程序（go流程控制）以及算法调优部分（python）都是在client上执行？
您好， Atune-adm tuning命令运行的机器是作为client端，client端会执行benchmark脚本，因为很多benchmark会占用系统资源，放在sever端会影响业务的性能，其他go流程（rpc服务端）以及算法调优部分都运行在server端，同时算法调优部分是atune-engine服务，也支持独立机器部署。

问题二：go控制代码如何获取需要调整的参数的默认值，并将这些参数的默认值发送到python调优代码中，以便我们进行参数遍历选择。
您好，go这边有个Knob的数据类型，内部有个Ref字段可以存储调整参数的默认值，这些默认值会发送到python调优代码中，在python端通过[p_nob[‘ref’] for _, p_nob in enumerate(self.knobs)]的形式就可以获取你所有参数的默认值，这里将环境恢复默认值可以调用go这边的RestoreConfigTuned实现

发件人: whoconli [mailto:conli_who@foxmail.com]
发送时间: 2020年12月1日 9:43
收件人: hanxinke <hanxinke@huawei.com>
抄送: linww <linww@scut.edu.cn>; 20研李俊祺 <2506534280@qq.com>; 18级李毓睿 <liyurui1995@163.com>
主题: 关于A-tune的tuning功能源码一些疑问

A-tune开发人员您们好，在整合我们的算法到A-tune当中碰到了一些问题想要向您们请教，具体问题请见word文档，谢谢！

________________________________
Best regards,
conli,who
胡康立


------------------ 原始邮件 ------------------
发件人: "hanxinke" <hanxinke@huawei.com<mailto:hanxinke@huawei.com>>;
发送时间: 2020年11月30日(星期一) 中午11:00
收件人: "20研李俊祺"<2506534280@qq.com<mailto:2506534280@qq.com>>;"a-tune"<a-tune@openeuler.org<mailto:a-tune@openeuler.org>>;
抄送: "whoconli"<conli_who@foxmail.com<mailto:conli_who@foxmail.com>>;"linweiwei"<147868463@qq.com<mailto:147868463@qq.com>>;"Fanwentao (Henry)"<fanwentao@huawei.com<mailto:fanwentao@huawei.com>>;"Xiezhipeng(EulerOS)"<xiezhipeng1@huawei.com<mailto:xiezhipeng1@huawei.com>>;
主题: 答复: 回复：答复: [A-tune] 回复：关于今天SIG上提出的遍历选参脚本

非常感谢俊祺，可以将遍历选参脚本作为一种新的调优算法合并到A-Tune中。

发件人: 20研李俊祺 [mailto:2506534280@qq.com]
发送时间: 2020年11月30日 9:10
收件人: hanxinke <hanxinke@huawei.com<mailto:hanxinke@huawei.com>>; a-tune <a-tune@openeuler.org<mailto:a-tune@openeuler.org>>
抄送: 胡康立 <conli_who@foxmail.com<mailto:conli_who@foxmail.com>>; linweiwei <147868463@qq.com<mailto:147868463@qq.com>>
主题: 回复：答复: [A-tune] 回复：关于今天SIG上提出的遍历选参脚本

A-Tune的负责人你们好，按照你们的要求，我们测试了一下“遍历选参(traverse)”和“lhs”算法的选参效果，结果如下：
[cid:image001.png@01D6C88F.D0D13B60]

origin是遍历选参脚本选出的参数（最优），‘lhs’算法的结果或多或少会漏掉部分重要参数。如果你们能够接受，我们就开始合并代码的相关工作。

-----------------------------------------------------------------------------------------------
Best Regard, LI C：
李俊祺，20级研究生，华南理工大学计算机科学与工程学院
ChunKi LI，Grade 2020 graduate student，South China University of Technology
研究方向：基于群智能的云计算调度优化和节能技术
-----------------------------------------------------------------------------------------------


------------------ 原始邮件 ------------------
发件人: "hanxinke" <hanxinke@huawei.com<mailto:hanxinke@huawei.com>>;
发送时间: 2020年11月20日(星期五) 下午3:39
收件人: "20研李俊祺"<2506534280@qq.com<mailto:2506534280@qq.com>>;"a-tune"<a-tune@openeuler.org<mailto:a-tune@openeuler.org>>;
抄送: "linweiwei"<147868463@qq.com<mailto:147868463@qq.com>>;"胡康立"<conli_who@foxmail.com<mailto:conli_who@foxmail.com>>;
主题: 答复: [A-tune] 回复：关于今天SIG上提出的遍历选参脚本

俊祺，您好，感谢您能参与到A-Tune的算法研究与开发中！我发表下看法：

1、Abtest确实如您说的有局限性，它的适用场景是已知参数量比较少，同时这几个参数都有正向作用的场景，它并不适用与重要参数选择。
2、您的这个算法偏向于重要参数选择，适用的场景应该是参数量比较多，同时有很多参数对你的性能有影响的场景，它在参数量很多，但是很多参数对性能没有影响的场景会花费很多时间
3、我们这边在参数选择这块实现了lhs算法，它能够在参数量比较多的场景中花费更少的时间选择出重要的参数，您看能否在您的这个场景中尝试下这个lhs算法，并跟您的这个算法做下比较


发件人: 20研李俊祺 [mailto:2506534280@qq.com]
发送时间: 2020年11月20日 11:42
收件人: a-tune <a-tune@openeuler.org<mailto:a-tune@openeuler.org>>
抄送: linweiwei <147868463@qq.com<mailto:147868463@qq.com>>; 胡康立 <conli_who@foxmail.com<mailto:conli_who@foxmail.com>>
主题: [A-tune] 回复：关于今天SIG上提出的遍历选参脚本

附：脚本的Input和Output，及相关截图：

Input：“yaml参数文件”、“负载执行命令”、“能效判别阈值x”、“至少应被选中的y%的参数”、

             “运行记录文件的输出路径”、“被选中参数的yaml文件输出路径”；


运行记录文件：
[cid:image002.jpg@01D6C88F.D0D13B60]


运行过程的log：
[cid:image003.jpg@01D6C88F.D0D13B60]

另外，该脚本会根据用户输入的阈值输出yaml文件。


-----------------------------------------------------------------------------------------------
Best Regard, LI C：
李俊祺，20级研究生，华南理工大学计算机科学与工程学院
ChunKi LI，Grade 2020 graduate student，South China University of Technology
研究方向：基于群智能的云计算调度优化和节能技术
-----------------------------------------------------------------------------------------------


------------------ 原始邮件 ------------------
发件人: "20研李俊祺" <2506534280@qq.com<mailto:2506534280@qq.com>>;
发送时间: 2020年11月20日(星期五) 中午11:34
收件人: "a-tune"<a-tune@openeuler.org<mailto:a-tune@openeuler.org>>;
抄送: "linweiwei"<147868463@qq.com<mailto:147868463@qq.com>>;"胡康立"<conli_who@foxmail.com<mailto:conli_who@foxmail.com>>;
主题: 关于今天SIG上提出的遍历选参脚本

A-Tune的各位开发人员你们好，关于刚才SIG会议上提到的abtest调参算法同样是遍历思想来完成的问题，我有以下看法：

1、固定其他参数，不断修改参数值以获取当前参数的最优值，然后固定该最优值，再调整后面的参数，这个在少量参数需要调整的时候
     应该是可以快速做到这一点的。

     但是，当参数数量达到100+以上的时候，abtest算法可能就要运行很长一段时间了。而我们的选参脚本是针对多个参数（几乎
     涵盖tunning_param_all.yaml文件里面的所有参数）进行选参（不是调参），负载执行次数相对来说会比较少。

     我们的选参脚本可以解决的就是，避免abtest算法需要穷举所有参数的所有范围来运行导致优化时间过长的问题。
   先选出合理的参数，再交给atune的tuning算法来优化，可以省下不少的时间。如果一个参数本身某个评价指标是
     没有什么影响的，那abtest可能会花不必要的时间来改变参数运行负载。

2、我们的脚本是针对服务器的初始状态进行选参的，在每次修改某个参数以后，我们都会将该参数恢复为默认值，然后再
     测试下一个参数对能效的影响。而abtest每次获取到一个参数的最优值，就会吧这个参数固定在这个最优值上。我觉得有
     些参数是具有依赖性的，如果调整好前面的参数再调后面的参数，可能会对后面参数的选择造成影响（无法分辨出哪些参数
     对评价指标具有最大的影响程度）。因此，如果我们是针对选参任务来进行遍历的话，我们在遍历过程中会将参数恢复成服务器
     默认的状态，区分出参数对某一评价指标（比如能效）的重要程度，根据用户输入的阈值，筛选出最具影响力的参数，再用tuning
     的不同算法对这部分参数进行优化，是有意义的；

这就是我对我的选参脚本和abtest不同之处的分析，不知道你们怎么看呢？


-----------------------------------------------------------------------------------------------
Best Regard, LI C：
李俊祺，20级研究生，华南理工大学计算机科学与工程学院
ChunKi LI，Grade 2020 graduate student，South China University of Technology
研究方向：基于群智能的云计算调度优化和节能技术
-----------------------------------------------------------------------------------------------