问题描述
- 管理员平台更新了集群配额和集群QoS的功能,用户不清楚这些功能的实际效果。
- 用户需要对集群用户的作业量、cpu核心等资源进行限制。


处理方法
一、设置每用户最大提交作业数和最大运行作业数
在集群Qos中的normal qos中设置。

在集群配置->全局配置 中设置

如果在上述两个地方都设置了,则以集群 QoS 中的设置优先生效。
二、设置每用户(可运行)CPU 核数,GPU 卡数,节点数。
- 该项只能在集群 QoS 中设置。
- 如果在在集群配额->全局配置中设置了 CPU 核数、GPU 卡数、节点数 这三项,限制的效果是所有用户的CPU核数、GPU卡数和节点数 总和。
- 如果要单独对某个用户设置这3项,最好在集群 QoS 中单独填加个新 QoS ,并且把这个qos设置为该用户的默认 qos 。

三、默认的配置方法
在集群配额 ->全局配置 中将normal qos设置为平台用户的默认qos。
在集群 QoS 中 设置 normal qos 的各项参数。
如果有新的用户需要单独的配置,则单独创建一个 qos ,设置 qos 参数, 并将该 qos 设置为该用户的默认 qos 。



如果qos和个人配置中都限制了cpu / gpu / 节点数,以较小的值生效。