问题描述:
用户在使用平台的公共集群时,经常会遇到由于误删除文件、误修改权限等操作,导致集群不可用的情况。这篇文章会列举一些常见问题,并教大家如何自行处理。
场景1:
用户误删除 ~/.bashrc 或 ~/.bash_profile 文件,导致系统的环境变量不能正常加载,最常见的表现就是登陆节点后看不到用户名,如图:

【修复方法】:手动创建 ~/.bashrc 或 ~/.bash_profile 文件,并退出当前登陆窗口,再重新登陆,即可正常使用。
~/.bashrc 文件内容:
# .bashrc
# Source global definitions
if [ -f /etc/bashrc ]; then
. /etc/bashrc
fi
# Uncomment the following line if you don't like systemctl's auto-paging feature:
# export SYSTEMD_PAGER=
# User specific aliases and functions
alias ll='ls -al'
~/.bash_profile 文件内容:
# .bash_profile
# Get the aliases and functions
if [ -f ~/.bashrc ]; then
. ~/.bashrc
fi
# User specific environment and startup programs
PATH=$PATH:$HOME/.local/bin:$HOME/bin
export PATH
场景2:
用户误修改 ~/.bashrc 文件内容,导致系统常用命令不能正常使用,如图:

【修复方法】:先执行 export PATH=/usr/bin
命令,使账号能正常使用系统命令。再按照 场景1 中的方法重置 ~/.bashrc 内容
场景3:
用户误删除 ~/.ssh 目录,导致已经申请了计算资源,但是登陆计算节点失败,如图:

【修复方法】:
- 执行
ssh-keygen
命令,并一直回车使用默认补全参数,生成新的公钥和私钥
- 执行
cd ~/.ssh && cat id_rsa.pub >> authorized_keys && chmod 600 authorized_keys
命令,使用节点间恢复互信
场景4:
用户修改错 .ssh 目录权限,或家目录权限,权限过大导致无法ssh登陆,如图:


【修复方法】:
- 执行
chmod 700 ~/.ssh
命令,修改权限为正常
- 执行
chmod 700 /home/xxx(个人用户名)
命令,修改权限为正常