
OS 버전: \m 2.6.9-100.ELsmp의 CentOS 릴리스 4.6(최종) 커널 \r
작업을 실행하려고 하면 다음과 같은 오류가 발생합니다.
qsub: Bad UID for job execution
새로운 사용자 계정을 만들었고 동일한 오류가 발생하지만 동일한 시스템의 다른 사용자는 문제 없이 작업을 실행할 수 있습니다.
이 문제를 어떻게 해결할 수 있나요?
답변1
지침은 다음과 같습니다.http://www.bo.infn.it/alice/introgrd/pbsabout/node18.html잘못된 사용자로 실행하고 있다고 제안하십시오.
Invalid user in #PBS -u new-user $ qsub sube.cmd qsub: Bad UID for job execution
사용자 목록에 정의된 사용자 이름이 정의되지 않았거나 작업 제출자의 사용자 이름과 다르거나 실행 노드의 사용자 UID 및 GID가 제출 노드의 사용자 UID 및 GID와 다릅니다. 이 경우 먼저 #PBS -u 지시어가 유효한 사용자를 지정하는지 확인한 다음 사용자 ID가 동일한지 확인하세요.
$ id
whoami
uid=501(myusrname) gid=501(myusrname) groups=501(myusrname) $ grep -e "PBS -u" cpbs.cmdPBS -u alice001 $ id alice001 uid=10417(alice001) gid=1395(alice) groups=1395(alice)
#PBS -u를 적절하게 변경합니다.
답변2
호스트 추가/etc/hosts.equiv내 문제를 해결했습니다.
그러나 나는 이미 이 줄을 qmgr
.
set server operators += [email protected]
set server acl_users += username
set server managers += [email protected]
set server acl_hosts += servername.local
set server operators += [email protected]
그런 다음 /etc/init.d/pbs_server restart
.
다시 시작할 수 있습니다.pbs_서버이미 실행 중이더라도.
서버를 추가할 필요는 없습니다./etc/hosts.equiv실행 중인 서버에 작업을 제출하는 경우pbs_서버.
답변3
이 질문이 약간 오래되었다는 것을 알고 있지만 최근에 이 문제가 발생하여 다음 단계를 수행했습니다.
- 문제의 사용자에 대해 클러스터 전체에서 UID 및 GID가 일치하는지 확인하세요.
qmgr -c "set server flatuid=true"
qmgr -c "set server acl_roots+=username@*"
qmgr -c "set server operators+=username@*"
여기서 *는 모든 호스트에 대한 와일드카드입니다. 매력처럼 작동합니다! 아마도 매우 안전하지는 않지만 확실히 작동합니다!
답변4
두 가지 절차:
/etc/passwd 파일 끝에 ""+::::::""를 추가합니다.
사용자가 작업을 제출하는 노드에 /etc/hosts.equiv 파일에 다른 모든 노드가 잘 정의되어 있는지 확인하십시오.
참고: 토크 관리 가이드 PDF에서 작업 실행에 대한 잘못된 UID를 검색하세요.