PBS를 통해 작업을 제출하려고 하면 qsub: 작업 실행에 대한 잘못된 UID 오류가 발생합니다.

PBS를 통해 작업을 제출하려고 하면 qsub: 작업 실행에 대한 잘못된 UID 오류가 발생합니다.

OS 버전: \m 2.6.9-100.ELsmp의 CentOS 릴리스 4.6(최종) 커널 \r

작업을 실행하려고 하면 다음과 같은 오류가 발생합니다.

qsub: Bad UID for job execution

새로운 사용자 계정을 만들었고 동일한 오류가 발생하지만 동일한 시스템의 다른 사용자는 문제 없이 작업을 실행할 수 있습니다.

이 문제를 어떻게 해결할 수 있나요?

답변1

지침은 다음과 같습니다.http://www.bo.infn.it/alice/introgrd/pbsabout/node18.html잘못된 사용자로 실행하고 있다고 제안하십시오.

Invalid user in #PBS -u new-user

$ qsub sube.cmd
qsub: Bad UID for job execution

사용자 목록에 정의된 사용자 이름이 정의되지 않았거나 작업 제출자의 사용자 이름과 다르거나 실행 노드의 사용자 UID 및 GID가 제출 노드의 사용자 UID 및 GID와 다릅니다. 이 경우 먼저 #PBS -u 지시어가 유효한 사용자를 지정하는지 확인한 다음 사용자 ID가 동일한지 확인하세요.

$ id whoamiuid=501(myusrname) gid=501(myusrname) groups=501(myusrname) $ grep -e "PBS -u" cpbs.cmd

PBS -u alice001 $ id alice001 uid=10417(alice001) gid=1395(alice) groups=1395(alice)

#PBS -u를 적절하게 변경합니다.

답변2

호스트 추가/etc/hosts.equiv내 문제를 해결했습니다.
그러나 나는 이미 이 줄을 qmgr.

set server operators += [email protected]
set server acl_users += username
set server managers += [email protected]
set server acl_hosts += servername.local
set server operators += [email protected]

그런 다음 /etc/init.d/pbs_server restart.

다시 시작할 수 있습니다.pbs_서버이미 실행 중이더라도.
서버를 추가할 필요는 없습니다./etc/hosts.equiv실행 중인 서버에 작업을 제출하는 경우pbs_서버.

답변3

이 질문이 약간 오래되었다는 것을 알고 있지만 최근에 이 문제가 발생하여 다음 단계를 수행했습니다.

  • 문제의 사용자에 대해 클러스터 전체에서 UID 및 GID가 일치하는지 확인하세요.
  • qmgr -c "set server flatuid=true"
  • qmgr -c "set server acl_roots+=username@*"
  • qmgr -c "set server operators+=username@*"

여기서 *는 모든 호스트에 대한 와일드카드입니다. 매력처럼 작동합니다! 아마도 매우 안전하지는 않지만 확실히 작동합니다!

답변4

두 가지 절차:

  1. /etc/passwd 파일 끝에 ""+::::::""를 추가합니다.

  2. 사용자가 작업을 제출하는 노드에 /etc/hosts.equiv 파일에 다른 모든 노드가 잘 정의되어 있는지 확인하십시오.

참고: 토크 관리 가이드 PDF에서 작업 실행에 대한 잘못된 UID를 검색하세요.

관련 정보