
Portanto, tivemos um problema hoje em que menos de uma dúzia de usuários obtiveram erros de tempo limite no OWA. "! Servidor ocupado O servidor está ocupado e responde à sua solicitação. Tente novamente mais tarde."
Eles são todos externos, passando por nosso TMG e atingindo apenas um de nossos dois servidores CAS do site onde residem suas caixas de correio. Há cerca de 5.000 caixas de correio neste site, mas a maioria dos usuários acessa o array CAS internamente e, portanto, está dividida igualmente entre os dois.
Após a inspeção, os logs do IIS mostram >200 ocorrências de "orçamento excessivo". Exemplo abaixo.
Parece que o problema é "Max Effective Time In CAS" , e o Perfmon mostra isso frequentemente subindo acima de 100%, durante o tempo em que eu estava executando o Perfmon. Coletamos dados de desempenho via Solarwinds, mas este não é um dos contadores, então não tenho um histórico. No entanto, nossos últimos 7 dias de registro do IIS mostram que geralmente vemos um "excesso de orçamento" de um dígito por dia.
O problema é que não vejo essencialmente nada sobre o que fazerfazersobre a redução do "tempo efetivo gasto no CAS" - além de remover/alterar minha política de limitação. Nada mais realmente me chama a atenção em termos de desempenho neste servidor. CPU e RAM estão bem - é uma VM de processo duplo, com média de aproximadamente 27% de CPU em cada processo. 12 GB de RAM, 3 GB de cache, 3 GB disponíveis, 50 MB livres. Além de obter o balanceamento de carga adequado, de modo a distribuir a carga, o que posso realmente fazer para diagnosticar e corrigir esse problema decorrente desse contador?
09-05-2014 15:41:54 10.70.39.170 GET /owa/ &ex=E303&OverBudget(Normal/CAS),Proprietário:Sid~domínio\nome de usuário~OWA~false [Conn:2,HangingConn:0,AD:18000/ 18000/0%, CAS: 90000/-2602/155%, AB: 18000/18000/0%, RPC: 90000/89768/1%, FC: 1000/0, Política: DefaultThrottlingPolicy_aaadc777-4ff8-4a5e-97cc-2ec1e383cb7b ,Norma] &v=14.3.174.1&mbx=SERVER01.company.local&sessionId=e842baf430514576aabf3ef6f372494c&prfltncy=1&prfrpccnt=0&prfrpcltncy=0&prfldpcnt=0&prfldpltncy=0&prfavlcnt=0&prfavllt ncy=0&Fim+Orçamento>> Conn:2,HangingConn:0,AD:18000/18000/0 %, CAS: 90000/-2602/155%, AB: 18000/18000/0%, RPC: 90000/89768/1%, FC: 1000/0, Política: DefaultThrottlingPolicy_aaadc777-4ff8-4a5e-97cc-2ec1e383cb7b, Norma 443 empresa.local\ Mozilla/5.0+(Macintosh;+Intel+Mac+OS+X+10_9_2)+AppleWebKit/537.75.14+(KHTML,+like+Gecko)+Version/7.0.3+Safari/537.75.14 200 0 0 202
Responder1
Estou adicionando minha resposta, porque foi o que funcionou. Se alguém puder preencher o "Por que" isso funcionou, o que realmente explicaria o que quebrou, ficarei feliz em aceitar isso como uma resposta melhor.
Minha correção: uma reinicialização.