
Entonces, hoy tuvimos un problema en el que menos de una docena de usuarios recibieron errores de tiempo de espera en OWA. "! Servidor ocupado El servidor está ocupado y responde a su solicitud. Inténtelo de nuevo más tarde."
Todos son externos, por lo que pasan a través de nuestro TMG y llegan solo a uno de nuestros dos servidores CAS para el sitio donde se encuentran sus buzones de correo. Hay alrededor de 5000 buzones de correo en total en este sitio, pero la mayoría de los usuarios acceden a la matriz CAS internamente y, por lo tanto, se dividen equitativamente entre los dos.
Tras la inspección, los registros de IIS muestran >200 casos de "sobrepresupuesto". Ejemplo a continuación.
Parece que el problema es "Tiempo máximo efectivo en CAS", y Perfmon muestra que esto a menudo supera el 100%, durante el tiempo que estuve ejecutando Perfmon. Recopilamos datos de rendimiento a través de Solarwinds, pero este no es uno de los contadores, por lo que no tengo un historial. Sin embargo, nuestros últimos 7 días de registro de IIS muestran que generalmente vemos un "sobrepresupuesto" de un solo dígito por día.
La cuestión es que básicamente no veo nada sobre quéhacersobre reducir el "tiempo efectivo dedicado a CAS", además de eliminar/cambiar mi política de limitación. Realmente no me llama la atención nada más sobre el rendimiento en este servidor. La CPU y la RAM están bien: es una máquina virtual de doble proceso, con un promedio de ~27% de CPU en cada proceso. 12 GB de RAM, 3 GB de caché, 3 GB disponibles, 50 MB libres. Además de lograr un equilibrio de carga adecuado para distribuir la carga, ¿qué puedo hacer realmente para diagnosticar y solucionar este problema que surge de este contador?
2014-05-09 15:41:54 10.70.39.170 GET /owa/ &ex=E303&OverBudget(Normal/CAS),Propietario:Sid~dominio\nombre de usuario~OWA~false [Conexión:2,Conexión colgante:0,AD:18000/ 18000/0%,CAS:90000/-2602/155%,AB:18000/18000/0%,RPC:90000/89768/1%,FC:1000/0,Política:DefaultThrottlingPolicy_aaadc777-4ff8-4a5e-97cc-2ec1e383cb7b ,Norma] &v=14.3.174.1&mbx=SERVER01.company.local&sessionId=e842baf430514576aabf3ef6f372494c&prfltncy=1&prfrpccnt=0&prfrpcltncy=0&prfldpcnt=0&prfldpltncy=0&prfavlcnt=0 &prfavlltncy=0&Fin+Presupuesto>> Conexión:2,Conexión colgante:0,AD:18000/18000/0 %,CAS:90000/-2602/155%,AB:18000/18000/0%,RPC:90000/89768/1%,FC:1000/0,Política:DefaultThrottlingPolicy_aaadc777-4ff8-4a5e-97cc-2ec1e383cb7b, Norma 443 empresa.local\ Mozilla/5.0+(Macintosh;+Intel+Mac+OS+X+10_9_2)+AppleWebKit/537.75.14+(KHTML,+like+Gecko)+Versión/7.0.3+Safari/537.75.14 200 0 0 202
Respuesta1
Estoy agregando mi respuesta, porque es lo que funcionó. Si alguien puede completar el "Por qué" funcionó, lo que realmente explicaría qué se rompió, estaré feliz de aceptarlo como una mejor respuesta.
Mi solución: un reinicio.