Citrix se degrada con 100% de CPU

Citrix se degrada con 100% de CPU

Disponemos de una granja Citrix PS4.0 formada por 2 servidores Citrix físicos y 2 virtuales. Cualquiera de ellos, en algún momento u otro, eventualmente degradará su rendimiento debido a que se alcanza el 100% de uso de la CPU. Puedo ver el aumento en el uso de CPU en Virtual Infrastructure Client cuando esto sucede en cualquiera de los servidores VMware.

Este no es un problema de carga relacionado con la cantidad de usuarios, ya que puede suceder en cualquier momento con cualquier cantidad de usuarios.

Los usuarios ejecutan escritorios compartidos, no aplicaciones. Las aplicaciones instaladas en el escritorio son aplicaciones de oficina estándar (Word, Excel, Outlook) con acceso limitado a Internet Explorer a través de un proxy Bluecoat y un par de aplicaciones específicas de la industria.

¿Qué herramientas se pueden utilizar para solucionar y diagnosticar el origen del problema? Una vez que el servidor alcanza el 100% de CPU, es imposible iniciar sesión y ver qué proceso está consumiendo todos los recursos. El único recurso es realizar un reinicio completo de la máquina. Todos los servidores se reinician a las 4 a. m. cada mañana según un horario.

NOTA: Ya tengo ThreadMaster instalado en todos los servidores Citrix usando las opciones de configuración predeterminadas y registrando actividades. Los registros no revelan el origen del problema.

EDITAR

  • Citrix Presentation Server 4.0, edición empresarial
  • Revisión PSE400W2K3R03
  • Windows 2003 Server Edición Estándar Service Pack 1
  • Ejecuta Symantec Client Security 10.0.0.359 configurado según las recomendaciones de Citrix para exclusiones de archivos, etc.

Respuesta1

Windows 2003 SP1 dejó de ser compatible en abril, por lo que su sistema operativo ya no recibe ningún parche de seguridad. Necesita actualizar a SP2 lo antes posible.

SP2 también contiene muchas correcciones de errores aleatorios: el problema podría desaparecer.

Si su sistema operativo tiene un nivel de parche tan antiguo, es muy probable que algunos controladores, específicamentecontroladores de impresión- También podría estar desactualizado en la caja. Como los controladores son una gran fuente de inestabilidad del sistema en general, intentaría comprobar que todos estén firmados y actualizados. Tener un controlador de impresión poco fiable explicaría por qué afecta tanto a las cajas virtuales como a las físicas, y parece ocurrir de forma aleatoria independientemente de la carga.

Ah, y para su información, Citrix 4 llega a EOM (fin de mantenimiento, no más correcciones de errores) a finales de este mes, el 9 de junio, y EOL (fin de vida, no más parches de seguridad ni ningún otro parche) a finales de diciembre de 2009. Disfrute ¡Tu ciclo de actualización!

Respuesta2

Puede intentar programar un script para que se ejecute cada minuto aproximadamente y que agregue la lista de procesos a un archivo:

pslist >> whatever.txt

Algo como esto al menos podría darte una pista de lo que está pasando.

(pslist viene con Sysinternals Suite)

Respuesta3

el incorporadoRegistros de rendimiento y alertasLa herramienta sería una gran herramienta para obtener algunos datos sobre lo que está sucediendo. Tendrá que usar algo de espacio en disco para generar estos registros, pero si continúa eliminando archivos de registro antiguos hasta que ocurra el problema, no debería tener problemas de quedarse sin disco.

Iniciaría un registro de contador en cada computadora servidor, registrando elProcesoyProcesadorobjetos al disco (probablemente también tomaría elMemoriaobjeto también).

  • Iniciar / Ejecutar / PERFMON

  • Ampliar laRegistros de rendimiento y alertasnodo y resalte elRegistros de contadornodo.

  • Hacer clicAcciónyNueva configuración de registro. Nombra el registro como quieras.

  • Haga clic en elAgregar objetos...en la ventana de propiedades de registro y agregue los objetos para registrar.

  • Establece un intervalo. Probablemente elegiría un intervalo de 60 segundos o más. Probablemente no sea necesaria una alta resolución, ya que se trata de una degradación gradual.

  • Sobre elArchivos de registropestaña, utilice elConfigurarpara elegir una ubicación para el archivo de registro y un nombre de archivo base. elegiría unTamaño máximo de registrode, digamos, 5 MB - 10 MB. Esto generará muchos archivos pequeños, pero podrá monitorear la ruta donde almacena los archivos y eliminar los archivos más antiguos que se estaban acumulando antes de que ocurriera el problema.

Puede iniciar el registro haciendo clic derecho en la nueva instancia de registro en el panel de resultados y eligiendo "Iniciar". El registro se ejecutará, de forma predeterminada, hasta que lo detenga o hasta que reinicie la computadora. (Consulte esta pregunta para obtener información sobre cómo iniciar un inicio de sesión en el arranque:¿Cómo configurar Perfmon para iniciar automáticamente una "alerta" al iniciar el sistema? (La pregunta habla sobre cómo iniciar una alerta, pero puede usar el mismo comando para iniciar un registro).

Puede analizar estos registros manualmente después de que se produzca el problema. Quizás quieras probar MicrosoftAnálisis de rendimiento de registros (PAL)herramienta (http://www.codeplex.com/PAL). Estoy contento con los informes que generó esa herramienta y es bastante fácil de usar.

Respuesta4

¿Qué edición estás ejecutando y tienes un acuerdo SA?

¿Está ejecutando antivirus en el servidor?

Además, ¿qué revisiones/paquetes acumulativos estás ejecutando para PS4 y qué SP estás usando para Windows?

información relacionada