¿Cómo habilitar los procesadores de transmisión (SM) deshabilitados?

¿Cómo habilitar los procesadores de transmisión (SM) deshabilitados?

Estoy usando la GPU NVIDIA Quadro K2000. Corrí deviceQuery.exe, cuyos resultados se encuentran a continuación. Dice que solo tengo 2 unidades SM. No estoy seguro si realmente tengo solo 2 SM o si algunos de mis SM están deshabilitados como se menciona en eltercer comentario en esta pregunta SO.

También vi que el número de SP es 192 por SM. Es posible que haya alguna forma de habilitar más SM y luego disminuirá la cantidad de SP por SM.

imagen

Actualizar:La razón por la que pregunto es el hecho de que quiero que el procesamiento de mi GPU sea eficiente. Tengo una imagen de 1080 x 1920 que la he dividido en tres segmentos. Estoy transfiriendo estos segmentos H2D, procesando y transfiriendo D2H de forma asincrónica. Por lo tanto, quiero elegir una dimensión de bloques y una cantidad de subprocesos por bloque que puedan utilizar de manera eficiente la configuración de hardware de mi GPU. Además, todavía estoy confundido de que una GPU que tiene más de 2 SM (digamos 8 SM) pero menos SP por SM (384/8 = 48 SP por SM) funcionaría igual que una GPU que tiene 2 SM y 192 SP por ¿SM?Quiero decir, ¿lo que importa es el número total de SP disponibles?

Respuesta1

En orden:

  1. No estoy seguro si realmente tengo solo 2 SM o si algunos de mis SM están deshabilitados

    Tu GPU es GK107. Tiene dos SMX, cada uno con 192 SP. No hay procesadores deshabilitados.

  2. Puede ser [sic] que haya alguna manera de habilitar más SM y luego la cantidad de SP por SM disminuirá.

    No existe una forma mágica de cambiar el silicio en el software.

  3. Todavía estoy confundido de que una GPU que tiene más de 2 SM (digamos 8 SM) pero menos SP por SM (384/8 = 48 SP por SM) funcionaría igual que una GPU que tiene 2 SM y 192 SP por SM.

    Ésa es una gran pregunta y no voy a intentar responderla aquí. NVIDIA ha publicado muchos documentos técnicos muy detallados sobre la arquitectura y el rendimiento de las distintas generaciones de sus tarjetas informáticas insignia a medida que se lanza cada una. Si así lo desea, le sugiero que los lea usted mismo. Dicho esto, la regla general es quedentro de la misma generación de arquitecturacuanto más SM o SMX tenga un dispositivo, mejor funcionará en operaciones aritméticas ligadas. Comparar diferentes generaciones de GPU es inútil. Por ejemplo, la primera tarjeta informática Telsa que lanzó NVIDIA tiene 16 SM (la C860). El más reciente tiene 15 SMX (el K40). Hay una diferencia de aproximadamente 10 veces en su rendimiento máximo de precisión simple. Tenga en cuenta también que muchas aplicaciones del mundo real están limitadas al ancho de banda de la memoria y eso puede cambiar radicalmente la diferencia de rendimiento entre diferentes tarjetas. Mientras que el recuento de núcleos y el FLOP máximo han seguido más o menos la Ley de Moore, el ancho de banda de la memoria no.

información relacionada