Salta al contenido principal

Entrada del blog por ANTEC Online

Manual de reparación de hashboard Antminer S9k/S9se

Describe principalmente la solución de problemas de varias fallas de Bitmain S9K S9SE y explica cómo usar el accesorio de prueba Antminer vendido por ThanosMining para un posicionamiento preciso.

Miner Tester: dispositivo de prueba Antminer S9

I. Requisitos de la plataforma de mantenimiento 
1. El soldador de temperatura constante (350-400 °C). El cabezal del soldador de punta se utiliza para soldar resistencias y condensadores de chip. 
2. La chimenea térmica se usa para desmontar y soldar chips, tenga cuidado de no calentar durante mucho tiempo para evitar la formación de espuma en la PCB.
3. Fuente de alimentación APW3 ++ (salida 12 V, 133 A máx.), utilizada para probar y medir la placa de cálculo.
4. El multímetro, pinzas, plantilla de prueba V9 (si hay condición, se puede configurar un osciloscopio).
5. Fundente, agua para limpieza de panel con alcohol anhidro; El agua para limpiar el panel se usa para limpiar los residuos de fundente y la apariencia después del mantenimiento.
7. Se usa adhesivo termoconductor para volver a colocar la aleta de enfriamiento después de la reparación.

II. Requisitos de las operaciones de mantenimiento
1. El personal de mantenimiento debe tener ciertos conocimientos electrónicos, más de un año de experiencia en mantenimiento y dominar la tecnología de soldadura de paquetes QFN.
2. Después de la reparación, la placa de computadora debe probarse dos veces y confirmarse como correcta antes de que pueda pasar.
3. Preste atención al método de operación al reemplazar el chip. Después de reemplazar cualquier accesorio, la placa de circuito impreso no se deforma de manera evidente, y las piezas reemplazadas y el área circundante se deben verificar para ver si hay un circuito abierto o un cortocircuito.
4. Determine el objeto de la estación de mantenimiento y los parámetros del software de prueba correspondientes y las plantillas de prueba.
5. Verifique si las herramientas y las plantillas pueden funcionar normalmente.
(Si la potencia de salida es la misma que la configuración en el archivo de configuración de la plantilla. Los diferentes niveles de BIN y el modo de paquete de chips deben corresponder a los archivos de configuración y de prueba de placa única del programa de plantilla de prueba de placa única).

III. Principio y estructura
1. Descripción general del principio
1.1 La placa de cómputo S9K S9SE está compuesta por 6 dominios de voltaje conectados en serie. Hay 10 chips BM1393 en cada dominio de voltaje y hay 60 chips BM1393 en toda la placa.
1,2 hay 208 núcleos en un solo chip BM1393, el voltaje del dominio es de 1,6 V y el voltaje total de los 6 dominios en toda la placa es de 9,6 V-9,9 V
1.3 El reloj S9K S9SE está compuesto por dos osciladores de cristal activos de 25M (Y1, Y2), Y1 se transmite desde el primer chip al chip 30 en serie, y Y2 se transmite desde el chip 31 al chip 60 en serie
1.4 Hay independiente pequeña aleta de enfriamiento en la parte delantera y trasera de cada chip de la placa de computación S9K S9SE. La aleta de enfriamiento pequeña en el lado frontal es el parche SMT, y la aleta de enfriamiento pequeña en el lado posterior se fija en la parte posterior del IC mediante el adhesivo termoconductor después de la medición inicial. Después de que el chip reparado y reemplazado pase la prueba, es necesario aplicar uniformemente adhesivo termoconductor negro en la superficie del IC y calentarlo y fijarlo.

Nota:
En el proceso de mantenimiento, al reemplazar los componentes de la placa de circuito o el chip, para reducir el daño de la pistola sopladora a la placa de circuito impreso y al chip debido a la alta temperatura, es necesario quitar primero las pequeñas aletas de refrigeración cerca del componente defectuoso. y en la parte posterior de la placa PCB antes de reemplazarla.
Hay puntos de prueba en las superficies del chip PCB. Al fabricar y reparar, si no hay una aleta de enfriamiento adherida al chip PCB, se puede usar el punto de prueba en la superficie del chip; para la reparación de productos terminados (reparación posventa), dado que la parte delantera y trasera de la PCB están cubiertas por aletas de enfriamiento, es necesario localizar la falla a través del punto de prueba en la superficie del chip de la PCB. Se puede usar un cable de prueba delgado especial para sondear el espacio de la aleta de enfriamiento para la medición. Sin embargo, dado que la aleta de enfriamiento pequeña SMT está conectada a tierra de cada dominio de voltaje, es necesario prestar atención al aislamiento del cable de prueba en la medición para evitar un cortocircuito causado por el cable de prueba.

2. Análisis del punto clave 
2.1 La siguiente figura muestra la distribución del dominio del chip, la ruta de la señal y la distribución del circuito de la placa de señal S9K S9SE:
format,webp

format,webp

La dirección del flujo de la señal CLKO es generada por el oscilador de cristal Y1 25M, que se transmite desde el chip U1 al chip U30; es generado por el oscilador de cristal Y2 25M y se transmite desde el chip U31 al chip U60. Cuando está en espera y computando, el voltaje es de 0.9V.
La señal CO (CI, C0) ingresa desde el pin 7 en el puerto IO (J4), y luego se transmite desde el chip U1 al chip U60; cuando la línea IO no está insertada, el voltaje es 0 y el voltaje es 1.8V cuando se calcula.
La señal RI (R1, RO) regresa del chip U60 al chip U1 y luego regresa a la placa de control desde el pin (J4) 8 en el puerto IO; cuando la señal IO no está insertada, el voltaje es de 1,8 V y el voltaje es de 1,8 V cuando se calcula.
La señal BO (BI, BO) fluye desde el chip U1 a U60 para bajar el nivel; el voltaje es de 0 V cuando no hay una línea IO insertada y durante el modo de espera, hay una 
señal de pulso de alrededor de 0,3 cuando se calcula, por lo general, si no se puede medir el voltaje, es normal.
La señal NRSTO (NRSTO, NRSTI) ingresa desde el pin (J4)) 3 en el puerto IO y luego se transmite desde el chip U1 al chip U60; el voltaje es de 0 V cuando no hay 
señal IO insertada y durante el modo de espera, y el voltaje es de 1,8 V cuando se calcula.

2.2 Circuitos clave de la placa de cálculo S9K S9SE 
2.2.1 Diagrama esquemático de la administración de energía U122
format,webp

2.2.2 Diagrama esquemático del circuito de CC a CC
format,webp

2.2.3 Diagrama esquemático de EEPROM IC (la prueba de placa única cambiará el número mágico, la información de detección de temperatura y la información CRC en la EEPROM)
format,webp

2.2.4 Diagrama esquemático del circuito de sujeción
format,webp

2.2.5 Diagrama esquemático de PIC U102
format,webp

2.2.6 Puntos de prueba de señal de cada chip (como se muestra a continuación después de amplificado):
format,webp

2.2.7 Diagrama del circuito de clavijas de cada chip en los Dominios 1, 3 y 5
format,webp

2.2.8 Diagrama del circuito de clavijas de cada chip en los Dominios 2, 4 y 6
format,webp

2.2.9 Diagrama del circuito de J4 en el puerto IO
format,webp

2.2.10 Diagrama esquemático del circuito de 0,8 V,
format,webp

format,webp

1,8 V 2.2.11 Diagrama esquemático para la conversión de señal de nivel
format,webp

2.2.12 Diagrama esquemático para el oscilador de cristal Y1, Y2
format,webp

format,webp

2.2.13 LDO 0.8V, 1.8V y medición del oscilador de cristal
format,webp

format,webp

● Ideas de mantenimiento S9K S9SE
Durante el mantenimiento, realice 10 pruebas antes y después del chip de prueba principal (cinco antes y después del chip : CLKO, CO, RI, BO, NRSTO); Salida DC-DC y voltaje PIC Voltaje
CORE; LDO (0,8 V 1,8 V), PLL-0,8 V.
Método de detección: 
1) Cuando no se inserta la línea IO y solo se insertan 12 V: la salida de CC-CC es de aproximadamente 0 V y la salida de impulso es de aproximadamente 0 V. La fuente de alimentación del PIC de 3,3 V debe estar alimentada. Los otros voltajes de prueba son todos 0;
2) Cuando se inserta la línea IO y no se presiona el botón de prueba, no hay salida de voltaje de DC-DC y boost. Después de presionar el botón de prueba, el PIC comienza a funcionar. En este momento, el DC-DC emite el voltaje establecido por el programa de prueba de la plantilla PIC y aumenta a medida que funciona. Luego, la plantilla genera WORK y vuelve a noce después de la computación. En este punto, el voltaje normal de cada punto de prueba debe ser:
CLKO: 0.9V
CO: 1.6-1.8V, cuando la plantilla se acaba de enviar a TRABAJAR, ya que el CO es negativo, el nivel de CC se reducirá y el instantáneo El voltaje es de aproximadamente 1,5 V.
RI: 1.6-1.8V, cuando el voltaje es anormal o demasiado bajo durante la computación, la placa de computación será anormal o el hashrate será cero.
BO: 0V cuando no hay cómputo, habrá un salto de pulso entre 0.1-0.3V durante el cómputo.
NRSTO: 1,8 V. Se vuelve a emitir una señal de reinicio cada vez que se presiona el botón de prueba de la plantilla.
Cuando el estado o el voltaje del punto de prueba mencionado anteriormente es anormal, calcule el punto de falla en función del circuito antes y después del punto de prueba.

Detalles y distinción del archivo de configuración del chip S9K S9SE
format,webp

● Diagrama de etiquetas PCBA
format,webp

● Descripción de la correspondencia del chip
format,webp
format,webp

IV. Pasos de referencia del proceso de mantenimiento de rutina :

format,webp

1. Pruebas de rutina: primero realice una inspección visual de la placa de computadora que se va a reparar para ver si hay desplazamiento, deformación, quema de aletas de enfriamiento pequeñas. Si existe tal fenómeno, primero debe procesarse; si la pequeña aleta de enfriamiento se desplaza, retírela primero y luego limpie el adhesivo negro y luego vuelva a pegar después de la reparación.
En segundo lugar, después de que se confirme que no hay problemas con la inspección visual, la impedancia de cada dominio de voltaje se puede detectar primero para detectar si hay un cortocircuito o un circuito abierto. Si se encuentra, debe manejarse primero.
A continuación, verifique si los voltajes en cada dominio de voltaje alcanzan 1,6 V y la diferencia de voltaje entre los dominios de voltaje no debe exceder los 0,3 V. Si el voltaje en un dominio de voltaje es demasiado alto o demasiado bajo, los circuitos en el dominio de voltaje adyacente generalmente tienen fenómenos anormales y es necesario encontrar la razón primero.
2. Después de confirmar que no hay problema en la prueba de rutina (la detección de cortocircuito es necesaria en la prueba de rutina para evitar quemar el chip u otros materiales debido a un cortocircuito cuando está encendido), se puede usar una caja de prueba para la detección de chip, y los resultados de detección de la caja de prueba se pueden utilizar para juzgar la ubicación.
3. De acuerdo con el resultado de la detección de la caja de prueba, comience cerca del chip defectuoso y detecte el voltaje del punto de prueba del chip (CLK IN OUT/RI IN OUT/CO IN OUT/BO IN OUT/NRST IN OUT ) y LDO 0V8 1V8.
4. De acuerdo con la dirección del flujo de la señal, la señal RI se transmite inversamente (chip U60 a U1), y varias de las señales CLK CO BO NRST se transmiten hacia adelante (U1-U60), y se encuentra un punto de falla anormal a través de la fuente de alimentación. secuencia de suministro.
5. Al ubicar el chip defectuoso, el chip debe volver a soldarse. El método es agregar un fundente alrededor del chip (preferiblemente fundente sin limpieza), calentar las uniones de soldadura de los pines del chip hasta que se disuelvan, mover suavemente hacia arriba y hacia abajo, hacia la izquierda y hacia la derecha, y presionar el chip; promueva que los pines del chip vuelvan a unir la almohadilla de unión, recoja la lata para volver a estañar. Si la falla es la misma después de volver a soldar, el chip se puede reemplazar directamente.
6. Después de la reparación de la placa de cálculo, la caja de prueba debe verificarse más de dos veces. El tiempo de las dos pruebas: por primera vez, después de reemplazar las piezas, la placa de la computadora debe enfriarse; después de pasar la prueba, se deja de lado primero. Por segunda vez, después de que la placa de cómputo se haya enfriado por completo después de unos minutos, se realiza la prueba. Aunque cada una de las dos pruebas dura solo unos minutos, no afecta el trabajo. La placa reparada se deja a un lado y la segunda placa se repara, después de reparar la segunda placa, se coloca y se enfría, luego se prueba la primera placa. De manera, la reparación es escalonada y no hay demora en el tiempo total.
7. Para la placa reparada, primero es necesario clasificar las fallas y registrar el modelo, la ubicación y la causa de la pieza reemplazada, para retroalimentar a producción, posventa, investigación y desarrollo.
8. Después de grabar, instale toda la máquina para un envejecimiento normal.

V. Tipo
de falla Tipos de fallas comunes de la placa de cómputo S9K S9SE:
1. La aleta de enfriamiento se cae, se desplaza y se deforma
La aleta de enfriamiento en la placa PCB en la parte posterior del chip de la placa de cómputo no puede moverse ni colisionar antes del encendido, especialmente la aleta de enfriamiento con diferentes voltajes. El contacto de las aletas de enfriamiento en diferentes dominios de voltaje significa que existe la posibilidad de un cortocircuito en diferentes puntos de voltaje. 
Además, determine que cada una de las aletas de enfriamiento en la placa de computación tenga una buena conducción de calor y esté firmemente fijada.
Cuando reemplace o reinstale la aleta de enfriamiento, limpie el adhesivo residual en la aleta de enfriamiento y el chip y luego cubra nuevamente. El adhesivo termoconductor residual se puede limpiar con alcohol absoluto.
2. Desequilibrio de impedancia en cada dominio de voltaje
Cuando la impedancia de algunos dominios de voltaje se desvía del valor normal, indica que hay circuitos abiertos y cortocircuitos en el dominio de voltaje anormal. Generalmente, el chip es el más probable que lo cause. Pero hay tres chips en cada dominio de voltaje y, a menudo, solo uno tiene problemas cuando ocurre una falla. 
El método para encontrar el chip problemático puede detectar y comparar la impedancia de tierra de los puntos de prueba de cada chip para encontrar el punto anormal.
Si hay un cortocircuito, primero retire la aleta de enfriamiento en el mismo chip de voltaje y luego observe si el estaño del pin del chip está conectado.
Si no se puede encontrar un punto de cortocircuito en la apariencia, busque el punto de cortocircuito de acuerdo con el método de resistencia o el método de corte de corriente.
3. Desequilibrio de voltaje en el dominio de voltaje 
Cuando el voltaje en algunos dominios de voltaje es demasiado alto o demasiado bajo, generalmente hay una señal de E/S anormal en el dominio de voltaje anormal o en el dominio de voltaje adyacente, lo que hace que el siguiente dominio de voltaje funcione de manera anormal y el voltaje esté desequilibrado. El punto anormal se puede encontrar detectando la señal y el voltaje de cada punto de prueba, y algunos necesitan encontrar el punto anormal comparando la impedancia de cada punto de prueba.
Tenga en cuenta que la señal CLK y la señal NRST son las dos que tienen más probabilidades de causar un desequilibrio de voltaje.
4. Falta de fichas
La falta de chips significa que cuando se marca la casilla de prueba, no se detectan todos los 60 chips y, a menudo, no se detectan realmente todos los chips. Los chips anómalos realmente perdidos (no detectados) no están en la posición mostrada. En este momento, es necesario localizar con precisión el chip anómalo mediante pruebas.
El método de localización puede usar el método de corte RI para encontrar la ubicación del chip anormal. Es decir, conecte a tierra la señal RI de un chip, por ejemplo, después de que la salida RI del chip número 50 esté conectada a tierra en el dominio de voltaje, teóricamente, si todos los chips en el frente son normales, el cuadro de prueba debería mostrar que 50 chips son detectado. Si no se detectan los 50 chips, significa que la anomalía está antes del chip 50; si se detectan 50 chips, significa que el chip anormal está después del chip 50. Use esta dicotomía para averiguar dónde se encuentra el chip anormal.
5. Cadena rota
Una cadena rota es similar a la falta de fichas, pero en una cadena rota, no todas las fichas que no se pueden encontrar son anormales, sino que todas las fichas después de la ficha anormal no son válidas debido a una determinada anomalía en la ficha. Por ejemplo, un chip en sí mismo puede funcionar, pero no enviará otra información del chip; en este momento, toda la cadena de señal llegará a un final abrupto y perderá una gran parte de ella, lo que se denomina cadena rota.
Se puede mostrar la información del puerto de la cadena rota. Por ejemplo, cuando la caja de prueba detecta los chips, solo se detectan 30 chips. Si el número de chips preestablecidos no se detecta en el cuadro de prueba, no se ejecutará, por lo que solo mostrará cuántos chips se detectan, en este momento, de acuerdo con el número mostrado "30", el problema se puede encontrar detectando el voltaje y la impedancia de cada punto de prueba antes y después del chip 30.
6. Sin funcionamiento
Sin funcionamiento significa que la caja de prueba no puede detectar la información del chip de la placa de computación, pero no muestra ninguna placa hash; este fenómeno es el más común y el rango de falla involucrado también es amplio.
1) Sin funcionamiento causado por un voltaje anormal en un cierto dominio de voltaje; el problema se puede encontrar midiendo el voltaje en cada dominio de voltaje.
2) Una anomalía en el chip provoca una anomalía que se puede encontrar midiendo la señal de cada punto de prueba.
CLK señal: 0,9 V; la señal sale del chip U1 al chip U60. En la versión actual, solo hay dos osciladores de cristal, Y1 se transmite desde el primer chip al chip 30, y Y2 se transmite desde el chip 31 al chip 60, y la señal CLKO se busca de forma anormal según la dirección de la señal. transmisión.
Señal CO: 1,8 V; esta señal se transmite a través de los chips U1, U2, U60, cuando un cierto punto en el método binario es anormal, se puede detectar hacia adelante.
señal RI: 1,8 V; esta señal se devuelve desde los chips U60,,,,,, U2, U1, confirme la causa de la falla a través de la tendencia de la señal del chip; cuando la placa de computación S9K S9SE no funciona, la señal es la prioridad más alta, primero busque esta señal.
Señal BO: 0V, esta señal se puede bajar a un nivel alto cuando el chip detecta que la señal de retorno RI es normal, de lo contrario, es de nivel alto.
Señal NRST: 1,8 V; después de que se enciende la placa de computación y se inserta la señal IO, la señal se transmite desde U1, U2 y U60 hasta el último chip.
3)LDO 0.8V, 1.8V mantenimiento anormal
El valor normal de la impedancia de tierra de la salida LDO 0.8V IC es 50-100 Ώ, y la impedancia normal de la salida LDO 1.8V IC es 0.9KΏ.
Hay seis placas de computación individuales LDO de 1,8 V y doce LDO de 0,8 V (por ejemplo, la fuente de alimentación del dominio 1 U1-U10 es U61 LDO de 1,8 V, la fuente de alimentación de U1-U5 es de 0,8 V U117 y la fuente de alimentación de U6-U10 es 0,8 V U79), dado que el LDO funciona en serie, el cortocircuito a tierra del LDO se puede reparar utilizando el método de dos quintos. Primero, tome el chip del medio, quítelos uno por uno y encuentre el chip problemático para reemplazarlo;
4)Reparación de Patter NG de placa única
Registro de impresión del puerto serie (información del logotipo), placa de computación de chip único y de chip completo, la tasa de recuperación no debe alcanzar el 98%, si la tasa de respuesta noce es inferior al 98%, informe Patter NG; de acuerdo con el registro de impresión del puerto serie, dé prioridad al reemplazo del chip con la tasa de recuperación de notificación de un solo chip más baja;
5) Toda la máquina J: 4 mantenimiento
1: J: 4 no almacena la posición del chip de detección de temperatura, y necesita probar con la plantilla de prueba una vez, la información de envío de temperatura se escribe en el chip EEPROM IC a través de la plantilla de prueba de placa única ;
2: El archivo de configuración de la plantilla de una sola placa es incorrecto (el chip de la placa de computación, el nivel BIN no coincide con el archivo de configuración de la plantilla), lo que hace que toda la máquina informe J: 4;

VI. Instrucciones de mantenimiento
1. Durante el mantenimiento, el personal de mantenimiento debe estar familiarizado con la función y la dirección del flujo de cada punto de prueba, el valor de voltaje normal y el valor de impedancia a tierra.
2. Debe estar familiarizado con la soldadura de chips, para no causar deformación de espuma de PCB o daños en los pines.
3. Paquete de chips BM1393, 16 pines en ambos lados del chip. La polaridad y las coordenadas deben estar alineadas durante la soldadura y no deben estar desalineadas.
4. Al reemplazar el chip, se debe limpiar el adhesivo de fijación termoconductor alrededor del chip para evitar daños secundarios al chip causados ​​por la suspensión o la mala disipación del calor durante la soldadura IC.

● Nota:
1. Dado que la aleta de enfriamiento en la parte posterior del chip está conectada al chip, se debe usar un cable de prueba delgado especial para detectar la señal del punto de prueba; Aparte del metal expuesto en el extremo de contacto, las otras partes del cable de prueba deben sellarse con un tubo termorretráctil para evitar que el cable de prueba entre en contacto con la aleta de enfriamiento y el punto de prueba al mismo tiempo. En particular, la diferencia de voltaje entre las filas superior e inferior del voltaje del circuito es grande y causará daños al chip cuando entre en contacto con el suelo (aleta de enfriamiento) y los puntos de prueba en diferentes dominios de voltaje, y se debe prestar especial atención.
2. Al soldar, dado que hay pequeñas desmotadoras de enfriamiento cerca de la placa de circuito impreso en la parte posterior del chip, la conducción del calor es rápida. Por lo tanto, es necesario usar la parte inferior para ayudar al calentamiento (alrededor de 200 grados) al soldar, lo que puede mejorar la eficiencia y reducir el daño a la placa PCB. Si no hay un dispositivo de calentamiento inferior, retire la pequeña aleta de enfriamiento de la PCB en la parte posterior del chip antes de reemplazar el chip.

  • Compartir

Reseña