Herramientas Personales
Usted está aquí: Inicio intranet POA 2008 2do Trimestre Mantenimiento de Servidores y Servicios

Mantenimiento de Servidores y Servicios

Todas las entradas en la bitácora que tengan que ver con el mantenimiento preventivo o correctivo a servidores o servicios

Mantenimiento de Servidores y Servicios

RedUC, Junio 2008

 

 

Introducción

A continuación se hace un listado de las actividades pertinentes al mantenimiento preventivo y correctivo de los servidores de la Unidad, así como el mantenimiento y cambios en la configuración de los servicios en la misma.

 

Atención al BladeCenter H

 

Durante su corta vida en la unidad, el blade center h presentó en el segundo trimestre las siguientes fallas

  • Falla en la unidad de DVD atendida por personal de IBM.
  • Nueva falla de la unidad de DVD atendida por el personal de RedUC. La unidad fue extraída para ser reemplazada.
  • Desconfiguración de uno de los switches cisco. Sus puertos ethernet de deshabilitaron durante la extracción de la unidad de DVD.

 

Falla en el modulo de switch ethernet

El miércoles 16/04 a las 9:30 de la mañana una falla interrumpió temporalmente la conexión a los blades. Al acceder al modulo de manejo se descubrió que el modulo de switch ethernet principal no estaba siendo reconocido por el blade center. Se procedió a sacarlo y reintroducirlo con lo que el problema se solucionó.

Esta es la segunda falla que ocurre en este componente.

NOTA: Al investigar las causas se descubrió que el modulo de manejo principal había sido reemplazado por el modulo secundario el día 14/04. Este hecho no tiene relación alguna con el problema antes descrito.


Inicio de cambio del nombre thor.uc.edu.ve a la direccion 150.186.32.9

Como se evidenció en el último fallo en el servidor thor, el servicio de nombres y correos no deben estar acoplados en la misma dirección IP. Si un servicio falla, este no puede ser sustituido por un servicio en otro equipo (al menos no sin usar NAT a nivel del enrutador de red). Por esta razón, cada servicio debe tener su dirección IP independiente.

De esta forma se decidió cambiar el nombre thor.uc.edu.ve de la dirección IP 150.186.32.2 a la dirección 150.186.32.9. Este es el único cambio a efecutarse. El servicio seguirá corriendo en el mismo equipo, concurrentemente con el DNS.

A efectos del cambio de dirección IP se efecutarón los siguientes cambios:

  • Registro de los nombres smtp.uc.edu.ve, pop.uc.edu.ve e imap.uc.edu.ve a la dirección 150.186.32.9
  • Configuración del postfix para escuchar en ambas interfaces.
  • Configuración del courier imap para escuchar en todas las interfaces del servidor.
  • Configuración del firewall del servidor para permitir SMTP, IMAP, IMAPS, POP3 y POP3S a la nueva dirección.
  • Configuración del firewall de la universidad para permitir acceso remoto a SMTP, IMAPS y POP3S.
  • Revisión de los servicios en los demás servidores para asegurarse que cualquier acceso necesario a los restantes servicios en el equipo 150.186.32.2 se haga por medio de dirección IP y no a traves del nombre.
  • Configuración en el DNS para que el nombre thor.uc.edu.ve resuelva a 150.186.32.2 hasta el martes 22/04 a las 9:00am. A partir de esa hora resolverá a la dirección 150.186.32.9.
  • Falta aún por actualizar el certificado usado por el servidor de correos a su nueva dirección.

Dañado disco duro /dev/sdb en Thor

El día 22/04 se detecto que el disco duro /dev/sdb en el servidor Thor presentaba repetidas fallas de I/O; y después de reiniciar el sistema dicho disco dejo de funcionar.

 

Se procedio a recuperar la data que este disco mantenia que para este caso correspondia a los homedirectory de las cuentas clasificadas como varios (dependencia, empleados y otros).  A fin de causar el menor impacto posible al usuario y considerando la hora de la falla se decidio no reemplazar por ahora fisicamente el disco, en tal sentido se procedio a crear un directorio /varios en uno de los discos con mayor disponibilidad de espacio. Una vez creado este nuevo directorio se procedio a crear un enlace simbólico para satisfacer las necesidades del filesystem, seguido se restaurarón los datos del backup tomado la noche anterior.

Fallas multiples en los discos duros de Odin

El disco duro de odin sda, que contiene el respaldo de los profesores dejó de funcionar el 22/04 con el siguiente mensaje:

mount: wrong fs type, bad option, bad superblock on /dev/sda1,
       or too many mounted file systems

Adicionalmente a la falla del disco sdd, que contiene la mitad de la información de los estudiantes.

Ahora, el disco sdc, que contiene la información restante de los estudiantes presenta un comportamiento anómalo:

#cd /homes/estudiante0/ingenieria/electrica
# ls

funciona, pero

#ls /homes/estudiante0/ingenieria/electrica

no responde, dejando el terminal bloqueado hasta presionar BREAK.

 

Problemas en correo al cambiar de nombre

El domingo 27/04, a las 8:00 am el correo dejó de funcionar. La causa se explica a continuación:

Se activó antes de tiempo el cambio de dirección IP de thor de 150.186.32.2 a 150.186.32.9. Esto de por si, no fué la causa del problema. Todos los servicios de correo en thor estan preparados para atender ambas direcciones IP. Se había configurado el firewall en thor para permitir conexiones a la segunda dirección. Sin embargo, las reglas no se habían guardado. Dado que thor fue reiniciado el jueves para sacar un disco duro, dichos puertos se cerraron.

Durante el trabajo de corrección del problema en la mañana del día domingo, un error de mi parte dejó el firewall parcialmente abajo, bloqueando no solo el acceso a los puertos relacionados al correo, sino el acceso al ssh, con lo cual ulteriores intentos de corrección tuvieron que esperar a estar frente del equipo.

 

Falla en el servidor radius

Ayer los usuarios reportaron problemas en la conectividad inalámbrica.

El servidor radius estaba arriba, trabajando a la perfección. El servicio LDAP funcionaba, la autenticación estaba bien. Una revisión en los archivos de configuración mostraba que todo estaba como debía.

Se determinó que la causa era la expiración del certificado usado por el servidor. Se procedió a renovarlo (estará vigente por diez mil dias, por lo que este problema no se presentará hasta el 2036).


 

Actualizados nombres pgsql.uc.edu.ve y mysql.uc.edu.ve

 

Para dar soporte al uso de las bases de datos instaladas en el Cluster se procedio a actulizar las entradas en el DNS correspondiente a pgsql.uc.edu.ve y mysql.uc.edu.ve. Los nombres quedaron relacionados de la siguiente manera:

=mysql.uc.edu.ve:150.186.32.22:36000
=pgsql.uc.edu.ve:150.186.32.21:36000

Falla en thor

 

El día 20/05 a las 11:30am se presentó una falla en thor. No había autenticación, comandos como netstat y ls se negaban a funcionar devolviendo resultados vacíos, login no respondía. Se reseteó el equipo tras lo cual el servidor ldap se negó a arrancar por el script de inicio. Otros servicos tardaban excesivamente en levartar para que, una vez completada la inicialización terminara en el mismo estado antes descrito.

Se procedió a levantar el equipo en modo single. Posteriormente se levantaron a mano cada servicio. Los servicios infractores (como ldap) no fueron levantados por los scripts init, sino invocando directamente a los binarios.


Acciones de Documento
« Enero 2009 »
Enero
LuMaMiJuViDo
1234
567891011
12131415161718
19202122232425
262728293031