opengnsys-1.0.5 (#10) - Fallos en opengnsys 1.0.5 (#153) - Message List

Fallos en opengnsys 1.0.5
 unsolved

Hola.

Debido a que la versión 1.0.4 no nos funcionaba en los nuevos equipos que instalamos en navidad tuvimos que usar el servidor de pruebas con la versión de opengnsys 1.0.5-beta-r4012 para desplegar todo el software en los equipos nuevos. Hemos encontrado una serie de problemas durante este tiempo, me hubiese gustado avisaros antes de publicar la versión definitiva pero no funcionaba bien el foro y no me dejaba escribir mensajes.

1.- El servidor se bloquea porque el servicio ogAdmServer se pone al 100% de CPU y deja de responder. Lleva sucediendo desde la versión 1.0.3 como un fallo aleatorio, pero con la 1.0.5 ahora nos falla siempre que que se ejecuta el comando apagar o el comando iniciar sesión (de Windows, con reinicio) en varios ordenadores a la vez. El servidor se cuelga al final cuando los ordenadores están terminando de apagarse.

Con un único ordenador no pasa siempre, pero también ha pasado con el servidor de pruebas con dos equipos conectados. No dejó ni rastro en los logs. Las particiones las hacemos siempre con opengnsys y tengo el torrent desactivado en el servidor.

2.- El comando iniciar sesión se ejecuta siempre dos veces: primero cuando lo envías y luego la siguiente vez que se inicia el ordenador con el netboot en modo ogclient.

3.- Al ejecutar el comando reiniciar sobre varios ordenadores se cuelgan la mayoría de ellos sin salir de la pantalla del menú. También se cuelga cuando se hace con un único ordenador.

4.- Cuando ejecuta comandos o procedimientos de la cola de acciones sobre varios equipos a la vez uno los ejecuta bien, normalmente el número uno, y los demás lo ejecutan dos veces, porque no lo marca como finalizado en la cola de acciones después de la primera vez.

También me ha pasado que no ejecuten el procedimiento y lo marquen como ejecutado en la cola de acciones. Aunque esto es mas raro.

Creo que ya conocíais alguno de estos problemas y que alguno ya estará solucionado con la última versión de opengnsys, pero si no es así y os puedo echar una mano con lo que sea para encontrar una solución decídmelo.

  • Message #366

    Hola, muchas gracias por mandarnos la información.

    Has llegado en el mejor momento, estamos terminando de probar la beta de la 1.0.5 para sacar la definitiva lo más breve posible.

    Nos interesaría que quien este probando la nueva versión nos mande los errores que haya encontrado, para sacar la versión lo más depurada posible.

    Me vendría bien saber que cliente de opengnsys estáis usando, con que me digas el kernel ya se puede identificar. La versión 1.0.5 saldrá con un cliente basado en la misma distribución que la 1.0.4., pero algunas revisiones instalaban un cliente basado en distribuciones posteriores que daban problemas, entre otros al apagar o reiniciar el cliente.

    Revisaremos los errores que nos dices, algunos deben estar ya resueltos.

    Hasta ahora

    • Message #368

      Hola.

      Gracias por responder tan rápido.

      Me vendría bien saber que cliente de opengnsys estáis usando, con que me digas el kernel ya se puede identificar. La versión 1.0.5 saldrá con un cliente basado en la misma distribución que la 1.0.4., pero algunas revisiones instalaban un cliente basado en distribuciones posteriores que daban problemas, entre otros al apagar o reiniciar el cliente.

      El kernel de los clientes es el 3.8.0-22 y ahora que lo he mirado mejor la versión de opengnsys es la 1.0.5pre r4080.

      Revisaremos los errores que nos dices, algunos deben estar ya resueltos.

      Hasta ahora

    • Message #374

      Hola otra vez.

      También tenemos una solución para el problema del consumo de CPU cuando varios clientes inician sesión en Windows con reinicio.

      Deben hacerse los siguientes cambios en el servidor de OpenGnsys:

      1. Borrar la línea que contiene "pkill browser" del fichero /opt/opengnsys/client/lib/engine/bin/Boot.lib (en la función ogBoot).
      2. Editar el fichero /opt/opengnsys/client/scripts/reboot y sustituir la última línea, que contiene: "(sleep 5; $BUSYBOX reboot) &", por estas otras:
        sleep 5
        pkill browser
        $BUSYBOX reboot
        

      Esperamos que estos cambios solucionen correctamente el problema, ya que las pruebas que hemos hecho han sido satisfactorias.

  • Message #367

    Hola, Felix. He estado reproduciendo los errores que has comentado:

    1.- El servidor se bloquea porque el servicio ogAdmServer se pone al 100% de CPU y deja de responder (...) con la 1.0.5 ahora nos falla siempre que que se ejecuta el comando apagar o el comando iniciar sesión (de Windows, con reinicio) en varios ordenadores a la vez.

    Para los errores aleatorios se ha incluido en el cron un script que revisa el consumo de CPU y cuando llega al 90% lo reinicia.

    El que el error ocurra siempre al apagar o el comando iniciar sesión (de Windows, con reinicio) se va a mirar con más profundidad.

    He comprobado que sí puede usar el comando "ejecutar script" de la consola y mandarle la orden "poweroff", así no se satura el servidor.

    2.- El comando iniciar sesión se ejecuta siempre dos veces...

    Este es el comportamiento normal de opengnsys para arranque de windows con reboot.

    Al restaurar normalmente los equipos inician en windows una primera vez, chequean el disco y se reinician. Opengnsys está pensado para que se inicie dos veces en windows.

    Si se inicia la sesión no debe volver a arrancar en windows una segunda vez, pero si no lo haces sí.

    Para arrancar windows con reboot se incluyen dos marcas en la partición de windows, al iniciar la sesión se borran estar marcas (ogboot.*). Si no quieres que haya que iniciar la sesión se puede crear en el equipo modelo una tarea de windows que se ejecute antes del inicio se sesión y que borre las marcas.

    3.- Al ejecutar el comando reiniciar sobre varios ordenadores se cuelgan la mayoría de ellos sin salir de la pantalla del menú.

    Resuelto con el kernel 3.2 (no en los superiores)

    4.- Cuando ejecuta comandos o procedimientos de la cola de acciones sobre varios equipos a la vez uno los ejecuta bien, normalmente el número uno, y los demás lo ejecutan dos veces, porque no lo marca como finalizado en la cola de acciones después de la primera vez.

    Corregido, creo que en la 1.0.4a.

    • Message #376

      Hola.

      Hola, Felix. He estado reproduciendo los errores que has comentado:

      2.- El comando iniciar sesión se ejecuta siempre dos veces...

      Este es el comportamiento normal de opengnsys para arranque de windows con reboot.

      Al restaurar normalmente los equipos inician en windows una primera vez, chequean el disco y se reinician. Opengnsys está pensado para que se inicie dos veces en windows. Si se inicia la sesión no debe volver a arrancar en windows una segunda vez, pero si no lo haces sí.

      Para arrancar windows con reboot se incluyen dos marcas en la partición de windows, al iniciar la sesión se borran estar marcas (ogboot.*). Si no quieres que haya que iniciar la sesión se puede crear en el equipo modelo una tarea de windows que se ejecute antes del inicio se sesión y que borre las marcas.

      It's not a bug, it's a feature. :)

      Ahora que ya tengo claro como funciona si me crea problemas ya le creare una tarea o algo parecido.

      4.- Cuando ejecuta comandos o procedimientos de la cola de acciones sobre varios equipos a la vez uno los ejecuta bien, normalmente el número uno, y los demás lo ejecutan dos veces, porque no lo marca como finalizado en la cola de acciones después de la primera vez.

      Corregido, creo que en la 1.0.4a.

      Este problema se da en la 1.0.4a, en la 1.0.5 sólo deja sin marcar algunos ordenadores, no todos menos uno. Ahora que parece solucionado el problema 1 usaré más los procedimientos en la 1.0.5 y ya os comentaré como van.

  • Message #373

    Buenas. Hemos encontrado un parche que parece que soluciona el problema del punto 1, cuando el servidor consume 100% CPU al apagar varios equipos.

    Para ello, hay que editar en el servidor OpenGnSys el fichero /opt/opengnsys/client/scripts/poweroff y sustituir las líneas:

    pkill browser
    # Retardo en 2º plano para dar lugar al registro en cola de acciones.
    (sleep 5; $BUSYBOX poweroff) &
    

    Por estas otras:

    # Retardo para dar lugar al registro en cola de acciones.
    sleep 5
    # Parar Browser para evitar "cuelgues".
    pkill browser
    # Apagar.
    $BUSYBOX poweroff
    
    • Message #375

      Hola.

      He hecho unas pruebas en un aula y después de los cambios ya no se pone la CPU al 100% ni iniciando sesión ni apagando los ordenadores. Si vuelve a aparecer el problema os aviso con los detalles.

      Gracias por todo.

Attachments

No attachments created.