La panne informatique d’Orly liée à un serveur tournant sous Windows NT 3.1

F. LETUVEE
Par F. LETUVEE novembre 12, 2015 22:00

La panne informatique d’Orly liée à un serveur tournant sous Windows NT 3.1


Rien à voir avec l’annonce type “buzz” sur la toile des sites dit “spécialistes de l’informatique” et reprise par tous les médias sans avoir le moindre recul et vérification qui s’impose, le plantage du système Météo à l’aéroport d’Orly (DECOR) est un peu plus complexe qu’il n’y parait, mais s’explique…

PRODPIC-12536Le trafic aérien avait été interrompu au départ et à l’arrivée d’Orly, pendant plus d’une demi-heure le 7 novembre dernier. 

Tout d’abord ce n’est pas un “Windows 3.1 “(système d’exploitation 16 bit de Microsoft) qui est à l’origine du crash mais bien du serveur principal qui sert d’interface entre les équipements de télémesure et le reste du système informatique. Quand on dit “serveur”, on parle bien de matériel “physique” qui effectivement tourne encore sous Windows mais sur la version NT Advanced Server du système d’exploitation de Microsoft. Il faut dire en effet que la version serveur 32 bit de Bill Gate est vieille puisque cet OS est né en 1993. Cela ne veut pas dire pour autant que la situation est ridicule où comme j’ai pu le lire sur des sites d’infos spécialisés, “totalement inacceptable“.

Petite explication :

  1. – Le serveur incriminé est “tombé” pour une raison encore inconnue, il faut l’avouer, mais mon expérience en la matière impose logiquement de penser que ce n’est vraisemblablement pas le système d’exploitation qui a “planté” mais le matériel physique (contrôleur RAID, Carte mère, carte interface etc..) Le système d’exploitation NT 3.1 est (je dis “est” parce qu’il est toujours celui qui tourne actuellement..) la version SERVEUR de Microsoft, rien à voir avec la version “grand public” du Windows 3.1x.
  2. La raison qu’en 2015 ce “vieux” système est toujours utilisé (pour Orly ) s’explique essentiellement par l’utilisation de cartes d’interfaces de type PCI-X d’une part et des pilotes système (drivers) d’autre-part. La migration vers du matériel plus récent est complexe, couteux et pas forcément garant de fiabilité. Un “vieux” système mérite d’être parfaitement maitrisé par les équipes de maintenance. De plus, ce type d’utilisation n’est pas sensible puisque que le système n’est pas connecté sur le réseau “public”, les mises à jour n’ayant aucun intérêt dans son domaine d’application. Enfin, dans le cadre de cette utilisation, ce type de matériel n’est pas énormément sollicité, l’ensemble des besoins en calcul et/ou charge était dans les années 90 très souvent dédiés via des processeurs intégrés aux cartes d’interfaces de communication qui étaient de ce fait, très couteuses mais d’une robustesse incroyable.
  3. EMULEX FC1020034 FIBER/FIBRE CHANNEL PCI-X

    EMULEX FC1020034 FIBER/FIBRE CHANNEL PCI-X

    On ne change pas par conséquent un système stable, fonctionnel, maitrisé comme on change son pc de bureau ou son smartphone… Les différentes versions de windows NT depuis la 3.1 (puis 3.5, version 4 etc..) étaient particulièrement robustes, rien d’anormal d’avoir des machines encore fonctionnelles de nos jours, après 22 ans de bons et loyaux services.

  4. A ce jour, le système incriminé à Orly est de nouveau opérationnel et tourne de nouveau sous Windows NT 3.1. J’imagine cependant les quelques sueurs froides qu’ont dû se faire les techniciens. La grande difficulté étant probablement de “trouver” la ou les pièces détachées compatibles. Un Upgrade (mise à jour matériel et logiciel) est prévu pour 2017 à en croire le communiqué officiel le ministère des Transports. Upgrade qui va prendre du temps mais qui va également perturber durant de long mois l’ensemble des services informatiques. On sait très bien que modernité ne veux pas nécessairement dire “infaillibilité“.. au contraire..

Pour récapituler, rien ne permet de dire que la situation est catastrophique à Orly, encore moins que les personnels sont “incompétents” ou “inconscients” comme j’ai pu le lire sur de nombreux médias. De nombreux systèmes “tournent” encore avec du matériel des années 80/90 sur des “vieux” systèmes, sous Windows, sous Novell, sous Unix et Irix, bref, du matériel “obsolète” certes mais qui donne encore ce qu’il a de meilleur et surtout qui fonctionne parfaitement dans le domaine d’application qu’on lui a attribué. Bien entendu, les systèmes sont aussi mis à jour sur le temps, quand les moyens le permettent, quand les outils et systèmes évoluent et surtout lorsque la performance est le cœur d’une organisation ou d’un besoin spécifique et que cela est indispensable.

A ce titre, j’ai moi même encore deux clients qui “tournent” sous du Windows NT4 dans un domaine particulier (automate d’élevage) et remplacer le système par un “plus moderne” rendrait immédiatement les installations inutilisables. Aucun intérêt puisque le matériel moderne ne permettrait qu’un gain de production de 10 % et un réinvestissement de plusieurs centaine de milliers d’euros…

 Illustration article : Serveur Compaq Pentium II ProLiant 3000 (Année 1995)

Commenter l'article avec votre compte Facebook

F. LETUVEE
Par F. LETUVEE novembre 12, 2015 22:00
Écrire un commentaire

9 Commentaires

  1. Brem novembre 13, 03:05

    Un grand n’importe quoi pour votre argumentaire.
    Comment peut on confier à un matériel (et logiciel) complètement obsolète une mission aussi critique que celle ci ?
    1/ Il y a très peu de chances que ce système soit en cluster, vu son âge
    2/ il est aussi probable de pouvoir retrouver des trésors de l’Égypte ancienne que de pièces de rechange pour ce serveur.
    3/ sans parler des ‘compétences’ qu’il faut garder pour cela.

    À mon avis, l’approche ça marche pourquoi changer est incompatible avec le côté critique de la mission confiée à ce serveur.
    Slts

  2. ludwig novembre 13, 03:35

    et le patron qui a fait des économies
    de bout de chandelle ne sera pas vire
    par contre le manœuvre qui est en retard lui doit reste chez lui ca c’est le medef

  3. Alberic novembre 13, 04:11

    Que le matériel est ancien n est pas un problème en sois. Ce qui est un problème en sois c est d’avoir du personnel compétent rapidement et surtout que ce matériel critique ne soit pas dupliquer. Si il y a a côté un autre windows 3.1 testé régulièrement et opérationnel avec quelqu un de compétent en moins d une heure le pb est résolu.

  4. Guy novembre 13, 04:25

    En tant qu’informaticien retraité depuis 2011 cet article m’a redonné une seconde jeunesse ! Effectivement, j’ai beaucoup travaillé dans cet environnement avec un serveur de paie en NT 3.1 sur un serveur COMPAQ. Néanmoins lors du déploiement des procédures Sarbanne Oxley, il s’est retrouvé en rouge dans la partie Risk Analysis et il a été décidé de répliquer sur un second serveur pour être en mesure de redémarrer instantanément en cas de crash. pourquoi cette option n’a elle pas été mise en oeuvre ?

  5. ChiroKuro novembre 13, 06:16

    Excellent article, merci pour toutes ces précisions qui changent du sensationnalisme à tout prix et de la recherche de la news à clic qui polluent les autres médias…

  6. F. LETUVEE Auteur novembre 13, 07:21

    @ Brem: Après 30 ans d’expérience dans ce domaine, je me permet de vous dire que le n’importe quoi c’est votre aplomb. technicien et superviseur d’un data center pour SITA (Société internationale de Télécommunication Aéronautique) durant des années, je sais de quoi je parle.. je confirme et signe mon argumentaire.

  7. F. LETUVEE Auteur novembre 13, 07:36

    @Guy : Bonne question. De nombreuses raisons peuvent expliquer le plantage qui a été tout de même réparé rapidement. Vous le savez bien, il est parfois extrêmement complexe de vouloir changer un systèeme lorsque celui-ci est “une version maison” améliorée comme on a tous eu a faire dans les années 80/90.. tout ne tombait pas du ciel et il fallait parfois beaucoup d’imagination pour faire fonctionner certaines installations.

  8. Sylvain novembre 13, 09:04

    Bonjour à tous. Je ne peux qu’approuver ! Oui on peut toujours arguer que “toutes les mesures n’ont pas été prises” pour pallier une panne, mais il est peut-être prévu que ce service soit réparé en 12 heures et que tout ce soit déroulé “comme le plan”. La course a l’armement se justifie rarement et je constate chaque jour que je ne vois quasiment jamais les effets de la loi de Moore, sauf à OS et applications identiques (et encore). Bref, pourquoi dépenser des sommes folles pour se faire plaisir alors qu’un AS400 (ce que nous avons dans mon entreprise) est parfaitement à même de gérer 80 % de l’activité d’une entreprise industrielle ? Certes il faut s’assurer que l’on est toujours capable de réparer et lorsque que le risque devient trop cher / important, alors on remplace.

  9. dany novembre 13, 11:53

    pas mal ce papier qui explique assez bien le sujet. on comprend qu’il y a un fossé entre la génération “technologique” et ceux qui ont fait cette génération. Cette personne doit avoir un vécu particulièrement intéressent pour avoir ce recul technique. bravo monsieur

Voir les commentaires

Écrire un commentaire

Laisser un commentaire