BIG BROTHER, Où es tu ? Que fais tu ?
Le Data mining et la statistique décisionnelle.
Cette discipline est en plein essor dans le monde de la recherche et de l'entreprise. A son insu le plus souvent , l'homme du début du XXI siècle baigne et produit un flot d'informations statistiques continues et exponentielles ( résultat économiques, sondages, prévisions sur le climat, la population, les ressources, etc...) dont il voit que l'écume sans en soupçonner les lames de fond.
Le datamining est né de la nécessité de valoriser les immenses bases de données d'entreprise (datawarehouse) et conduit à analyser et prévoir les comportements individuels des consommateurs. Cet aspect nous concerne en tant que citoyens car les risques d'abus sont de plus en plus possible malgré la Loi relative à l'Informatique et Liberté.
Comme dans d'autre domaines, telle l'industrie pharmaceutique (mise au point de nouveaux médicaments) , elle utilisée actuellement en ingénierie bancaire , dans les grandes distributions et les grandes institutions financières.
Le data mining permet de trouver des associations inédites entre les données , des corrélations cachées dans la masse d'informations enregistrées. Les techniques mathématiques utilisées sont l'analyse factorielle, la régression linéaire, l'analyse discriminante de Fisher, la régression logistique, les arbres de décision, la classification automatique hiérarchiques ou par partitionnement. Des méthodes plus récentes dite d'intelligence artificielles sont évoquées comme les réseaux de neurones, les séparateurs à vaste marge (support vector machines), les algorithmes génétiques, le boosting et arcing, la classification de données qualitatives par agrégation des similarités etc....
Le data mining, naguère confins dans les études de laboratoire, les expérimentations cliniques, l'actuariat et certaines analyses de risque, envahissent aujourd'hui de nombreux domaines, qui vont de l'infiniment petit (génomique) à l'infiniment grand (astrophysique), du plus quotidien (gestion de la relation client) au moins quotidien (aide au pilotage aéronautique), du plus ouvert (e-commerce) au plus sécuritaire (procédures relevant du top secret), du plus industriel (contrôle qualité, pilotage de la production) au plus théorique (enquêtes sociologiques, études biologiques etc..). A cette simple énumération, on devine que le spectre des applications du data mining et de la statistique est très large.
Les plus concernés sont les secteurs où d'importants volumes de données doivent être analysés, parfois en vue de prendre des décisions rapides. L'aide à la décision devient une finalité du data mining, dont on attend plus seulement qu'ils aident à comprendre le réel en le modélisant mais aussi de limiter la subjectivité humaine dans les processus de décision et aussi, grâce à la puissance grandissante des outils informatiques, de traiter de plus en plus rapidement un grand nombre de dossiers.
Non seulement le data mining permet de trouver des corrélations inattendues dans le flot d'informations passé et présent mais aussi capable de produire certaines prévisions pour le futur pour ne pas dire des prédictions sous certaines conditions.
Les techniques de réseaux neuronaux et les algorithmes génétiques nécessitent de grosses capacités de calcul des superordinateurs (calculs massivement parallèles) mais il est sûr que dans les années qui viennent ces concepts deviendront plus efficaces à cause de la puissance grandissante de ces machines (on parle de traitement en petaoctet (10^12 octets) et vraisemblablement en exaoctet 10^16 octets à la fin de la décennie) et surtout grâce à l'affinement plus pertinent des modèles des réseaux neuronaux d'une part et de l'échantillonnage plus efficace des populations , de l'ampleur et de la fréquence des mutations dans les algorithmes génétiques d'autre part.
Certes, les bienfaits du data mining notamment concernant le domaine des sciences de la vie sont innombrables mais où se situe la place de la l'Homme face à ces institutions commerciales et étatiques qui hébergent quantité d'informations sur notre vie quotidienne ?
N'est on pas en train déjà de perdre une certaine liberté de l'anonymat de notre vie privée ?
N'est on pas à la merci d'un abus de pouvoir d'information et décisionnel ?
L'Histoire récente nous montre que ces outils du "troisième type" peuvent se révéler fatals pour une partie de l'humanité.Les démocraties ne sont pas à l'abri d'un retour d'un totalitarisme d'un type nouveau. N'oublions pas les leçons du Stalinisme en Union Soviétique ou du retour du facisme en Allemagne dans les années trentes.
Le pouvoir ne se réduit plus désormais à l'argent mais aussi à la force de frappe d'outils décisionnels et de captage d'informations diverses.
Commenter cet article