mag'
25
Grand angle
Qui est touché par cette révolution?
Cette révolution est d’autant plus importante qu’elle
touche tous les domaines – le marketing, l’assurance, la
génomique, les sciences humaines… – puisqu’elle
change notre manière de voir, de réfléchir, d’aborder les
questions. C’est ce qui explique que tout le monde se
sent propriétaire des
Big Data
. Pour un commercial,
elles ont bouleversé le marketing ; pour une informati-
cienne, l’informatique ; idem pour une biologiste ou un
documentaliste… Et, ils ont tous un peu raison ! Que ce
soit dans les domaines de la santé publique ou de la
génomique, du stockage ou de la sécurité informatique,
du calcul haute performance ou des statistiques… les
mégadonnées ont révolutionné notre domaine d’exper-
tise, développé de nouveaux métiers, nécessité des for-
mations spécifiques…
Cette révolution ne fait que débuter. Nous sommes en
effet loin d’être en fin de cycle, et le monde de demain
sera extrêmement différent de celui d’aujourd’hui.
Parallèlement au développement soutenu des
embauches pour les fonctions les plus qualifiées de
Data
Architect
ou de
Data Scientist
comme les moins quali-
fiées, notamment pour le stockage ou le nettoyage des
données, on assiste déjà à une transformation perma-
nente des métiers. À terme, ils seront certainement tous
touchés par l’exploitation des données numériques,
même si certains le seront nécessairement plus que
d’autres. Ce qui pose d’ailleurs un réel problème en
matière de formation : les métiers se transformant au
fur et à mesure, avec des cycles beaucoup plus rapides
que ceux liés à la formation initiale, il est indispensable
que la formation continue puisse prendre le relais.
Les mégadonnées ont-elles aussi révolutionné notre
manière de faire de la science?
Depuis Karl Popper, la recherche s’inscrivait principale-
ment dans une démarche hypothético-déductive : le
chercheur formule une hypothèse qu’il expérimente afin
de l’infirmer ou de la confirmer. À partir de ce résultat, il
pose de nouvelles hypothèses et ainsi de suite. Au
contraire, avec les mégadonnées, nous sommes plutôt
dans une démarche empirique. C’est une façon totale-
ment différente de faire de la science qui a pour corol-
laire négatif que nous ne savons pas toujours ce que
nous faisons. Mais il y a aussi des aspects très positifs
puisque les
Big Data
permettent d’avancer sur des ques-
tions que nous ne pouvions pas aborder avant. Si l’on
prend l’exemple de la génomique, fouiller à la volée dans
des données pour évaluer les risques de développer un
cancer, est peut être suffisant dans un premier temps.
En tout cas avant que l’on ne puisse expliquer pourquoi
certaines personnes sont résistantes à telles pathologies
et d’autres non.
Les
Big Data
peuvent aussi nous permettre de gagner
du temps dans le recueil des données pour se concentrer
sur l’analyse et la réflexion. Pour un collègue historien
qui travaillait sur la grippe espagnole dans la presse
française, quelques heures ont été suffisantes pour
extraire les données des journaux contre plusieurs mois
s’il avait dû les lire. Je ne prétends pas que le résultat est
meilleur, mais il est évident que l’opération est beaucoup
plus rapide et que cela permet de se concentrer sur
l’analyse des données et non plus sur leur recueil.
Et dans votre propre approche des statistiques?
Personnellement, l’arrivée des
Big Data
a modifié deux
aspects de mon travail. J’ai commencé à faire des statis-
tiques à une époque où la recherche française était sur-
tout théorique, avec peu de ressources logicielles. Au
contraire, aujourd’hui, les recherches en statistiques
sont fortement dirigées vers des questions applicatives.
Ce changement de paradigme à générer énormément de
nouvelles questions structurelles et sociétales si bien
que désormais, lorsqu’on développe des méthodes sta-
tistiques ou qu’on en étudie les propriétés mathéma-
tiques, la dimension applicative est très marquée.
Les mégadonnées seraient donc le nouvel eldorado
de l’innovation?
Oui et non. Structurellement, de nombreuses entre-
prises se dotent aujourd’hui d’une direction « innovation
et
Big Data
» car pour beaucoup d’entre elles les méga-
données représentent un important vecteur d’innova-
tion. Depuis des années, elles ont en effet recueilli une
multitude de données, qui ne sont pas nécessairement
structurées puisqu’on y trouve aussi bien des variables
numériques que des images ou des sons. Stockées dans
des
Data Laks,
sous forme de donnée brute, elles per-
mettent de travailler sur de très gros jeux de données,
souvent en temps réel.
Mais, si cela représente effectivement un vecteur d’inno-
vation, il n’est pas exclusif. La fin annoncée du pétrole,
par exemple, entraînera elle aussi de nombreux boule-
versements qui transformeront radicalement notre
société. C’est déjà le cas, et cela touche directement
notre quotidien. Depuis quelques mois, les «pochons»
en plastique ont ainsi été remplacés par des sacs biodé-
gradables en amidon de maïs ou de pomme de terre,
matière première renouvelable qui offre une solution
durable à la raréfaction des combustibles fossiles. De
même, demain, nous arrêterons probablement d’impor-
ter des tee-shirts de Chine car le coût du transport sera
devenu prohibitif. Il sera alors nécessaire d’innover pour
combler ce vide.
Propos recueillis par Yvan Boude