+
-

Gestion des données

Big Data : où en sont les banques ?

Le 25/03/2019

Le salon Big Data, organisé les 11 et 12 mars à Paris, a permis de faire le point sur l’état de l’art, notamment dans le secteur bancaire. En matière de traitement des données massifiées, une étape charnière a été franchie au niveau mondial avec l’adoption de l’intelligence artificielle appliquée à l’expérience client numérique ainsi qu’aux processus internes de base. En France, selon Elias Baltassis, directeur au BCG, le secteur banques-assurances est globalement le premier en termes de maturité, mais « il accuse un retard en analytique et en intelligence artificielle – qui n’ont pas encore atteint la création de valeur anticipée –, ainsi qu’en matière de gouvernance des données ». En effet, indique Jean-Louis Missika, adjoint à La Maire de Paris en ouverture du congrès : « La transparence des algorithmes doit être posée ; il n’y aura pas de Big Data dans la durée si cette confiance est remise en cause. » Un sujet primordial pour les banques soucieuses de sécuriser leurs données sensibles…

Les banques sont très innovantes en matière de technologie. En France, BNP et Société Générale, par exemple, ont ainsi été les premières à mettre en place des plateformes Big Data telles que Hadoop avec des extensions comme des bases de données Non-SQL, des moteurs de recherche, etc. Pour Mohamed Mahdi Benaïssa, Big Data et Cloud Solutions Architect chez Umanis, outre le stockage et le traitement, « ces solutions sont consommatrices de data science (machine learning, deep learning) car de nombreux cas d’usage nécessitent des manipulations avancées des données avec des modèles statistiques ». Il faut distinguer les cas d’usage « BI » (business intelligence), qui permettent de remonter ou de présenter des indicateurs tels que des catégories de dépenses pour améliorer la gestion budgétaire des clients, des cas d’usage data science adressant des problématiques de segmentation clientèle et d’ultra-personnalisation, de détection instantanée de blanchiment ou de fraude, d’identification des clients susceptibles de rembourser leur prêt de façon anticipée.

Avec l’open banking, les banques ont ouvert leur système d’information à différentes sources de données (mobile, capteurs, réseaux sociaux…) et doivent utiliser le Big Data pour la gouvernance et la sécurité, afin de savoir précisément d’où vient la donnée et pour quel cas d’usage elle doit être utilisée.

Autre tendance, plus récente : l’utilisation du cloud (informatique hébergée). « De nombreuses technologies étant requises, une seule plate-forme ne peut pas répondre à tous les besoins ; il faut en permanence lui ajouter de nouveaux outils nécessitant des infrastructures dédiées, comme des serveurs qu’il faut acheter, configurer, installer, sécuriser. C’est très coûteux et lourd à mettre en place », poursuit Mohamed Mahdi BenaÏssa. Le cloud offre cette souplesse. Pour leurs données sensibles, les banques préfèrent utiliser un cloud privé ou leurs propres data center (on premise).

La plupart des banques ont mis en place des entrepôts de données (data lake) historiquement hébergés dans Hadoop. Ce framework logiciel ne permet pas le traitement en temps réel et doit donc être étendu avec des bases de données réactives. Cet ensemble de plates-formes de données hétérogènes et présentes dans différents endroits (sur le cloud ou on premise dans un data center) peut contenir jusqu’à une centaine d’outils différents, aussi « est-il très difficile de trouver des personnes capables de tous les maîtriser, à la fois d’un point de vue technique, organisationnel et stratégique », prévient Mohamed Mahdi Benaïssa. Le défi consiste à trouver un mode de fonctionnement adapté. Certaines banques ont créé des entités dans lesquelles des experts techniques travaillent sur les projets, comme le ferait une société de conseil, mais, insiste-t-il, « l’appel à des prestataires externes reste incontournable en raison du dynamisme de l’écosystème ». D’autres, comme Crédit Agricole Technologies & Services, optent pour la co-construction avec des équipes décentralisées en embarquant des développeurs de la banque au sein d’Octo (Accenture) pour les faire participer à la réalisation des chantiers.

Séminaires