Diaspora, Smartphone et Intelligence Artificielle

Estimer la presence de l’informel : l’intelligence artificielle

Comme expliqué dans I., la troisième difficulté réside dans la difficulté à estimer le nombre d’acteurs intervenant dans les différents secteurs. En effet, le secteur informel se caractérise, tout comme les transactions, par un important nombre d’acteurs de taille modeste. Les dénombrer précisément serait particulièrement fastidieux car il faudrait faire une analyse détaillée par quartier.

Notre recette secrète : l’intelligence artificielle

Idee generale

Pour comprendre le raisonnement que nous avons utilisé pour estimer le nombre de boutiques dans l’ensemble de la ville de Douala, partons d’une remarque très simple. Faites l’expérience, si vous avez l’habitude de vivre à Douala ou dans une ville similaire, peu importe l’endroit ou vous vous trouvez, vous êtes capable sentir ce qui peut se trouver autour : un call-box, un point de recharge Orange Money, une pharmacie, une boutique. 

Cela s’explique par le fait que vous avez inconsciemment développé un algorithme qui associe à un environnement donné un ensemble de caractéristiques plus ou moins probables comme la présence d’un commerce de tel ou tel type. En fait, la présence d’un petit commerce à l’exemple d’une boutique est (presque) totalement déterminé par la composition du voisinage : habitations, grand carrefour, routes secondaires etc. 

Notre idée est simplement d’apprendre à un ordinateur cet algorithme inconscient et d’extrapoler ce raisonnement sur l’ensemble de la ville de Douala.

L'intelligence artificielle

Introduction

Il existe beaucoup de fantasmes autour de l’intelligence artificielle. En réalité, en comprenant comment fonctionne une intelligence artificielle, on est tout de suite beaucoup plus serein face à ce terme. En réalité, l’intelligence artificielle consiste a “apprendre” a une machine de réaliser des tâches maîtrisées par l’homme… La partie importante de la phrase précédente est évidemment “maîtrisées par l’homme’, car il faut bien comprendre que l’ordinateur ne peut apprendre que ce que l’homme a déjà maîtrise.

En effet, la base de départ de tout algorithme d’intelligence artificielle est de lui fournir un nombre relativement important d’exemples déjà résolus par l’homme. Pour apprendre à une intelligence artificielle à reconnaître des visages sur des photos, on a d’abord  demandé à des humains de reconnaître des visages sur des photos et de les entourer par exemple. Ensuite, on a fourni à cette “intelligence” ces “exercices corrigés ” en lui disant “entraîne-toi à faire ca”. On lui donne pour cela un certain de techniques d’apprentissage et l’ordinateur finit par trouver une méthode relativement sûre pour déterminer si une photo contient des visages.

La recette de l’intelligence artificielle commence donc par une bonne dose…d’intelligence humaine pour “initialiser” le modèle. Mais une fois le modèle initialisé et la méthode trouvée, l’intelligence artificielle s’avère redoutable pour traiter rapidement et continûment un nombre important de cas…

Intelligence artificielle, boutiques et...images satellites

Si vous avez bien suivi, il s’agit pour nous désormais d’apprendre à l’ordinateur à déterminer le nombre de boutiques dans un voisinage donné. Nous avons l’idée d’utiliser les images satellites de Douala comme base de référence ! Ces images sont disponibles gratuitement sur Google Maps. En effet, sur la base d’une image satellite, il est possible d’identifier la configuration en terme de routes, espaces verts, espaces habites dans une zone donnée. 

 

Image satellite d’un quartier de Douala


Ensuite, l’étape suivante est d’apprendre à l’ordinateur de déterminer la “constitution socio-économique” dans une zone sur la base des images satellite. Nous avons donc choisi un nombre de zones pilotes pour “initialiser le modèle. Dans ces zones, nous avons envoyé des enquêteurs pour dénombrer effectivement le nombre de boutiques. Nous avons des zones de 20 ha, car il nous semble pertinent que 20 ha suffisent pour déterminer la constitution socio-économique d’une zone.

               

Les zones-exemples utilisées pour la calibration


Il fallait désormais donner à l’ordinateur un certain nombre de “paramètres” d’analyse afin qu’il puisse apprendre à estimer… On parle en économétrie de définir des variables explicatives. Nous avons utilisé les couleurs des pixels sur les images satellites les différentes zones.

Par exemple, une zone fortement peuplée va avoir de nombreux toits et donc une prépondérance de “gris” correspond au métal sur les toits, sachant que les toits dans les zones moins bourgeoises seront différents des toits dans les quartiers populaires. La présence d’une route va correspondre à la présence du noir sur la photo, qui est lié à la couleur du goudron. Ainsi, la répartition des différentes couleurs dans l’image satellite de la zone va définir une constitution socio-économique de la zone.

Enfin, l’algorithme va calibrer ces paramètres sur les exemples qu’on va lui donner pour apprendre par exemple qu’une zone forestière n’a probablement pas de boutiques, tandis qu’une route principale dans un quartier populaire aura de nombreuses boutiques.

 

Les résultats

Le nombre de boutiques dans Douala​

Nous avons initialisé l’intelligence artificielle avec 15 zones d’analyse dans des types de quartier différent. Et les paramètres d’analyse choisis dans la présence de “rouge”, “vert” et “bleu” qui sont les couleurs primaires en informatiques dans les pixels des images.

 

Nous avons ensuite utilisé un modèle extrêmement basique de régression linéaire pour relier le nombre de boutiques à la présence de ces couleurs dans les images-exemples. Pour ceux qui sont à l’aise avec ces outils, nous avons obtenu un R-squared de 60%, ce qui signifie que nos paramètres permettent d’expliquer près de 60% de la variance des résultats, ce qui est  très intéressant pour le faible nombre d’observations.

Enfin, nous avons découpé Douala en 30 grandes zones (en réalité, c’est le nombre de photos dont nous avons eu besoin en raison de la taille de l’écran qui réalise les screenshots). Et chacune de ces zones a été coupée en petits carrés de 20 ha sur les ques l’algorithme entraine a été simulé.

 

Et le résultat est le suivant : la ville de Douala compte environ 16375 boutiques de quartier. Impressionnant !

Le chiffre d’affaires global

Une fois le nombre de boutiques connu, et ayant déterminé dans la partie précédente le chiffre d’affaires dans une boutique de taille moyenne (nous avons validé le fait que cette boutique est effectivement de taille moyenne), nous pouvons estimer le chiffre d’affaires global des boutiques à Douala.

Il est donc de 2 100 000 XOF/boutique x 16375 boutiques = 34 387 500 000 XOF par mois, soit 52 MEUR.

 

Dans la seule ville de Douala, le marché de la distribution dans les boutiques de quartier est de près de 600 M EUR annuels.

Les défauts de l’analyse

Notre analyse du nombre des boutiques sur la ville de Douala est innovante et prometteuse. Néanmoins, il est évident qu’elle pourrait gagner en précision.

Tout d’abord, le nombre de zones analysées pour initialiser le modèle pourrait être revu largement à la hausse afin de garantir une plus grande précision du modèle d’estimation de l’intelligence artificielle. Par ailleurs, même si le choix des paramètres est intéressant, on pourrait apporter plus de finesse en coupant encore plus précisément les différentes plages de couleur afin d’augmenter la précision de l’analyse. Enfin, la donnée de base que sont les images satellites pourraient être encore mieux exploitées si on choisissait de meilleures résolutions d’image.