Et si on glorifiait les cartes dans l'analyse de données ?

Quand je survole un pays j'adore repérer les structures urbaines.

Et quand je connais un pays, je sais lire sur la carte quel voisinage a quel problème.

Je suis quasiment sûr que pour beaucoup de pays les codes postaux de naissance, lieu d'enfance et de vie sont suffisant pour déterminer le profil social, voire racial des personnes. Ça ne ma plaît pas vraiment, mais quand tu connais la France tu reconnais tout de suite la cité : coincé sur au moins 2 voir 3 cotés par un obstacle infranchissable (rail, fleuve, routes...) et pauvrement desservi.

Ça ce lit sur les cartes. Pour le Québec, c'est d'autres règles qui s'appliquent, mais en général ça implique toujours des coupures territoriales comme au nord et au sud du viaduc, puis quand la ville devient trop cher, ça devient dans ou en dehors de l'île.


La beauté des cartes, c'est qu'elle permettent de faire du big data aisément.

vous voulez croiser 2 hypothèses ?

Superposez 2 cartes, faites une similarité et vous avez une potentielle corrélation. Si les phénomènes peuvent avoir une causalité avec un lag, utilisez des convolutions temporelles des densités sur les cartes.

Si A est une cause de B alors A intervient avant B à la vitesse maximale de sa propagation de causalité. Ex: si une épidémie de zombie est précédée par l'incubation d'un virus qui emmène les gens à l'hospital puis qui contamine à pied, on s'attend si on a bien fait les corrélation, non seulement à voir un délai entre la carte admission dans les hopitaux mais aussi de la forme dans le nuage de propagation des zombies....et depuis la carte d'amission des hopitaux, relier à celle d'une gastro entérite.

L'intérêt des cartes, c'est qu'elles sont représentées par des bitmaps, et les liaisons de topologie à topologie par des matrices de connexions. Toute causalité comme l'application d'une matrice de probabilités de transition sur des conditions observées car on accepte de ne pas tout savoir, mais un peu quand même.


Ex, de code postal à code postal on peut dire si un bateau en papier envoyé au fil de l'eau peut aller de l'un à l'autre.

Hé, ces structures de données, ça ressemblerait pas méchamment à celles utilisées par les réseaux sociaux ?

Oui, parce que ces structures de données sont idoines pour décrire tous les réseaux : sociaux, fluviaux, électriques, routiers, économiques.

Seulement, si on peut cacher son réseau social, on peut pas cacher son code postal dès que cela importe. (crédit, livraison, acte légaux et civiles....)



Donc revenons à corrélation ou causation.

Imaginons donc que ces cartes sont comme des matrices contenant soit des mesures (potentiellement vectorielles en dimension et temporellement), soit des Effets Observables, c.a.d des fonctions de paramètres qui peuvent être externes (dont des références à des cartes d'un temps antérieur) qui transforme une mesure en sa probabilité de transition vers une autre mesure dans une carte liée a l'état suivant.

Oui, on a basiquement un jeu de la vie pour chaque carte, pour chaque jeu de règle de transition. On peut s'amuser à regarder le lag entre A => B, faire des correctifs d'amplitudes, continuer dans le passé voir si d'autres causes ou corrélations existent et ainsi de suite parcourir exhaustivement (et récursivement) pour trouver des primo causes.

L'intérêt d'un algorithme simple basé sur une inteprétation visuelle est que les humains pourront contrôler l'algorithme. Et en étant visuel, je vous garanti qu'on pourra kicker au max les optims des cartes graphiques mêmes les plus perraves à blitter.

Simplement, on parle de matrice à N dimension + 1 temporelles ou fonctionelle. On empile juste 4 couches de ruses, une géométrique, 2 programmationelle, et peut être une ou deux mathématiques et on fait un truc qui fait la job.










Par exemple, je proposerais de tester géotemporellement la carte des effets supposés de la politique contre la délinquance de ce ...... de Guliani à NYC dans les années 90 avec la carte des nombres d'avortements depuis sa légalisation.

La différence entre la théorie un poil facho de Guliani reprise par sarko et celle d'un effet à retard (18 ans) de la légalisation de l'avortement, c'est que Guliani a fait son faf à NYC, mais que la délinquance a baissée de la même proportion partout ailleurs aux USA.

La baisse de la délinquance à NYC n'était pas le résultat d'une politique volontaire ; c'était une coûteuse coincidence.
Pourquoi coûteuse, car les lieux qui n'ont rien payé ont eu le même résultat, et donc plus d'impôts à dépenser ailleurs. Dépenser en un avantage peut être concurrentielle qui a peut être eu un effet sur une autre carte ....


Ce que j'aime bien avec cette idée, c'est qu'elle est déjà codée, et que je ne cherche plus que des défis à relever avec.

Notamment, quand j'aurais suffisamment de données sur mes cartes des offres d'emploi en France, je compte coller d'autre carte dessus pour voir lesquelles corrèlent, la carte de l'activité fluviale passée semble être un bon indicateur ... peut être de la où les villes se sont construites par simplicité de déplacement des charges, donc des cartes de densités de populations. Peut être.

En tout, cas je suis assez curieux de voir le résultat ;o)

Ça me laisse malgré tout un poil mal à l'aise, quand je constate que les territoires des cartes aux contours de de plus en plus arbitraire sans que la géographie, la physique, le climat, le relief ne l'explique. Une carte devrait reflêter le territoire et non l'inverse.

No comments: