17 avril 2020

Un modèle simple de la pandémie de coronavirus

Prenez une boîte de Pétri, remplissez-la d'agar, mettez-y une goutte d'échantillon de bactéries, fermez-la et placez-la dans un endroit chaud. Les bactéries se développeront de façon explosive au début, mais ensuite la croissance ralentira et finira par s'arrêter complètement une fois que les bactéries auront consommé tous les nutriments que la gélose peut fournir. Mathématiquement, ce processus peut être caractérisé assez précisément à l'aide de la fonction logistique:


La fonction logistique fonctionne également bien pour caractériser les pandémies, car le processus sous-jacent est similaire. Le taux de croissance des bactéries dépend du nombre de bactéries et ralentit à mesure que les nutriments s'épuisent; le taux de propagation de l'infection dépend du nombre d'individus infectés et ralentit à mesure que le nombre d'individus restant à infecter diminue.

Les modèles mathématiques peuvent être arbitrairement compliqués et, comme conséquence immédiate, arbitrairement faux. Il est possible d'adapter un polynôme à presque toutes les données simplement en y ajoutant suffisamment de termes, mais la valeur prédictive d'un tel exercice est à peu près nulle. Le modèle logistique est simple. Il utilise seulement trois paramètres: point médian, maximum et taux de croissance. Et il modélise des phénomènes physiques réels qui sont omniprésents dans la nature: croissance exponentielle et saturation exponentielle.

Dans la modélisation de la pandémie de coronavirus, nous avons dû ajouter un quatrième paramètre: un petit décalage. En effet, les données chinoises, pour quelque raison que ce soit, sont difficiles à traiter comme faisant partie du modèle mondial. À la mi-février, le coronavirus a sauté des boîtes de Pétri, si vous voulez. Après ce point, la boîte de Pétri est devenue la planète entière.

Une fois ajusté pour les données chinoises, le modèle produit un excellent ajustement avec un écart type de 2%. Les données que nous avons choisi d'analyser sont le nombre de décès par coronavirus tel que rapporté par worldometer.info [https://www.worldometer.info/coronavirus/worldwide-graphs/#total-deaths]. Le nombre déclaré de décès par coronavirus est beaucoup plus précis que toutes les autres statistiques. Le nombre d'individus infectés dépend de la précision du test et du nombre d'individus testés. Le nombre de cas graves dépend de mesures de gravité qui peuvent varier et peuvent avoir une composante subjective. Et bien qu'il y ait une chance non nulle qu'un certificat de décès mentionnant COVID-19 comme cause de décès soit également erroné, de telles erreurs, et quelle que soit l'interaction des facteurs qui les provoquent, ne semblent pas affecter l'exactitude de notre courbe. exercice d'ajustement.

Voici un graphique de notre modèle (en rouge) et des données sur les décès par coronavirus (en bleu).

À l'exception des décès par coronavirus chinois (que nous ignorons en introduisant un décalage de 2770 décès), les données et le modèle diffèrent de moins que l'épaisseur de la ligne. Bien que cela soit visuellement satisfaisant, il peut y avoir des tendances non évidentes dans les données que le modèle manque, que nous pouvons rechercher en examinant les résidus entre les données et notre courbe:

Si la fonction logistique ne capturait pas tout ce qui se passait avec la pandémie de coronavirus, alors nous verrions une tendance dans les résidus: les données s'écarteraient du modèle de manière systématique. Cependant, tout ce que nous voyons ici est un tas de bruit aléatoire qui se calcule dans le temps.

Une autre méthode pour valider notre modèle est l'analyse de régression. Cela montre que la linéarité est excellente.


Une façon utile de regarder les données est de tracer les décès globaux. Dans le graphique ci-dessous, les barres bleues indiquent les décès dus au COVID-19, comme indiqué, et la ligne rouge en pointillés est notre modèle.

 
Ici, nous pouvons voir où notre modèle prédit le point médian de la pandémie. Il est actuellement fixé au 8 avril. Cependant, alors que les données arrivaient à mi-chemin, elles dérivaient. Le 31 mars, il a été fixé au 4 avril. Autrement dit, sur 15 jours, il a dérivé de 4 jours. Nous ne pouvons que deviner pourquoi. Il y a peut-être un décalage dans la notification des décès dus au COVID-19. Ou peut-être la taille de la planète joue-t-elle un rôle et malgré les voyages aériens quasi-instantanés, la propagation géographique du virus prend un temps non négligeable. Mais ce ne sont que des suppositions. Il suffit de dire que si la dérive reste constante, alors à la mi-mai, le point médian aura été franchi vers le 16 avril.

Lorsque le point médian dérive, la limite supérieure augmente également. Il y a une semaine, il était proche de 140000 décès COVID-19 au total, mais il approche maintenant 170000. Cette dérive rend dangereux de faire des prédictions exactes basées sur notre modèle. Le nombre ultime de décès dus à COVID-19 pourrait atteindre jusqu'à 50% de plus. Il se peut très bien que les données actuelles, et donc le modèle, ne prennent pas en compte la propagation géographique future du virus dans les zones à faibles ressources médicales, où les cas de COVID-19 resteront à la fois non diagnostiqués et non déclarés.

Quant aux nombreux pays qui luttent actuellement activement contre le coronavirus en fermant le trafic aérien, en imposant des couvre-feux et des restrictions de voyage, forçant les gens à rester à l'intérieur, obligeant les gens à porter des masques et à se tenir éloignés les uns des autres en public, nous pouvons peut-être supposer que pour Pour eux, les données sur les décès dus à COVID-19 sont à la fois exactes et opportunes. Sur la base de cette hypothèse, nous pouvons arriver à quelques conclusions provisoires.

Différents pays ont imposé des mesures différentes. Certains exigent que les gens aient des laissez-passer écrits pour mettre les pieds à l'extérieur; D'autres ne le font pas. Certains ont forcé un arrêt économique complet; d'autres non. Certains testent de nombreuses personnes en bonne santé pour le coronavirus; d'autres ne testent que les cas suspects et quelques-uns effectuent des tests dans le cadre d'une autopsie, voire pas du tout. Comment cela semble-t-il affecter le nombre de décès dus à COVID-19? Eh bien, pas du tout, en fait! Cela semble faire à peu près autant de différence que froncer les sourcils et remuer le doigt sur une boîte de Pétri. Le coronavirus se propage comme il le ferait, et la plupart des gens qui y sont exposés ne savent même pas qu'ils ont été exposés à quelque chose hors de l'ordinaire.

Même si nous augmentons considérablement notre estimation actuelle de 170000 décès ultimes par COVID-19 à un demi-million et supposons que le coronavirus se propage à tous les coins de la Terre, cela nous donnerait une létalité de 0,07%. Ceci est tout à fait conforme au nombre de morts de la pandémie de H1N1 en 2009. Il faut cependant noter que la pandémie de 2009 n'a pas provoqué d'effondrement financier et économique. Nous pouvons supposer que les dommages causés par les mesures largement futiles prises pour contrôler la propagation du coronavirus, qui comprend des millions de pertes d'emplois et de faillites commerciales, seront beaucoup plus graves que les dommages causés par le coronavirus lui-même. Les effets secondaires directement mortels de ces mesures comprendront des taux de meurtre et de suicide considérablement plus élevés,les décès dus à la malnutrition et à la famine et les décès dus au manque de soins médicaux des systèmes de soins de santé qui ont été réquisitionnés pour se concentrer sur COVID-19.

Des personnes sensées et responsables ferment-elles l'économie et se mettent-elles en faillite pour un virus qui n'est pas sans rappeler les dizaines d'autres en circulation qui provoquent la toux et l'éternuement, et parfois (très rarement) la mort? Non, ils ne pas. Ainsi, nous sommes obligés de formuler d'autres hypothèses. L'une de ces hypothèses est que la finance mondiale s'est effondrée il y a quelque temps, et finalement l'astuce de «donner un coup de pied dans la rue» n'a plus fonctionné. Et puis l'économie mondiale s'est effondrée. Heureusement, ce coronavirus est arrivé juste à temps pour permettre aux dirigeants d'éviter de prendre la responsabilité de ce qui s'est passé.

Ils ont mis le coronavirus en valeur pour tout ce qu'il vaut, mais cela ne fonctionnera pas beaucoup plus longtemps. Ce que notre modèle nous dit, c'est que la pandémie de coronavirus a déjà dépassé son point de saturation et sera terminée dans un mois ou deux. Le virus aura disparu et les dirigeants déclareront la victoire, mais l'effondrement économique restera. Certains pays pourront redémarrer leur économie tandis que d'autres - ceux qui ont donné un coup de pied au proverbe peuvent emprunter la voie du proverbe - ne le pourront pas. Et là, l'effondrement politique suivra l'effondrement économique.

La conclusion la plus importante que nous pouvons tirer de notre modèle est que la pandémie de coronavirus a déjà dépassé son point médian. Cette conclusion est provisoire, car de nouvelles données pourraient briser le modèle. Par exemple, nous pourrions voir un nouveau pic important quelques semaines après la fin des blocages et des couvre-feux. Mais jusqu'à ce que cela se produise, la simplicité et la précision de notre modèle en font un bon outil de suivi. Nous continuerons d'ajuster notre modèle à mesure que de nouvelles données arrivent et publient des mises à jour. Pour l'instant, cependant, notre modèle semble nous dire que le pire est déjà passé. Si vous avez besoin d'une raison d'être optimiste (comme la plupart des gens le font actuellement), c'est ici ! 
 
Dmitry Orlov 

Aucun commentaire:

Enregistrer un commentaire

Remarque : Seul un membre de ce blog est autorisé à enregistrer un commentaire.