Fuelling war : dans le secret de la production de notre base de données

Credit: Tagesspiegel


L’enquête « Fuelling War », menée conjointement par Reporters United et Investigate Europe, a commencé par un Bot Twitter (un outil algorithmique) : le tracker de tankers russes. Il s’agit d’un décompte automatisé des cargos chargés de pétrole ou de gaz, quittant les ports russes. Il a été créé par Greenpeace.

Cet outil aspire en temps réel les données publiques du transport maritime (la position des navires, leurs mouvements, leurs noms) grâce au service de géolocalisation public, Marine Traffic. Dès qu’un cargo quitte un port russe, chargé de combustibles fossiles, le Bot Greenpeace publie un tweet récapitulant le type de bateau, son nom, une image de sa position, sa destination ainsi qu’un lien vers le site Marine Traffic.

Le premier tweet a été publié le 9 mars, 14 jours après l’invasion russe en Ukraine. Cette publication concernait le pétrolier russe Mendeleev Prospect qui prenait la direction de la ville danoise de Skagen.

Suite à l’annonce du départ du navire, le Bot ajoute des informations sur d’éventuels changements rencontrés par le navire en cours de route. Pour éviter de faire erreur dans nos analyses, nous n’avons pris en compte que le premier tweet, indiquant l’heure à laquelle le navire lève l’ancre en port russe, et non les tweets suivants indiquant les changements de cap ou les fluctuations dans les estimations d’heures d’arrivée.

Afin de filtrer les navires, nous nous sommes basés sur le texte des tweets et sur le numéro IMO à sept chiffres, un code unique que possède chaque bateau et qui le suit toute sa carrière, quels que soient les changements de propriétaires, de nom ou de pavillon. Ensuite, pour retrouver les menus détails sur les performances de chaque navire, sur ses différents exploitants, nous utilisons la base de données publique Equasis.

Après avoir collecté toutes ces données, nous avons créé trois ensembles de données distincts : 

  • L’un avec les tweets du Bot 
  • Un autre avec les numéros IMO de chaque navire mentionné par les tweets, préalablement
    récupérés sur Marine Traffic
  • Le dernier avec les informations sur les exploitants et les caractéristiques de chaque navire que nous avons récupéré sur Equasis.

Chaque ensemble de données a été nettoyé et corrigé afin de créer la base des données. Nous avons extrait les navires grecs. Nous avons ensuite corrélé manuellement ces navires avec les divers exploitants et familles, en se basant sur les informations des sociétés trouvées sur Equasis. Comme nous nous sommes d’abord concentré.e.s sur les navires grecs, cette méthodologie a été très efficace.

Repérer les armateurs européens

Par la suite, nous avons dû revoir notre méthodologie pour nous adapter aux objectifs à long terme de cette enquête collaborative. En effet, de nouveaux journalistes et des médias partenaires de nombreux pays nous ont rejoints, amenant avec eux de nouveaux défis éditoriaux et des angles plus particuliers. Nous avions besoin d’enrichir et diversifier nos sources.

Nous avons donc décidé de comparer notre ensemble de données aux données publiques du Centre de recherche de l’école de l’air (CREA). Tout comme notre méthode, ces données pistent les affrètements entre les ports russes et les ports d’autres pays en se basant sur les données récupérées sur Marine Traffic. Mais les deux différences qui sautent aux yeux entre les deux méthodes, c’est que contrairement au Bot Twitter, CREA a commencé à collecter des données bien avant le début de la guerre, le 24 février 2022. De plus, il utilise aussi des données récupérées grâce au tracker API&ship et des listes data de la base de données AIS (les données en temps réel de traffic maritime).

Autre différence significative entre les deux méthodes :  Reporters United et Investigate Europe relient le navire et son propriétaire, en se basant sur la liste des armateurs consultables sur Equasis, alors que CREA considère que le nom de la société listée est propriétaire du bateau.

Pourquoi cette différence ? Il est extrêmement rare que le propriétaire inscrit dans les registres soit le réel armateur du navire. Historiquement, l’industrie du fret maritime appliquait la règle un navire/une compagnie : chaque bateau était détenu ou exploité par une société parente formant une flotte avec d’autres bateaux. Mais ce même navire est aussi enregistré sous le nom d’une autre société (souvent dans un paradis fiscal), dont le seul actif est le cargo. Ce système a été mis en place afin de réduire les risques pour la société mère.

De plus, Reporters United et Investigate Europe récupèrent sur Equasis les adresses exactes des trois sociétés listées comme gérant le navire (qui se divisent la gestion commerciale du bateau et la surveillance et sécurité des opérations (ISM), sans oublier le propriétaire). Nous récupérons aussi des informations sur les dates auxquelles ces sociétés ont commencé leurs activités. 

La grande différence entre ces deux méthodes, c’est la façon dont on a considéré la livraison / le voyage en lui-même. Avec notre méthode Reporters United /Investigate Europe, construite à partir des données du Bot Twitter, nous ne suivons que les livraisons de pétroliers et de gaziers quittant les ports russes pour l’international. Cela explique pourquoi il existe de grosses différences entre nos deux ensembles de données, en terme de nombre de livraisons comptabilisées.

C’est aussi la raison pour laquelle nous avons décidé de changer notre méthodologie et de rassembler les deux ensembles de données, pour arriver à une forme hybride dans la collecte. En gros, nous sommes désormais capables de suivre avec précision les livraisons effectives de cargo venant des ports russes, parvenus à destination et ayant déchargé leur marchandise grâce aux données CREA, et en parallèle nous pouvons comparer ces données avec les sociétés exploitantes, grâce à notre méthode fondée sur les données Equasis. Les livraisons plus complexes, comme les navires qui font escale dans des ports russes, sont exclues des deux méthodes de collecte.

Autre bénéfice significatif à avoir rassemblé les deux méthodes : les livraisons de charbon dans les vraquiers et les cargos ordinaires, étaient à la base exclues de nos décomptes, se sont sont ajoutées à nos données. Il est important de noter que ces types de navires peuvent transporter d’autres charges que du charbon. CREA a identifié 25 terminaux d’exportation de charbon, se trouvant dans certains ports russes. Quand un navire se charge à ces endroits spécifiques, il est hautement probable qu’il embarque du charbon à bord. Nous n’incluons pas dans notre analyse les cargos comprenant aussi d’autres types de marchandises.

Les cargaisons comprises dans notre analyse comprennent le pétrole, le gaz et le charbon. Quand la base de données CREA ne spécifie pas la nature du chargement, nous l’excluons de notre analyse. Cependant, considéré la difficulté pour accéder à certaines informations concernant certaines cargaisons, les données CREA incluent également parfois dans la catégorie “pétrole” les produits dérivés du pétrole, et les produits chimiques sans plus de précision. Pour le moment, CREA n’a pas ajouté de détails supplémentaires sur ces cargaisons spécifiques. 

Sur Equasis, la quantité de la cargaison sur un bateau est comptabilisée en tonnes de port en lourd (TPL). Comme il est compliqué de suivre les mouvement des bateaux de façon automatique, les actions manuelles sont nécessaires pour éliminer les doublons ou ajouter des livraisons qui n’avaient pas été inclues dans l’ensemble de données. De plus, certaines entrées de notre ensemble de données se basent sur des informations offertes par les navires eux-mêmes, concernant leurs déplacements par exemple, et ne peuvent donc pas être prises pour argent comptant.


Si vous trouvez des erreurs dans notre base de données, merci de nous le faire savoir en nous adressant un email à cette adresse : reporters@reportersunited.gr / mail@investigate-europe.eu