Tracking géographique de l'iPhone : des données à relativiser ?

Des zones plutôt que des points précis 249
Vincent Hermann
Un petit vent de panique souffle sur les utilisateurs d’iPhone  : le téléphone enregistre à intervalles irréguliers la position de l’utilisateur. Ce processus dure depuis un an et a commencé avec l’introduction de la version majeure 4.0 d’iOS. Dans la réalité, ces données ne sont pas forcément aussi précises qu’on pourrait le croire.

apple iphone 4

Des données insuffisamment protégées

La découverte a été faite par Alasdair Allan et Pete Warden de chez O’Reilly Radar. Ils l’ont présentée à la conférence Where 2.0 et il y avait de quoi attirer très nettement l’attention des médias : l’iPhone, sitôt qu’il est équipé d’iOS 4.0 et versions ultérieures, enregistre une longue liste des positions géographiques de l’utilisateur. L’ensemble de ces informations est stocké dans un fichier caché.


Lesdites informations comprennent notamment la longitude, la latitude, la date et l’heure. Le problème selon les deux découvreurs est que le fichier a beau être caché, il n’est pas protégé. Les informations apparaissent en clair dans « consolidated.db », un fichier qui est présent dans les sauvegardes réalisées par le téléphone, mais également par les modèles 3G des iPad 1 et 2. En outre, son stockage sur l’appareil ou dans les sauvegardes réalisées par iTunes n’est pas chiffré. Ces dernières font d’ailleurs que le fichier est systématiquement restauré en cas d’effacement, y compris dans les cas de migration des appareils.

Alasdair Allan et Pete Warden ont publié une application open source permettant de visualiser le contenu de cette base de données (sous Mac OS X).

La polémique sur la sécurité des données

L’absence de chiffrement et la disponibilité en clair des données rendent leur utilisation potentiellement dangereuse. Se pose du coup la question de l’utilité de ces données, et bien sûr celle de la probité d’Apple dans ce domaine. Pourtant, O’Reily Radar indique qu’il n’y a pas de quoi paniquer, car aucune preuve n’a été trouvée sur l’utilisation réelle de ces données. En outre, les deux découvreurs estiment qu’aucun « mal immédiat » ne peut être fait, outre celui de savoir éventuellement où vous avez été.

Cela est cependant suffisant pour qu’un sénateur démocrate américain, Al Franken, cherche à avoir des réponses sur ce problème. Il a donc rédigé un courrier à Apple, soulevant la question des cas d’abus qui pourraient se mettre en place si ces informations devenaient trop volatiles. Voici les neuf points demandés :
  • Pourquoi collecter et compiler ces données de géolocalisation ? Pourquoi avoir initié ce stockage avec iOS 4 ?
  • Ces données sont-elles collectées également par les ordinateurs portables de la marque ?
  • Comment ces données sont-elles générées ? (GPS, triangulation GSM, triangulation Wi-Fi, etc.)
  • À quelle fréquence ces données sont-elles enregistrées ? Qu’est-ce qui déclenche l’enregistrement d’une géolocalisation ?
  • Quelle est la précision de la géolocalisation ?
  • Pourquoi ces données ne sont-elles pas chiffrées ?
  • Pourquoi les utilisateurs n’étaient-ils pas prévenus ? Pourquoi Apple ne demande-t-elle pas le consentement de l’utilisateur ?
  • Apple pense-t-elle que cette conduite est admissible selon les termes de sa propre politique de respect de la vie privée ?
  • À qui ces données ont-elles été montrées ?
  • Le sénateur indique attendre une réponse rapide à toutes ces questions.
Une précision à relativiser ?

Le sénateur aura peut-être la réponse dans ce post publié par le bloggeur Will Clarke. Ce dernier a pris connaissance de la découverte d’Alasdair Allan et Pete Warden et a voulu en savoir davantage. Il se trouve que Clarke revenait d’un week-end entier à faire du vélo et s’était régulièrement servi de son iPhone pour consulter les cartes ou prendre des photos, ces dernières recevant automatiquement un tag de géolocalisation.

Il a donc utilisé l’application citée plus haut, et s’est dit « déçu » du résultatt : une grande partie des données de localisation étaient inexactes et manquaient singulièrement de précision. Connaissant parfaitement son itinéraire, il était étonné de voir des lieux visités où il n’avait pas posé les pieds, notamment des villes proches de l’itinéraire à vélo, ou encore une île proche de la côte.

Will Clarke a extrait en effet les données de son téléphone et a utilisé SQLite pour les cantonner aux zones traversées durant son périple, tout du moins celles qui affichaient un minimum de précision. Ces données ont ensuite été exportées vers un fichier CSV et converties en KML via un outil en ligne. Dès lors, il a pu intégrer son itinéraire dans Google Maps et se rendre compte qu’il existait un manque conséquent de précision et une certaine incohérence : la position géographique correspondait à une moyenne de zones.

Son explication est simple : l’iPhone (ou l’iPad) n’enregistre pas les coordonnées GPS de l’utilisateur, mais retient les positions géographiques des antennes relais qui sont utilisées. L’apparition d’une nouvelle entrée dans la base de données correspond donc à la bascule d’une antenne vers une autre. Les rayons d’action de ces antennes expliqueraient particulièrement bien pourquoi la localisation manque autant de précision : il s’agit d’aires d’effet, et non de points précis.

Il fournit d’autres arguments à sa thèse :
  • Le nom de la table où sont stockées les données se nomme CellLocation, faisant référence à l’emplacement d’une tour GSM. La base contient également les tables WifiLocation et CdmaCellLocation, ce qui permet de bien faire la différence.
  • Un des amis de Will Clarke s’est rendu récemment en Allemagne, et aucune entrée n’est apparue durant le voyage, quand bien même cet ami avait pris un forfait international pour les données. Clarke suppose que l’enregistrement des relais GSM ne s’effectue que pour l’opérateur primaire, AT&T dans ce cas.
  • Une précision de 500 mètres est le maximum que l’on puisse obtenir avec une antenne, sans recourir à la triangulation
  • Le passage sur un pont au-dessus de la mer aurait dû lui procurer une très grande précision dans les données de géolocalisation, mais seules des positions lointaines ont été relevées à la place
Selon Will Clarke, il ne s’agit pas de dire qu’Apple ne relève aucune donnée, mais de replacer le débat dans le droit chemin : il ne s’agit pas d’un espionnage des positions GPS. Il note tout de même que dans l’absolu, ces données fournissent des renseignements généraux sur les régions que vous traversez.

Notez qu'à l'heure où nous publions ces lignes, le blog de Will Clarke ne répond plus, croulant sans doute sous les connexions.