Comment vérifier le watermarking audio de Mediametrie

Il y a quelques jours, je suis tombé sur un article : Mediametrie, la société qui fournit les audiences des chaînes de TV françaises, va suivre les offres de streaming. C’est une bonne idée, mais la mise en oeuvre est… particulière. Tout comme celle employée pour déterminer ce que les personnes du panel (~5 000 foyers) regardent.

Dans le cas du suivi du streaming, je trouve la méthode employée absolument scandaleuse, si je comprends l’article. En effet, dans 2 700 foyers, il y a un mouchard. Un boîtier qui va enregistrer « en temps réel les noms de domaines des offres que vous consultez, ce qui permet de savoir à quelle heure et pendant combien de temps vous êtes sur l’une ou l’autre ». Présenté comme ça, tout ce qui passe est analysé, et les foyers en question reçoivent donc un mouchard qui va vérifier s’ils regardent Netflix mais aussi ce qu’ils visitent au sens large. Pour vous donner une idée de la contrepartie, faire partie du panel Mediametrie, c’est recevoir des bons d’achats tous les mois si vous avez bien suivi les règles, de l’ordre de 20 € par mois. Oui, même pas de quoi se payer l’abonnement Netflix le plus cher. Mais ce n’est pas réellement le sujet ici, parce que les détails sur Mediametrie sont très rares.

Le logo de Mediametrie

Ce qui m’a intéressé, c’est la technique classique. Mediametrie utilise du watermarking audio, c’est-à-dire un son caché, qui permet d’identifier ce que vous regardez. Dans les foyers, un appareil enregistre en permanence, et envoie les données à Mediametrie tous les jours (c’est expliqué dans deux vidéos de Deus Ex Silicium). Sur le plan de la vie privée, ce n’est pas mieux, on est d’accord. Mais je me suis posé une question bête : peut-on détecter ce watermarking ?

Je pensais que la société à l’origine de la technologie, Kantar Media, cachait les données dans des zones inaudibles du signal (par exemple entre 18 et 22 kHz) mais ce n’est pas le cas. J’ai enregistré quelques émissions de TV et filtré l’audio pour vérifier la présence de données, sans rien voir de particulier. Et surtout, ce n’est pas jouable pour la radio : la FM n’atteint pas de telles fréquences et les fichiers distribués en podcasts (qui sont suivis) coupent bien avant 18 kHz.

Je n’ai pas de détails sur la technologie elle-même, mais il y avait en réalité une voie plus simple : l’application Detect Now. Il suffit de la lancer, de bien choisir SNAP France dans les options et d’attendre quelques secondes. Sur les enregistrements récents, vous verrez un nombre et la date de diffusion. C’est en UTC (donc avec un décalage) mais avec les enregistrements testés, l’heure était la bonne. Je précise bien les enregistrements récents pour une bonne raison : l’application réagit aussi avec de vieux enregistrements (parfois plusieurs années) mais l’heure de diffusion n’est pas la bonne. Je peux supposer que les codes sont réutilisés après un certains temps dans le watermarking pour des raisons techniques.

Le réglage


Le résultat avec l’extrait plus bas (Columbo sur TMC le 11 octobre)

Je vous mets un extrait d’une minute pour tester.

Quelques autres avec des enregistrements parfois anciens

Sinon, les podcasts réagissent (ceux issus de la radio) et donc le watermarking est ajouté aussi. En fait, la majorité des contenus qu’on écoute en linéaire contient donc un tatouage audio invisible, qui permet à Mediametrie (et à n’importe qui, en fait) de vérifier quand un contenu a été diffusé, avec une fenêtre de quelques semaines (lors de mes essais, j’ai eu des dates jusqu’en juillet 2025). C’est presque flippant.