La data plus ou moins BIG ?

de | 24 avril 2014

Programmatique & Big DataPour bien comprendre l’impact de cette fameuse data il faut en connaitre sa provenance et sa nature.

1. Données avérées

Prenons un exemple concret, les 2 leviers « web » qui connaissent les meilleures performances en terme de génération de trafic et de ventes sont les mots clés ou « Search » (SEM) et le Retargeting (display ou email).

Quel est leur point commun ? Dans les 2 cas il s’agit de données avérées du comportement d’un internaute, c’est-à-dire que l’on peut être sûr à 100% que l’internaute en question a émis une requête de type « voyage aux Etats-Unis » sur un moteur de recherche ou bien qu’il se soit rendu sur le site d’un voyagiste comme Expedia pour regarder les offres de séjours liées à un voyage à New-York.

A partir de là, le comportement de l’internaute étant validé, les actions marketing (annonce, publicité, email …) connaitront des ratios de performances supérieures à la moyenne, à minima sur le taux de click (CTR) et au mieux sur le taux de transformation, c’est-à-dire directement sur votre coût d’acquisition final.

Attention les données avérées sont disponibles en nombre limité, lié à l’audience d’un moteur de recherche dans le cas des mots clés ou à l’audience de votre propre site web dans le cas du retargeting. D’où des modes de vente aux enchères pour les mots clés et donc une inflation certaine sur les prix.

D’autres catégories de données avérées existent provenant de :

  • sites éditeurs spécialisés : high-tech, automobile, immobilier…
  • sites de prestataires de service : courrier comme la Poste permettant d’identifier les déménagés par exemple
  • ou d’ecommerçants : identification des acheteurs en ligne, déduction de la structure de leurs foyers en fonction de leurs achats etc….
  • de spécialistes de la connaissance clients (Acxiom, Experian…) qui collectent et agrègent des données sur les foyers de nombreux pays

2. Données modélisées

Il s’agit de la seconde catégorie de données disponibles pour les annonceurs, en plus grands nombres que les données avérées les données modélisées sont « élaborées » à partir de ces dernières dans le but d’obtenir un volume exploitable supérieur à un coût inférieur.

La performance s’avère elle aussi inférieure, une donnée modélisée ayant un taux de fiabilité maximum de 40% à 50% (dans le meilleur des mondes).

Le plus important vous l’aurez bien compris est de savoir à quelle data vous avez à faire, en quelle quantité et si possible d’éviter les mélanges ou au minimum de connaitre les proportions.

Une même campagne basée sur un mix de données modélisées et avérées sans que vous en connaissiez la teneur exacte ne vous apprendrait pas grand-chose sur ce qui a marché, ce qui n’a pas marché, pourquoi etc…

De plus il serait très compliqué de la pérenniser ou de la faire grandir car vous n’auriez que peu de maitrise sur la répartition des 2 sources de données et donc vous ne pourriez projeter les performances avec un minimum de fiabilité.

Eric Gueilhers