Calculando uplift correctamente.

Las decisiones de planificación de medios tradicionales y el análisis de su ROI, en base a su respuesta en ambientes digitales, deben siempre estar respaldadas por información y, por consiguiente, ésta debe ser lo más precisa posible. Desde hace algún tiempo es común ver en el mundo herramientas que utilizan modelos de atribución simplistas que no consideran las particularidades del tráfico y, por lo tanto, devuelven datos erróneos. Vamos a mostrar cómo estos modelos fallan a la hora de brindarnos un panorama de la eficiencia de nuestros medios tradicionales y cómo EKHO Attribution aborda este problema.

Lo primero e indispensable para poder atribuir los incrementos de tráfico a webs, debido a la pauta tradicional, es entender cómo funciona el tráfico. Los flujos de visitas a una web presentan muchas formas, rara vez es constante y éste se distribuye en el tiempo de maneras muy diversas.

Veamos un ejemplo real del tráfico a una web durante 15 minutos para ejemplificar el problema. La escala de tiempo tiene una resolución de 10 segundos.

Como se puede apreciar, el tráfico presenta tiempos entre visitas bastante variables, existiendo una anomalía de corta duración en el tráfico asociada a una pauta publicitaria en TV.

Agreguemos a nuestra gráfica el momento exacto de una pauta publicitaria y separemos el tráfico atribuido de las visitas normales.

El tráfico atribuido, como casi cualquier incremento de corta duración, presenta un patrón muy distinto al tráfico común. Los modelos presentes en todas las herramientas que hemos analizado, a excepción de EKHO Attribution, utilizan una aproximación simplista al problema de identificar el volumen de sesiones atribuidas (o uplift).

La manera que estas funcionan es utilizando lo que se llama una "línea de base", o "baseline". En pocas palabras, lo que estas herramientas realizan es contabilizar la cantidad de visitas que ocurren durante un tiempo limitado previo a la emisión de una pauta publicitaria, a esto le llaman "baseline".

Posteriormente a la emisión de una pauta, estas herramientas contabilizan las visitas que ocurren durante una duración de tiempo igual al baseline y restan la cantidad de visitas del baseline para obtener el uplift, o visitas atribuidas a esa pauta.

Volvamos al ejemplo, en este caso las herramientas calcularían los números para baseline y visitas atribuidas de esta manera:

18 (luego de pauta) - 9 (previo a pauta, baseline) = 9 visitas atribuidas por baseline

Si usted se tomó el trabajo de contar las visitas atribuidas (en rojo), verá que la cantidad de visitas atribuidas reales es 13 visitas, 4 más que las calculadas por el método de baseline.

El problema fundamental del modelo de baseline es considerar a todo el tráfico igual, donde se asume que no existen grandes fluctuaciones y que la cantidad de tráfico en dos lapsos consecutivos es constante, retornando como resultado un uplift con un error mayor al 30%.

El tráfico "normal" presenta fluctuaciones que deben considerarse y el tráfico atribuido sigue un patrón distinto al normal, considerar estas dos realidades es fundamental para poder identificar el uplift correctamente.

Si desea verificar este problema por usted mismo, tome dos períodos de tiempo cortos consecutivos del tráfico de su web, digamos de 5 minutos, donde usted sabe que no se emitió pauta tradicional y contabilice las visitas en ambos períodos. Notará que es muy fácil encontrar diferencias entre ellos, por ende tomar la aproximación de restar la cantidad de visitas posteriores a una pauta naturalmente presentará un margen de error ya que la base de visitas normales fluctúa. Este efecto se ve amplificado enormemente en flujos mayores de tráfico, donde estas fluctuaciones son más pronunciadas cuando queremos comparar duraciones cortas de tiempo.

Machine learning al rescate

Si observamos la gráfica del ejemplo notaremos que el tráfico normal sigue un patrón, mientras que el atribuido sigue uno completamente distinto. El tráfico normal es más espaciado, de menor intensidad, el tráfico inspirado está limitado en el tiempo y los tiempos medios entre visitas es menor, éstas son diferencias fundamentales a considerar para lograr una correcta atribución. Existen otros factores no visibles en la gráfica como las fuentes de tráfico. Mientras el tráfico no inspirado proviene de diversas fuentes, el tráfico inspirado en pauta tradicional proviene de un subconjunto de todas las fuentes y medios.

EKHO Attribution funciona entendiendo que el tráfico atribuido se comporta muy distinto al tráfico normal y su origen es más acotado, su modelo de atribución se ayuda de esta diferencia para poder separarlos. Usando técnicas de machine learning, nuestro modelo aprende cómo se comporta el tráfico y calcula si las visitas deben ser atribuidas o no. El sistema de Attribution analiza ininterrumpidamente el flujo de tráfico de las webs de nuestros clientes y establece un modelo de tráfico "normal" que es actualizado constantemente. Una vez que se detecta una pauta, el sistema predice que cantidad de visitas deberían ocurrir y los compara con las visitas actuales. El sistema calcula cuánto se desvían las nuevas visitas de esta "normalidad", pudiendo identificar incrementos de duración variable, desde pocos segundos a varios minutos. El sistema filtra fuentes de tráfico sin correlación con visitas inspiradas y realiza los cálculos por cada visita en tiempo real, identificando a qué modelo corresponde cada visita de manera casi instantánea, independientemente de la cantidad de tráfico que se maneje.

La gran diferencia con el modelo de baseline, es que EKHO Attribution observa más características del flujo de tráfico, entendiendo el comportamiento del tráfico, por lo que dispone de datos claves a la hora de poder decidir si atribuirlo o no.

Conclusión

Identificar uplift puede parecer una tarea sencilla a simple vista, pero es un problema complejo que requiere una aproximación cuidadosa. EKHO Attribution se sirve de herramientas matemáticas y algoritmos propietarios para filtrar el ruido, considerando las fuentes del trafico junto con su comportamiento para determinar si éste debe ser atribuido. El resultado es la abstracción del usuario de toda esta complejidad y la obtención de datos claros de la performance de los medios tradicionales dentro de Google Analytics.

¿Interesado en evaluar EKHO Attribution?