Caso de estudio SEO: Webs relámpago

Gráfica que muestra el pico de keywords que ha tenido este dominio

Antecedentes

Esta mañana (7 de octubre del 2021) he encontrado en Semrush la web ferienappartement-strandkrabbe.de como una de las webs con mayor crecimiento orgánico de los últimos días.

Es bastante raro posicionar 900k keywords en un día, además tratándose de KWs con un volumen de búsquedas tan elevado como “craiglist maine”, con un volumen mensual de búsquedas estimado de 550k (en posición 10) o “traductor”, top 100 con 16.6M de búsquedas y una dificultad de keyword del 82% según Semrush.

Lista de palabras clave que esta web rankea

Pensando que podría tratarse de alguna anomalía o fallo en la estimación, revisé también la misma web en Ahrefs y los resultados fueron muy parecidos, 1.3M de keywords posicionadas en la base de datos de Estados Unidos, un volumen un 44% superior al que ya me parecía exagerado.

lista de kws posicionadas en Ahrefs

Análisis de la web

error 404

Tras ponerme el mono de trabajo y entrar en la web, me llevé una decepción bastante grande. La página ya no existía, todas las URLs daban error 404 y mi

curiosidad era cada vez mayor: una web acaba de aparecer de la nada, se ha posicionado así de bien y se ha esfumado.

Revisando en Wayback Machine pude ver que la web existió y que se trataba de una web para alquilar un apartamento en Grömitz, un pueblo de unos 7.000 habitantes al norte de Alemania.

En un primer momento pensé que se podría tratar de una web infectada ya que al clicar en cualquiera de sus resultados de Google te redirige a la típica web de “Enhorabuena visitante 1.000.000, has ganado un iPhone!”, pero por los últimos cambios en el whois, parece que alguien compró este dominio expirado el 4 de octubre solo para hacer el mal.

Como suponía, tras cambiar el User-Agent para que la web me tratase como al rastreador de Google, esta dejó de redireccionarme y empezó a mostrarme el contenido que estaba posicionando, lo que se conoce como cloaking.

Cloaking (en español «encubrimiento») consiste en mostrar contenido diferente al usuario y al bot que rastrea el sitio web, con el objetivo de manipular lo que éste indexa.- Wikipedia

KWs que posiciona en España

lista de palabras clave posicionadas en España

Revisando el Top 20 de palabras clave que posiciona en España, elegí el término que tenía más búsquedas, “pc bolsa santander”, para ver por encima de quién estaba posicionando nuestra página.

En la página 1, casi todos los resultados son de PC Bolsa, pero en la página 2 empezamos a ver resultados de otras páginas alemanas similares a la nuestra, alguna posicionando incluso por encima de Infobolsa, una web especializada en la bolsa con 1.5k dominios de referencia y 57 de DR.

Viendo el resto de KWs, parece que siempre busca posicionar palabras relacionadas con otras webs de más autoridad, como por ejemplo “wallapop tudela”, “esquelas ideal granada” o “idealista sevilla los remedios”.

Contenido

contenido de la web

Aunque muchas URLs estaban ya caídas, se puede revisar la caché de Google y ver el artículo que Google revisó en su día. Hemos cogido este como ejemplo, aunque ya adelanto que son todos iguales.  (puede que cuando se publique este artículo ya estén penalizadas y eliminadas del índice)

  • Las webs no tienen nada de estilo, es solo un cuadro de texto.
  • Los textos oscilan entre las 1.000 y las 9.000 palabras.
  • Es contenido plagiado de foros y webs, sin modificar ni traducir.
  • Mezcla muchos idiomas en un mismo artículo. Chino, español, inglés, francés, ruso…
  • Los artículos abarcan todas las categorías imaginables, desde casinos a religión.

Perfil de enlaces

Backlinks

  • 93 backlinks, todos enlazados en los últimos 3 días.
  • Todos Nofollow.
  • 12 dominios de referencia 
  • 7 de ellos con 0 DR
  • El más potente es una web de cupones de descuento que tiene 45 de DR y 7 enlaces apuntando a esta web.

lista de dominios de referencia

Anchor texts

  • El 86% de enlaces tiene textos de ancla genéricos como “read more” y “visit site”.
  • Del 14% restante, un 7% son de URL exacta y un 7% naturales.

listado de anchor texts

Dominio

La primera aparición de este dominio en el archivo web es del 30 de enero de 2011 y era una especie de tour virtual de un piso vacacional en alquiler. En septiembre de 2021 aún posicionaba keywords relacionadas con las vacaciones, pero después de esto el dominio expiró y un nuevo usuario se hizo con él el 4 de octubre de 2021.

Otros dominios que podrían pertenecer al mismo usuario o red de webs (hay muchos más que utilizan el mismo patrón):

  • wiedemann-jens.de
  • buchbindungen-oberhausen.de
  • golden-dixies.de
  • corinnas-friseurwelt.de
  • wolkengrenze.de
  • lilienkoenig.de

Experiencia del usuario

La experiencia del usuario es inexistente, la página lo único que hace es redirigir al visitante hacia páginas fraudulentas o con contenido pornográfico.

Eso sí, para el algoritmo de Google la experiencia de usuario es perfecta ya que a nivel técnico, estas páginas aprueban todos los Core Web Vitals y con muy buena nota.

notas de los core web vitals

Conclusiones

¿Cómo lo hacen?

El funcionamiento para todas estas páginas es el mismo. Se compra un dominio expirado que nunca ha sido muy visible a ojos de Google, añade varios cientos de miles de artículos de la peor calidad imaginable y solo se los muestra a Google.

La web no utiliza enlaces internos, no tiene sitemap, ni ningún otro tipo de indicación para ayudar a los rastreadores web. No termino de entender cómo han podido indexar más de 40.000 URLs, seguramente a través de la API Indexing de Google Search Console.

En este vídeo de 2011, Matt Cutts, director del departamento anti-spam de Google, explica muy bien en qué consiste esta técnica y por qué incumple las directrices para webmasters de Google.

¿Cuál es el objetivo de todo esto?

Lo que buscan las personas detrás de esta red es posicionarse bien en términos de búsqueda de otras páginas web, con el fin de confundir al usuario para que haga click y poder redirigirlo a una web que muy probablemente esté comprando tráfico.

¿Qué señales ha enviado a Google y por qué ha sucedido esto?

Vivimos en un mundo que va muy rápido, todo se ha vuelto inmediato. Una web aparece de la nada con cientos de miles de artículos muy extensos, recibe varios enlaces en muy poco tiempo y tiene un tiempo de carga y rendimiento web buenos.

El factor viral está ahí y en mi opinión, a Google le ocurre lo mismo que a muchos medios de información, que publican información que puede no ser del todo cierta por el miedo a publicarla cuando ya sea demasiado tarde.

Eso sí, Google juega con la ventaja de poder evaluar si la información que ha proporcionado al usuario ha sido buena o no de forma muy rápida a través del feedback que nosotros mismos le damos con nuestros clicks, tiempo que permanecemos en una web y una larga lista de métricas.

Lo que en Semrush aparecía en posición 8, en Ahrefs estaba en el top 6, y cuando lo revisé yo mismo ya estaba en la posición 12 de Google. Muy probablemente cuando tú estés leyendo este artículo estarán más abajo incluso, o directamente eliminados del índice de Google.

Con este caso hemos aprendido que es posible colarse rápidamente en los rankings de Google si tu web y contenido cumplen los requisitos previos, pero al final los que evalúan tu contenido y determinan su posición son los mismos usuarios que tienen que consumirlo.

Y vosotros, ¿qué utilidad le veis a esto? ¿Creéis que podéis aplicarlas en vuestras estrategias SEO?

Deja un comentario

Wow look at this!

This is an optional, highly
customizable off canvas area.

About Salient

The Castle
Unit 345
2500 Castle Dr
Manhattan, NY

T: +216 (0)40 3629 4753
E: hello@themenectar.com