Extractor de entidades para SEO

Bueno bueno bueno… Hacía tiempo que no pasaba por aquí a escribir algo y qué mejor que hacerlo para presentaros una nueva herramienta que he desarrollado para facilitarnos un poco la vida a todos los que nos dedicamos al posicionamiento web. Como consultor SEO, me gusta automatizar o programar todo aquello que se me ocurre o que aprendo de otras personas y veo factible de desarrollar.  En esta ocasión se trata de una extensión para Google Chrome que, una vez instalada y configurada (solo hace falta introducir un token de una API externa), nos permite extraer las entidades que tratan nuestros competidores en las SERPs para una query determinada.

Pero antes de continuar, al César lo que es del César, la idea original es de Nacho Mascort y se la escuché en la entrevista en el podcast La Máquina del SEO de Andrés Kloster, lo único que he hecho es adaptarlo como extensión con la API de Dandelion, un SaaS de NLP (procesamiento del lenguaje natural).

Como no es mi intención ahondar sobre lo que es una entidad y para qué sirven en SEO, os dejo un post de Natzir Turrado donde justamente habla sobre esto: Qué son las entidades y su implicación en el SEO. Pero de manera breve digamos que las entidades relacionan de manera semántica el contenido de una página web. Es decir, que son un apoyo o complemento a las palabras clave, y su inclusión en el contenido dota de mayor contexto semántico al mismo.

¿Cómo funciona el extractor de entidades?

Es muy simple, una vez instalada la extensión, lo primero que tenéis que hacer es ir a la página de registro de Dandelion y abrir una cuenta gratuita. Con ella podréis consumir 1000 unidades diarias de la API sin pagar nada.

Una vez que tengáis el token, lo guardáis en la configuración de la extensión y nada más, ya la tenéis lista para sacar las entidades de las URLs de la competencia.

Después, cuando queráis extraer las entidades de una SERP, solo tenéis que hacer clic en el icono de la extensión y automáticamente extraerá el top 10 de entidades de cada resultado orgánico con respecto a su contenido. Pero esto no es todo, ya que he pensado que sería bueno ponderar las entidades extraídas en base a la posición de la URL, aplicando un multiplicador y después sumando las apariciones de dicha entidad a lo largo de la SERP.

Extractor de entidades para SEO

Con los resultados obtenidos se muestra una tabla en forma de barra representando el peso global de cada una de las entidades extraídas y la posibilidad de exportar los datos a un archivo CSV para un examen más minucioso.

CSV entidades SEO

Para que podáis ver cómo funciona la herramienta he publicado este vídeo:

Y aquí tenéis el enlace para instalarla: https://chrome.google.com/webstore/detail/extractor-de-entidades/abngfjnmaobeaaheapakabhdoapfopdi

¡Espero que os sea de utilidad!

 

60 comentarios en «Extractor de entidades para SEO»

    • I could implement many more things: classification, similarity,… But perhaps it would leave the scope of an extension and would become an external application (as there are hundreds already)

      Responder
  1. Felicitarte por el post primeramente, comentarte que no he podido probar la extensión de chrome porque intento darme de alta en Dandelion pero no me envian el correo de confirmación y no puedo conseguir la Api. ¿Alguien puede pasarme su token para poder instalar la extensión? gracias

    Responder
  2. No sé si seré el único, pero cuando le doy a “Exportar a CSV” no ocurre absolutamente nada. ¿Será mi navegador o un problema de la extensión?

    Por cierto, muy buena herramienta 🙂

    Responder
  3. Hola Fede

    Muchas gracias y felicitaciones por este post, me ha resultado de gran utilidad.

    He descargado la extensión, he visto que funciona muy bien pero en el caso de algunos sitios entre los cuales se incluye el mio he visto el siguiente error:

    “error.badGateway: Connection error, unable to download the web page”

    En un sitio de mi competencia he visto el siguiente error:

    “error.badGateway: Unable to download the web page, request got HTTP error code: 403”

    ¿Tienes idea de por que puede estár ocurriendo esto? ¿Puede estar ocurriendo que Google no pueda acceder tampoco a la ENTIDADES tal como ocurre con la extensión?

    Saludos…

    Responder
    • Hola, Pablo. No, los errores provienen de la API de Dandelion. Es su herramienta la que por alguna razón no puede acceder a algunas URLs. No tiene nada que ver con Google, el navegador, etc.

      Responder
  4. Me ocurre lo mismo, estaba dándole vueltas a porqué todas mis webs aparecen con el error mientras el resto se ven bien. El caso es que son webs alojadas en distintos servidores, con lo cual no debe ser nada relacionado con el cortafuegos del server o algo así.

    En las que tengo cloudflare por medio, me aparece como entidad ‘Ricoh_2A03’, ‘ Robot’ y ‘Captcha’. Ahí si que debe ser algo relacionado con la protección, pero en las otras no entiendo el continuo ‘error.badGateway’ 🙁

    Responder
  5. ¿Sigue funcionando el extractor de entidades?

    Ahora mismo no me extrae nada para ninguna búsqueda cuando hasta hace unos días todo iba perfecto. He reinstalado la extensión y cambiado la API de Dandelion por si fuese este el problema, pero nada.

    ¿Podéis confirmarme si os va bien para saber si es problema mío o no?

    Ah! y gracias Fede por compartir tus herramientas. Eres un crack.

    Responder
  6. Buenos días, por favor, a ver si me podéis ayudar. He instalado la extensión. Me he registrado en Dandelion y he ido a la opción Dashboard para copiar el token. Lo he guardado en la extensión, pero cuando hago una búsqueda en Google y pulso el botón de la extensión no ocurre nada. Me parece un extensión muy útil y me gustaría usarla. A ver si alguien puede ayudarme, gracias.

    Responder
    • Hola, Alonso. Solo es posible hacer el análisis en la SERP, sin embargo puedes llegar a conseguir algo similar a lo que quieres haciendo uso del comando site: y el operador OR. Por ejemplo para analizar URL1 y URL2: site:url1 OR site:URL2

      Responder

Deja un comentario

 Acepto la política de privacidad