Algoritmo de Google: todo lo que necesitas saber sobre la organización de la web

algoritmo de Google

Cada usuario de Internet de alguna forma u otra conoce el algoritmo de Google. Ese buscador de tesoros virtuales detrás de una barra para introducir texto, al que acudimos prácticamente todos los días del año.

Sin embargo, son pocos los que pueden definir de forma acertada de qué se trata y cuáles son sus funciones dentro de la web. Sin duda alguna, todo lo que estás por descubrir sobre este sistema te sorprenderá, sobre todo si estás buscando introducirte en el universo SEO.

La palabra algoritmo arropa el concepto de una fórmula matemática, conjunto de operaciones sistemáticas, instrucciones, reglas o pasos que pueden descifrarse y aprovecharse para realizar cálculos y hallar la solución a determinados planteamientos.

En este sentido, el algoritmo de Google, a grandes rasgos, se encarga de establecer conexiones para posicionar a millones de páginas webs en el buscador de la compañía. Se trata de una tarea imposible de realizar sin la ayuda de este sistema, el cual es modificado por los ingenieros expertos de la compañía más de cien veces en un año, dado el ritmo con el que los contenidos en Internet son capaces de transformarse y multiplicarse.

¿Qué es el Algoritmo de Google?

El algoritmo de Google es en realidad una familia que agrupa fórmulas de distintos géneros bajo el nombre de ‘PageRank’. El algoritmo confía en la naturaleza democrática de Internet, asignando a cada página web un número, valor o clasificación en función de sus enlaces con otras páginas, la calidad de su contenido y los criterios de cada búsqueda particular.

De esta forma, el algoritmo o la familia de algoritmos determina de modo numérico la importancia  de las páginas webs indexadas al motor de búsqueda.

El surgimiento del algoritmo de Google como lo conocemos hoy se remonta al 2004, luego que los fundadores de Google, Larry Page y Serguéi Brin, previamente inspirados por el modelo del Science Citation Index (SCI) de Eugene Garfield, asistieran a la conferencia de un joven genio italiano llamado Massimo Marchiori, quien terminó de darle forma a la idea primitiva de un orden en la web.

Marchiori, matemático e informático teórico, exponía las propiedades de un nuevo algoritmo que permitiría a los buscadores de antaño adoptar funciones dialogantes con los usuarios. Google contaba apenas con 6 años en aquel entonces y esta era la oportunidad perfecta para expandirse.

Con el Internet creciendo de manera incontrolable, haciendo imposible la validación de información de forma manual, era vital implementar una solución para rastrear contenidos, crear clasificaciones temáticas e interacciones entre páginas.

Page y Brin ya tenían claro este concepto de llevar orden a la web en 1999, cuando publicaron un documento que iniciaría el cambio de la realidad económica y social de la humanidad: “The PageRank Citation Ranking: Bringing Order to the Web”

La importancia de una página web es un problema inherentemente subjetivo que depende del interés de los lectores, de su conocimiento y de sus inclinaciones. Aun así, se puede decir objetivamente mucho sobre la importancia relativa de las páginas web. Este artículo describe PageRank, un método para valorar las páginas web de forma objetiva y mecánica, midiendo de forma efectiva la atención e interés humanos dirigidos hacia cada página. Comparamos PageRank con un “web surfer” aleatorio idealizado. Mostramos como calcular de forma eficiente el PageRank para un número grande de páginas y mostramos cómo utilizar el PageRank para la búsqueda y navegación de los usuarios”.

Page y Brin quedaron fascinados con este concepto, que sin duda transformaría para siempre el Internet, marcando un antes y un después en lo que a buscadores se refiere. Ambos ejecutivos se acercaron a Marchiori y le hicieron saber que tenía una gran idea en sus manos y que pensaban desarrollarla dentro de su motor de búsqueda a gran escala al llegar a Stanford.

Marchiori, lejos de monetizar su idea, cedió sus teorías y planteamientos a Page y Brin, pues vivir de las rentas de una determinada empresa no era lo que deseaba hacer con su vida. Actualmente, el responsable de este gran invento trabaja como profesor de informática en la Universidad de Padua, en Italia, y forma parte del equipo de investigación del Computer Science and Artificial Intelligence Laboratory (CSAIL) del Instituto Tecnológico de Massachusetts (MIT).

Se debe aclarar que Page y Brin, por su parte, tampoco pretendían convertirse en los empresarios multimillonarios que son hoy: sus aspiraciones se inclinaban más hacia el ámbito académico. Sin embargo, su suerte fue diferente y la frustración de no encontrar un comprador para Google en Silicon Valley (incluso fue rechazada por Yahoo!) los llevó a sacar adelante un proyecto que ha beneficiado a todo el planeta.

Gracias a esta plataforma, ahora es posible el acceso a cualquier tipo de información en tiempo real, cuyo funcionamiento resulta más complejo a medida que surgen nuevas herramientas tecnológicas.

Cómo funciona el algoritmo de Google

El equipo de Mountain View explica, a través de una web interactiva, cada proceso individual que ocurre desde que un usuario teclea palabras en la barra de búsqueda hasta que la información aparece desplegada en la página de resultados.

Según Page, “el perfecto motor de búsqueda entendería exactamente qué es lo que quieres decir y darte exactamente lo que buscas”.

Google distingue varias fases en el funcionamiento del algoritmo:

✅ La primera fase, conocida como crawling, lo que se traduce literalmente como “gateo”, consiste en el rastreo en fracciones de segundo a través de más de 30 billones de páginas webs existentes.

Después de “gatear” a través de los sitios cuyos códigos permiten este procedimiento, Google clasifica las páginas según contenido y otros factores, dependiendo de los resultados de la monitorización de cada web indexada.

Además de páginas webs, Google también rastrea o “gatea” a través de portales con contenido del mundo real, por ejemplo, textos procedentes de libros y ubicaciones geográficas.

✅ En la segunda fase del proceso que lleva a cabo el algoritmo, denominada Search algorithms, Google activa varias fórmulas para ofrecer los resultados más acertados al usuario, de acuerdo con su elección de palabras al realizar la búsqueda.

Esta fase pretende “entender” lo que el usuario busca y su tarea es autocompletar la frase o palabra dispuesta, buscando sinónimos o preguntas relacionadas.

Estas pistas permiten al buscador extraer documentos, gráficos, vistas previas, noticias, respuestas de consultas, vídeos, imágenes y todo lo que sea relevante de entre todos los resultados obtenidos.

✅En la tercera fase, Useful responses, el algoritmo se dedica a descartar el contenido poco valioso y eliminar el spam, de forma automática, lo que permite además identificar webs fraudulentas cada segundo.

AdWords: qué es, para qué sirve y cómo aprovecharlo

La publicidad online dentro de Google se beneficia del algoritmo y  se denomina AdWords, término que hace referencia al programa publicitario de la compañía a través del cual puedes crear anuncios para llegar a más usuarios que podrían estar interesados en los productos y servicios que ofreces en Internet.

Por tanto, Google AdWords cuenta con herramientas para promocionar una empresa, ayudar a vender, aumentar relevancia de los contenidos e incrementar el tráfico de un sitio web.

No existe compromiso de inversión mínima y cada empresa o emprendedor puede controlar su presupuesto, eligiendo dónde aparecen sus anuncios y evaluando el impacto de los mismos.

La plataforma de Google AdWords está dividida en una red de búsqueda, conformada por sitios de Google o webs asociadas a él, y una red “display”, que reúne más de un millón de páginas webs, vídeos y aplicaciones, también asociadas a la compañía.

Estas dos corrientes permiten crear anuncios de texto, gráficos o de vídeo a través de cualquiera de los sitios dispuestos por Google, pagando solo por los clics obtenidos. Podrás identificar los mismos en los laterales de la página de resultados cuando realizas una búsqueda.

Para realizar una campaña desde la red de búsquedas, lo primero es configurarla indicando el presupuesto, la segmentación geográfica y el idioma en el que está diseñada. Lo siguiente es crear los anuncios en la plataforma de  AdWords, introduciendo keywords para posicionar el contenido cuando algún usuario realice una búsqueda con las palabras relacionadas.

Por otra parte, para realizar una campaña en la red display se deben contemplar algunos puntos adicionales: la forma de orientar los anuncios y los tipos que se pueden crear. En este sentido, Google no solo permitirá el uso de palabras clave, sino también otros métodos de posicionamiento como temas o ubicaciones específicas.

Si anteriormente solo podías crear anuncios con texto, la red display pone a disposición del anunciante herramientas para campañas con gráficos y vídeos.

Google AdWords proporciona a las empresas un conjunto de estadísticas sobre sus anuncios que pueden ser aprovechadas para optimizar sus campañas, obteniendo un beneficio cada vez mayor. Así mismo, se puede medir el ROI (retorno de la inversión) mediante el seguimiento de conversaciones.

Resulta una plataforma económica, ya que pagar por cada clic podría ser equivalente a pagar por cada cliente potencial o usuario interesado en los productos o servicios. Si los anuncios están bien orientados, gracias a las palabras claves, los temas o las ubicaciones, es más probable que estos lleguen a personas cuyos intereses se relacionan con la empresa.

Algoritmos Open Source: el debate sobre la transparencia

Aunque tengamos nociones de cómo funciona el algoritmo de Google, lo cierto es que las recetas y los criterios que utilizan para filtrar y ordenar la información en Internet siempre serán secretos, celosamente guardados.

¿Deberían revelar, además de los estudios que propician los datos encontrados en las búsquedas, qué hace realmente el algoritmo? Son muchas las personas que defienden el concepto de la “transparencia” del algoritmo, así como la filosofía del software libre y manipulable.

Sabemos que Google domina las búsquedas en Internet, por encima de Yahoo!, Bing y Baidu, desde hace varios años. A nivel global, las cifras son inequívocas: 9 de cada 10 búsquedas se realizan desde Google.com o en sus versiones nacionales, lo que hace que la empresa se reserve cada vez más la información sobre qué parámetros influyen realmente en el algoritmo.

¿Qué hace que un resultado aparezca por encima de otro? A pesar de que han existido intentos como el del Senado Francés por obligar a Google a revelar sus criterios de posicionamiento para inspeccionar el código y regular el terrero de las telecomunicaciones, lo cierto es que la compañía sigue apegándose a una aparente “neutralidad” de Internet, es decir, la filosofía que pretende evitar que se apliquen políticas o líneas editoriales en la organización de contenidos de la web.

La idea es que el algoritmo de Google no pueda ser manipulado por factores externos con intereses económicos de por medio.

Por otro lado, a pesar del hermetismo del gran algoritmo de Google, la compañía sí que ha puesto a disposición de los usuarios otros proyectos Open Source o de código abierto, los cuales pueden utilizarse y modificarse con total libertad, ya que no están sujetos a licencias.

La web de Google Open Source cuenta con más de 2.000 proyectos que antes eran muy difíciles de encontrar, sencillamente porque nadie sabía cómo se llamaban. En esta plataforma encontramos herramientas como el algoritmo de compresión de imágenes de Google, Guetzli, el cual permite optimizar imágenes JPEG para hacerlas un 35%  más ligeras, sin alterar su calidad.

Panda: cómo cambió el algoritmo de Google

Esta modificación afecta principalmente el mecanismo de clasificación de resultados dentro del algoritmo central de Google, la misma se introdujo el 23 de febrero de 2011.

Panda, nombre que proviene del ingeniero de Google Navneet Panda, desarrollador de la tecnología que hizo posible para la compañía la implementación del algoritmo, se centra en el contenido de calidad y en beneficiar a los sitios webs con informaciones más útiles e interesantes para los usuarios, situándolos de primeros en los resultados de búsquedas.

Es así como Panda aumentó significativamente el ranking de páginas de noticias y algunos perfiles en redes sociales, mientras que disminuía la clasificación de los portales con grandes cantidades de publicidad y contenidos que no alcanzaban el umbral de calidad requerido, según informa CNET.

Por otro lado, Google Panda penaliza a las páginas webs cuyo contenido es considerado de baja calidad, demasiado corto, con fallas en el tratamiento del lenguaje o duplicado en algunas páginas, pues el objetivo es cuidar la organización de las URLS y evitar que se hable de exactamente lo mismo en varias páginas.

Google Panda penaliza a las páginas webs cuyo contenido es considerado de baja calidad Clic para tuitear

Google Panda le otorga un gran peso al contenido, es por eso que si estás en el mundo SEO, definitivamente debes tener en cuenta la extensión, la calidad, la redacción, el valor y nivel de la información, su relación con la temática de tu sitio web y su aporte real a los usuarios.

En este sentido, el líder de webspam en Google, Matt Cutts, advierte que reescribir contenido duplicado de modo que parezca “original” no hace que pase desapercibido por Panda si la reescritura no aporta valor adicional a la información.

Tras la implementación de Google Panda, muchos sitios webs dispararon sus quejas contra la compañía por las infracciones de derechos de autor, así como las denuncias de otros sitios scrapers, es decir, páginas que copian contenidos de otras utilizando el web scraping.

Es por esto que Google proporcionó a los creadores de contenido una guía de auto-evaluación de calidad con 23 puntos clave para responder a la pregunta de si un sitio realmente cuenta con información valiosa, útil y comprensible para los usuarios.

Google Panda

Fuente: Dean Romero

Preguntas a ver si tu Sitio Web Pasa la Prueba de Google Panda Clic para tuitear

Penguin: la otra cara de Google Panda

Si bien Google Panda se enfoca en el valor del contenido disponible en Internet, Google Penguin cuida la calidad de los enlaces. Ambas versiones del algoritmo de Google coinciden en la búsqueda de desplegar páginas webs en el top de los resultados de Google que realmente puedan aportar información valiosa a los usuarios.

Esta actualización del algoritmo fue lanzada el 24 de abril de 2012, dando lugar a un verdadero azote para las páginas webs que ya se habían adaptado a los cambios introducidos por Panda.

Estas webs volvieron a caer en picada por la rigurosidad del algoritmo de Google, el cual consideraba los contenidos con gran cantidad de enlaces como de mala calidad, restándoles importancia en los resultados de búsquedas. El propósito es identificar de forma aún más eficiente el spam.

Google Penguin definitivamente introdujo grandes cambios en las estrategias SEO, pues comenzaron a privilegiarse los contenidos con enlaces naturales, relacionados con nichos de la temática del sitio web,  y variedad de anchor texts: calidad por encima de cantidad.

La introducción de esta actualización, según las propias estimaciones de Google, afectó aproximadamente el 3.1% de las búsquedas en Inglés y el 3% de las búsquedas en Alemán, Chino, Árabe  y otras lenguas altamente “spameables”.

La clave para sobrevivir a esta cara del algoritmo es seguir al pie de la letra las directrices de Google en cuando a la producción de enlaces de forma masiva en un sitio web. Estos planteamientos podrás encontrarlos en los Google Websmaster Tools.

Google Penguin

Fuente: Brafton

Hummingbird: el qué, cómo y por qué de un nuevo algoritmo de Google

Lanzado a finales de agosto de 2013, Hummingbird o colibrí es el último algoritmo de Google que introdujo cambios significativos al buscador.

El mismo fue diseñado para analizar la búsqueda semántica y el knowledge graph, la base empleada por Google para mejorar los resultados del motor de búsqueda mediante la información semántica recolectada con una amplia gama de recursos.

Al contrario que Panda, Google Hummingbird, sucesor de Google Caffeine en cuanto al análisis de las palabras, está muy lejos de ser una actualización: se trata de un algoritmo completamente nuevo que usa engranajes de algoritmos antiguos e introduce técnicas nuevas.

Google Hummingbird afectó con su llegada el 90% de las búsquedas en todo el mundo, mejorando notablemente las interacciones a nivel conversacional, es decir, que ahora con menos palabras puedes acceder a resultados específicos.

Hummingbird va más allá que cualquier otra fórmula del principal algoritmo de Google: busca identificar la intención detrás de cada búsqueda, y es que recibe su nombre precisamente por la rapidez y la precisión de los colibrís.

Si antes el buscador desplegaba resultados en concordancia con una serie de keywords y sinónimos, gracias a Hummingbird se abre un abanico más amplio de posibilidades que se traduce en búsquedas mucho más precisas, geoposicionadas y variables.

Por consiguiente, la fortaleza de Google Hummingbird  está en entender lo que el usuario pregunta para ofrecer resultados más acordes, filtrando la información incluso según la ubicación del usuario: buscar menos y vivir más.

Por su parte, Amit Singhal, vicepresidente senior de búsquedas en Google en 2013, aclaró a CNBC que Hummingbird cumple con el esfuerzo de la compañía por ofrecer resultados de búsquedas que realmente se adapten a la realidad que viven los usuarios gracias a las nuevas tecnologías disponibles:

“Recuerdas cómo era hacer una búsqueda en 1998? Te sentabas en tu inmensa y ruidosa computadora, tecleabas algunas keywords y obtenías 10 links azules a páginas webs que tuvieran esas palabras. El mundo ha cambiado mucho desde entonces: billones de personas utilizan el Internet, la web ha crecido de forma exponencial y ahora puedes hacer cualquier pregunta desde un pequeño y poderoso dispositivo que llevas constantemente en el bolsillo”, apunta Singhal.

Ahora puedes hacer cualquier pregunta desde un pequeño y poderoso dispositivo Clic para tuitear

El porqué de que exista Google Hummingbird solo puede hallarse en la evolución del Internet de la mano de los dispositivos móviles.

Si antes realizábamos las búsquedas de una forma “básica”, colocando algunos caracteres en la barra de Google, ahora los smartphones permiten realizar búsquedas a través de la voz.

Los motores de búsquedas deben comenzar a aprender qué es lo que realmente se está preguntando, algo que solo puede lograrse con una reinterpretación del lenguaje. Aunque esto podría parecer muy sencillo en tiempos de asistentes virtuales e inteligencia artificial, Google lleva varios años desarrollando este tipo de búsquedas.

Google Hummingbird

Fuente: seiho.es

También te puede interesar leer:

Summary
¿Qué es el Algoritmo de Google y Para Qué Sirve?
Article Name
¿Qué es el Algoritmo de Google y Para Qué Sirve?
Description
La palabra algoritmo arropa el concepto de una fórmula matemática, conjunto de operaciones sistemáticas, instrucciones, reglas o pasos que pueden descifrarse y aprovecharse para realizar cálculos y hallar la solución a determinados planteamientos. En este sentido, el algoritmo de Google, a grandes rasgos, se encarga de establecer conexiones para posicionar a millones de páginas webs en el buscador de la compañía.
Author
Publisher Name
Agencia de Publicidad Fusiona2
Publisher Logo
María Gabriela Vignati
María Gabriela Vignati
Artista, fotógrafa, escritora -amateur- y lectora profesional. Entusiasta de contar historias.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *