domingo, 13 de mayo de 2007

• La Historia del Nacimiento de Google

Una de las historias que más me gustan de Internet es la del nacimiento de lo que hoy es Google.

Todo comenzó con una discusión

Larry Page y Sergey Bring (los fundadores de Google, uno de Michigan y otro de Rusia respectivamente) sabían en lo que se metían cuando fueron aceptados en la Universidad de Stanford reconocida por su excelencia académica y lucro corporativo. Los estudiantes no llegan a Stanford solo por su formación académica. Llegan para cumplir un sueño: fundar su propia compañía, hacerse ricos y dejar su huella en la historia de la tecnología. Después de todo esta universidad fue la que engendró grandes compañías como Silicon Graphics yahoo, Excite y Hewlett-Packard, por nombrar solo algunas.
Page conoció a Bring en las calles de San Francisco donde este ultimo servia como estudiante guía enseñando la ciudad a grupos de posibles estudiantes primíparos invitados por la universidad como Page.
Por algunos días mientras paseaban por las famosas colinas de la ciudad solían discutir de temas tecnológicos que acabaron por unirlos y por aceptar la oferta de Stanford por parte de Page.


Larry Page y Sergey Brin, fundadores de Google

Un enlace es una recomendación, ¿Quién me esta recomendando?

Luego de un año de estudios Page comenzó a buscar un tema que pudiera resultar fructífero para su tesis Doctoral en la facultad de ciencias de la computación. Estuvo meditando sobre unas diez posibles ideas interesantes, pero se vio atraído por el floreciente mundo de la World Wide Web. Larry Page descubrió que la red era interesante principalmente por sus características matemáticas.
Cada ordenador era un nodo y cada enlace a una página web era una conexión entre nodos. Larry emprendió así la tarea de analizar la estructura de esta red compuesta de enlaces. Rápidamente entendió que resultaba algo muy trivial seguir los enlaces de una página a otra, pero que no era tan trivial descubrir los enlaces de vuelta. En otras palabras, cuando visitamos una determinada pagina web, podemos saber esta a donde nos conduce haciendo clic sobre sus enlaces pero no tenemos la menor idea que paginas enlazan de vuelta a ella. Esto fue lo que inquietaba a Page, que pensó que resultaría muy útil saber quien enlazaba con quien. Después de todo, es posible que personas muy importantes estén enlazadas con nosotros y, si fuera así ¿acaso no nos gustaría saberlo? ¿Qué pasaría si uno de los sitios más visitados de la red tuviera un enlace a alguna de nuestras paginas que -dijera este es el sitio más horrible de Internet-? Si Page fuera capaz de crear una herramienta que permitiera a los sitios descubrir y mostrar fácilmente los enlaces recibidos, la red se convertiría en algo mucho más interesante.

¿Por qué seria una buena herramienta?

La respuesta a esa pregunta se encuentra en el mundo de las publicaciones académicas. Para los profesores (especialmente para aquellos que se dedican a las ciencias puras como las matemáticas o la química) no hay nada más importante que conseguir publicar un trabajo (investigación). Los artículos publicados se convierten en la tarjeta de presentación de un académico, (como una pagina web) un currículo viviente.
Estas mismas publicaciones académicas fueron construidas y estructuradas con base a otras investigaciones realizadas por compañeros en su campo. Aquí entra en juego el concepto de la citación (pie de página en escritos, enlaces en la web).
Los académicos elaboran sus artículos sobre la creación meticulosa de una base de citas, así cada articulo llega a una conclusión citando como prueba artículos publicados con anterioridad que apoyan y estructuran el argumento del autor.
El proceso de citación hacia publicaciones paralelas y de otras publicaciones hacia las nuestras otorga categoría y es el concepto clave que refleja la manera en la que opera Google. En otras palabras la importancia de un artículo se puede calcular averiguando cuántos artículos enlazan con él por medio de una cita. La investigación de Larry Page lo llevo a pensar que toda la red se basa en la premisa de la citación ya que un enlace de una página web no es más que una cita. Si pudiera encontrar un método para contar y calificar cada uno de los enlaces entrantes de la red, entonces Internet se convertiría en un lugar muy valioso.

BackRub el antecesor de PageRank

Así nació BackRub el proyecto de tesis de Larry que consistía en desarrollar un sistema que fuera capaz de descubrir enlaces en la red, almacenarlos para su posterior análisis y, a continuación, volverlos a publicar de tal manera que cualquier persona pudiera ver que pagina estaba enlazada con otra pagina en la red. Una idea ambiciosa a cualquier escala, pero Page no se había propuesto que BackRub funcionara sobre una pequeña serie de páginas de prueba. En su lugar pensó a lo grande: ¿Por qué no solucionar el problema de una vez para toda la World Wide Web?
En 1995 Larry empezó a crear su rastreador el cual debía almacenar solo los enlaces (no el contenido de toda la red), los cuales se calculaba que para ese tiempo eran alrededor de 100 millones, y entre más esperaba este número más crecía.
La complejidad y la escala de este proyecto fue lo que atrajo la atención de Sergey Brin. Brin pensó que la premisa que encerraba BackRub era fascinante.
Rastrear toda la red para descubrir la suma de sus enlaces es una tarea importante, pero la verdadera innovación de BackRub no estaba en el simple rastreo. Page conocía perfectamente el concepto de clasificación que se utilizaba en las publicaciones académicas. La citación es el concepto bajo el cual se desarrollaría BackRub para que este reconociera la importancia de un sitio web de acuerdo a cuantos enlaces en toda la red apuntaban hacia dicho sitio.



Una vez que Larry y Sergey hubieran rastreado la red y elaborado así un grafico de quien enlaza con quien, necesitarían determinar un método de clasificación.
Inspirado por el análisis de citas, Page pensó que un conteo puro de enlaces a una página sería una guía útil para establecer la clasificación de esa página. También pensó que cada enlace necesitaba su propia clasificación, basándose en el recuento de enlaces y la importancia de la página que lo originaba. Este método presentaba un problema difícil y recursivo. De repente las matemáticas se habían complicado considerablemente.
Afortunadamente las cualidades de Brin para las matemáticas se podrían aplicar para solucionar el problema.
Sergey Brin nació en Rusia y es hijo de un científico de la NASA (su madre) y de un profesor universitario de matemáticas (su padre), emigro a los Estados Unidos a la edad de 6 años.

Trabajando conjuntamente, Page y Brin crearon un sistema de clasificación que favorecía a los enlaces que procedían de fuentes importantes y penalizaba aquellos que no lo eran.
Por ejemplo, muchos sitios enlazaban con IBM.com. Esos enlaces podrían abarcar desde un socio comercial del sector tecnológico (Intel por ejemplo) hasta un usuario adolescente que enlazo su pagina con IBM porque estaba contento de su nueva computadora. ¿Cómo podría un algoritmo clasificar la importancia entre estos dos enlaces? Para un observador humano el socio empresarial es un enlace mucho más importante, teniendo en cuenta el lugar que ocupa IBM en el mundo. ¿Pero como puede un algoritmo entender ese hecho?
La respuesta fue lo que hoy llamamos PageRank llamado así en honor a Page, que es un algoritmo capaz de juzgar según la calidad de los enlaces de entrada de un sitio web la importancia del mismo.
En la actualidad la forma como opera este algoritmo es un secreto muy bien guardado por Google. Pero lo cierto es que en sus inicios cuando Larry y Sergey jugaban y hacían pruebas (entre callejones matemáticos sin salida) con este algoritmo, se dieron cuenta que tenían algo entre manos que podría tener consecuencias para la búsqueda en Internet. De pronto sin darse cuenta ya habían dado el salto en la creación de un motor de búsqueda en Internet que ofrecía resultados más pertinentes que los que podían ofrecer motores de búsqueda tradicionales como Altavista y Excite.

El algoritmo PageRank se convirtió en la base de la salsa secreta de Google.
Larry y Sergey se dieron cuenta de que aplicando PageRank a un motor de búsqueda, la utilidad de este escalaría a medida que creciera la red ya que PageRank funcionaba analizando enlaces, de tal modo que cuanto más grande se hiciera le red, mejor y más pertinentes serian los resultados del motor.

Nació Google

Este hecho inspiro a los fundadores a nombrar su nuevo motor de búsqueda Google, haciendo referencia a la palabra googol, el termino anglosajón usado para designar al numero 1 seguido de 100 ceros. La primera versión de lo que hoy es Google fue publicada en la página web de Stanford en agosto de 1996.

1 comentario:

Anónimo dijo...

Muy interesante. Y pensar que cuando nacieron los ví con escepticismo y algo de resistencia, ya que era fiel seguidor de yahoo.

Y mire usted, ya casi todo lo que usamos es de google. Hasta susto dá.