La evolución de los motores de búsqueda
Los orígenes de Excite se remontan a febrero de 1993, cuando a seis estudiantes universitarios de Stanford se les ocurrió la idea de buscar de manera más eficiente en grandes cantidades de información en Internet mediante el análisis de las relaciones entre palabras. A mediados de 1993, el proyecto estaba totalmente financiado y lanzaron una versión del software de búsqueda para que los webmasters lo usaran en sus propios sitios, que se conoció como Excite for Web Servers.
Nota: Excite pasó a conocerse posteriormente como búsqueda de conceptos y fue adquirida por Infospace en mayo de 2002. Excite dejó de utilizar su propio motor de búsqueda y pasó al metabuscador Dogpile
2. En abril de 1994, dos estudiantes de doctorado de la Universidad de Stanford, los chino-estadounidenses Jerry Yang y David Philo****, cofundaron Yahoo. A medida que crecía el número de visitantes y enlaces indexados, el Directorio de Yahoo comenzó a admitir búsquedas simples en bases de datos. Debido a que los datos de Yahoo se ingresan manualmente, en realidad no se pueden clasificar como un motor de búsqueda y en realidad es solo un directorio en el que se pueden realizar búsquedas. Cuando Yahoo incluye sitios web, incluye información breve, por lo que la eficiencia de la búsqueda mejora significativamente.
Nota: Altavista, Inktomi y Google seguirán proporcionando servicios de motor de búsqueda en el sitio web de Yahoo.
Yahoo: casi sinónimo de Internet en los años 1990.
3. En 1995, apareció una nueva forma de motor de búsqueda: Meta Search Engine. Los usuarios solo necesitan enviar una solicitud de búsqueda, y el metabuscador será responsable de la conversión y el procesamiento antes de enviarla a múltiples motores de búsqueda independientes preseleccionados. Todos los resultados de la consulta serán devueltos por los motores de búsqueda independientes y luego devueltos al usuario. después del procesamiento centralizado.
El primer metabuscador fue Metacrawler, diseñado por Eric Selberg y Oren Etzioni, estudiantes de maestría en la Universidad de Washington. Era excelente en concepto, pero los resultados de la búsqueda nunca fueron ideales, por lo que el metabuscador nunca funcionó. estado apagado.
4. Generación de búsqueda inteligente: utiliza diccionario de segmentación de palabras, diccionario de sinónimos y diccionario homófono para mejorar el efecto de búsqueda. Además, también puede ayudar en consultas a nivel de conocimiento o concepto a través del diccionario de materias. , diccionario de contexto, los diccionarios homólogos relacionados se recuperan y procesan para formar un sistema de conocimiento o una red de conceptos, brindando a los usuarios consejos de conocimiento inteligentes y, en última instancia, ayudándolos a obtener los mejores resultados de búsqueda.
Ejemplo:
(1) Consulta "computadora", y también puedes recuperar información relacionada con "computadora"
(2) Puedes expandir más; el alcance de la consulta Reduzca a "microcomputadora", "servidor" o amplíe el alcance de la consulta a "tecnología de la información" o consulte categorías relacionadas como "electrónica", "software", "aplicaciones informáticas";
(3) También incluye información ambigua y procesamiento de recuperación, como "Apple", ya sea que se refiera a una fruta o una marca de computadora, "Chino" y "República Popular China" se procesarán a través de una biblioteca de descripción de conocimientos de desambiguación, indexación de texto completo, recuperación del usuario análisis del contexto y relevancia del usuario Procesamiento integral de comentarios y otras tecnologías para retroalimentar de manera eficiente y precisa la información que los usuarios más necesitan.
5. La tendencia a la personalización es una de las características importantes y tendencias inevitables del desarrollo futuro de los motores de búsqueda. Una forma es organizar la información personal a través de productos comunitarios de motores de búsqueda (es decir, brindar servicios a usuarios registrados) y luego introducir factores personales en la base de datos de información básica del motor de búsqueda para su análisis y obtener diferentes resultados de búsqueda para individuos. Desde que Yahoo lanzó la versión beta de myweb en octubre de 2004 y a9 lanzó la función de personalización en noviembre de 2005, el proceso de desarrollo de la búsqueda de Google ha sido básicamente completo, analizando las necesidades de búsqueda de usuarios específicos para limitar el alcance de la búsqueda y luego de acuerdo con a las necesidades del usuario El alcance se extiende a otros sitios web similares en Internet, dando los resultados más relevantes. El otro es el motor de búsqueda personalizado de Google para las masas, o yahooMindSet, o vivisimo, que todos conocemos como pre-clustering.
Pero no importa cuál de estas implementaciones sea, es decir, la selección activa del alcance de búsqueda por parte de Google, o la reorganización de la información que necesitan en los resultados por parte de Yahoo y Vivisimo, es un intento o una idea, y no se convertirá en la corriente principal de motores de búsqueda en productos de aplicación a corto plazo.
6. Tecnología de red (cuadrícula global): dado que no existe un estándar de organización de información unificada para procesar recursos de información de red, los recursos de información de red desordenados son difíciles de recuperar, intercambiar y compartir en profundidad. Islas de información. La tecnología Grid tiene como objetivo eliminar las islas de información y lograr una conexión integral de todos los recursos en Internet.
Cuadrícula de información global
Para los programadores, la palabra robot tiene un significado especial. Un robot informático es un programa automático que puede realizar tareas que los humanos no pueden. La velocidad que se logra al realizar una tarea repetidamente; . Los robots de los motores de búsqueda se llaman arañas porque están diseñados específicamente para recuperar información y se arrastran por la web como una araña.
En 1993, Matthew Gray desarrolló el primer programa "robot", World Wide Web Wanderer, que utilizaba enlaces entre páginas web HTML para detectar el tamaño de la World Wide Web. Inicialmente solo se usaba para contar el número de servidores en Internet, pero luego también fue capaz de capturar direcciones web (URL).
En abril de 1994, dos estudiantes de doctorado de la Universidad de Stanford, los chino-estadounidenses Jerry Yang y David Philo****, cofundaron Yahoo con el aumento del número de visitantes y de enlaces que contenía, As it. creció, el directorio comenzó a admitir búsquedas simples en bases de datos. Debido a que los datos de Yahoo se ingresan manualmente, en realidad no se pueden clasificar como un motor de búsqueda y en realidad es solo un directorio en el que se pueden realizar búsquedas. Yahoo adquirió inktomi el 23 de diciembre de 2002, Overture (incluidos Fast y Altavista) el 14 de julio de 2003 y adquirió por completo 3721 Corporation en noviembre de 2003.
A principios de 1994, Brian Pinkerton, un estudiante de la Universidad de Washington, inició su pequeño proyecto: WebCrawler. El proyecto se lanzó oficialmente el 20 de abril de 1994 y solo contenía contenido de 6.000 servidores. WebCrawler es el primer motor de búsqueda de texto completo en Internet que admite la búsqueda del texto completo de los documentos. Antes de esto, los usuarios solo podían buscar por URL y resumen, que generalmente provenía de anotaciones manuales o de un programa que obtenía automáticamente las primeras 100 palabras; el texto.
En julio de 1994, Michael Mauldin de la Universidad Carnegie Mellon insertó el programa araña de John Leavitt en su programa de indexación para crear Lycos. Además de la clasificación por relevancia, Lycos también proporciona coincidencias de prefijos y restricciones de caracteres. Lycos fue el primer motor de búsqueda en utilizar fragmentos web automáticos en los resultados de búsqueda.
A finales de 1994 se lanzó oficialmente Infoseek. Su interfaz fácil de usar y toneladas de funciones adicionales lo convierten en un motor de búsqueda tan importante como Lycos.
En 1995, apareció una nueva forma de motor de búsqueda: una revisión de los metabuscadores. Los usuarios solo necesitan enviar una solicitud de búsqueda, y el metabuscador es responsable del proceso de conversión, enviándolo a múltiples motores de búsqueda independientes preseleccionados y devolviendo todos los resultados de las consultas de los motores de búsqueda independientes, y luego devolviéndolos al usuario después. procesamiento centralizado. Metacrawler, el primer metabuscador, fue fundado por Eric Selberg y Oren Etzioni, estudiantes de maestría de la Universidad de Washington.
Inktomi fue fundada el 26 de septiembre de 1995 por Eric Brewer, profesor asistente de la Universidad de California, Berkeley, y Paul Gauthier, estudiante de doctorado de la Universidad de California, Berkeley, y se lanzó oficialmente en mayo. 20, 1996. El 20 de mayo se estableció Inktomi y apareció el poderoso HotBot. HotBot afirma rastrear más de 10 millones de páginas por día y, por lo tanto, tiene más contenido nuevo que otros motores de búsqueda, y también hace un uso extensivo de cookies para almacenar las preferencias de búsqueda personales de los usuarios.
En diciembre de 1995, DEC lanzó oficialmente AltaVista, que fue el primer motor de búsqueda que admitía búsquedas en lenguaje natural y el primer motor de búsqueda que utilizaba sintaxis de búsqueda avanzada (como AND, OR, NOT, etc.). Los usuarios pueden utilizar AltaVista para buscar el contenido de grupos de noticias y recuperar artículos de Internet, así como buscar texto dentro de nombres de imágenes, buscar títulos, buscar subprogramas Java y buscar objetos ActiveX. AltaVista también afirma ser el primer motor de búsqueda que admite el envío o eliminación de URL por parte de los propios usuarios a bibliotecas de índices de red, así como el envío o eliminación de URL a bibliotecas de índices de red. AltaVista también afirma ser el primer motor de búsqueda que permite a los usuarios enviar o eliminar URL a la biblioteca de índice web ellos mismos y estar en línea dentro de las 24 horas. Una de las nuevas características más interesantes de AltaVista es la capacidad de buscar todos los sitios web que tienen enlaces a una URL. AltaVista también realizó algunos cambios en su interfaz de usuario. Coloca "consejos" debajo del área del cuadro de búsqueda para ayudar a los usuarios a expresar mejor sus resultados de búsqueda, y estos consejos se actualizan con frecuencia para que después de algunas búsquedas, los usuarios vean muchas cosas que quizás nunca supieron sobre características interesantes. Esta serie de funciones fueron adoptadas gradualmente por otros motores de búsqueda. En 1997, AltaVista lanzó el sistema de visualización gráfica LiveTopics para ayudar a los usuarios a encontrar lo que buscan entre miles de resultados de búsqueda.
En agosto de 1997 apareció oficialmente el motor de búsqueda Northernlight. Era uno de los motores de búsqueda con la base de datos más grande, no tenía palabras vacías, tenía excelentes noticias de actualidad, colecciones especiales de más de 7100 publicaciones, buena sintaxis de búsqueda avanzada y fue el primero en admitir resultados de búsqueda simples. Motor de búsqueda de clasificación automática. .
Antes de octubre de 1998, Google era sólo BackRub, un pequeño proyecto de la Universidad de Stanford. En 1995, el estudiante de doctorado Larry Page comenzó a estudiar diseño de motores de búsqueda y registró el nombre de dominio el 15 de septiembre de 1997. A finales de 1997, a través de Sergey Brin, Scott Hassan y Alan Strindberg. Con la participación de Bahruub, **** comenzó a ofrecer demostraciones. En febrero de 1999, Google completó su transformación de Alfa a Beta. Google celebra el 27 de septiembre de 1998 como su cumpleaños. Google utiliza el ranking de la página (Pagerank) como base para juzgar la importancia de una página web, lo que mejora enormemente la relevancia de los resultados de búsqueda. La cultura geek de Google y la filosofía No seas malvado le han valido a Google una gran reputación y reputación de marca. En abril de 2006, Google anunció que su nombre chino sería "Google". En abril de 2006, Google anunció su nombre chino "Google", que fue el primer nombre chino de Google en un país de habla no inglesa.
Fast (Alltheweb) se fundó en 1997 como subproducto de una investigación académica en la Universidad Noruega de Ciencia y Tecnología (NTNU) y lanzó su propio motor de búsqueda AllTheWeb en mayo de 1999. La búsqueda web de Fast (Alltheweb) puede utilizar la clasificación automática ODP, admite búsqueda en Flash y PDF, admite búsqueda en varios idiomas y también proporciona búsqueda de noticias, búsqueda de imágenes, videos, MP3 y FTP, con funciones de búsqueda avanzadas extremadamente potentes. (Overture adquirió la división de búsqueda en Internet de Fast el 25 de febrero de 2003).
Sohu se fundó en agosto de 1996. Produce principalmente directorios clasificados de sitios web chinos. Alguna vez tuvo la reputación de "buscar mapas cuando salías y buscar Sohu en línea". Con el rápido aumento del número de sitios de Internet, este directorio de categorías editado manualmente ya no es adecuado. Sohu creó el sitio web de búsqueda "Sogou" con un nombre de dominio independiente en agosto de 2004, autodenominándose un "motor de búsqueda de tercera generación".
Openfind; fundada en enero de 1998, su tecnología se originó en el laboratorio GAIS dirigido por el profesor Wu Sheng de la Universidad Nacional Chung Cheng en Taiwán; inicialmente Openfind solo fabricaba motores de búsqueda chinos. En su apogeo, proporcionó chino para los tres portales famosos Sina y Qimo. y Yahoo motores de búsqueda, pero después de 2000, el mercado se dividió gradualmente entre Baidu y Google. En junio de 2002, Openfind relanzó un sitio web de búsqueda con nombres de dominio independientes basados en "Sogou". En junio de 2002, Openfind relanzó la versión beta del motor de búsqueda Openfind basado en el proyecto GAIS30, lanzó PolyRankTM y anunció que había rastreado un total de 3.500 millones de páginas web y comenzó a ingresar al campo de la búsqueda en inglés.
En enero de 2000, dos ex alumnos de la Universidad de Pekín, Robin Li, inventor de la patente de análisis de hipervínculos y ex ingeniero senior de Infoseek, y su amigo Xu Yong, becario postdoctoral en la Universidad de California, Berkeley, fundaron la empresa en Zhongguancun, Beijing, Baidu, y lanzó la versión beta del motor de búsqueda Baidu en agosto de 2001 (anteriormente, Baidu sólo proporcionaba motores de búsqueda para otros portales como Sohu y Sina Tom). En octubre de 2001 lanzaron un motor de búsqueda basado en el proyecto GAIS30. En agosto de 2001, Baidu lanzó la versión beta de su motor de búsqueda (anteriormente, Baidu sólo proporcionaba motores de búsqueda para otros portales como Sohu, Sina, Tom, etc.).
Otras características del motor de búsqueda Baidu incluyen
Después del lanzamiento del proyecto Blitzen en marzo de 2002, las actualizaciones tecnológicas se aceleraron significativamente. Después de lanzar una serie de productos como Tieba, Zhizhi, mapas, estudios chinos, enciclopedias, documentos, videos y blogs, fueron muy populares entre los internautas. El 5 de agosto de 2005, la empresa cotizó en NASDAQ en los Estados Unidos. un precio de emisión de 27,00 dólares estadounidenses. El código bursátil BIDU abrió a 66,00 dólares estadounidenses y cerró a 122,54 dólares estadounidenses, un aumento del 353,85%, estableciendo un récord para el mayor aumento diario de nuevas acciones en el mercado de valores de EE. UU. en los últimos cinco años. Estableció un récord de la mayor ganancia en un día para una acción nueva en el mercado de valores estadounidense en cinco años.
El 23 de diciembre de 2003, la Búsqueda Huicong original operó oficialmente de forma independiente y estableció China Search. En febrero de 2004, China Search lanzó el motor de búsqueda de escritorio WebPig 1.0. En marzo de 2006, China Search cambió el nombre de WebPig a IG (Internet Gateway).
En junio de 2005, Sina lanzó oficialmente su motor de búsqueda de desarrollo propio "Aiwen". Desde 2007, Sina iAsk ha comenzado a utilizar el motor de búsqueda de Google.
El 1 de julio de 2007, se adoptó por completo la tecnología de búsqueda de desarrollo propio de NetEase, "Youdao", y se fusionaron la búsqueda integral original y la búsqueda web. La búsqueda web, la búsqueda de imágenes y la búsqueda de blogs de Youdao sirven para la búsqueda NetEase. La búsqueda web utiliza su propia tecnología de procesamiento de lenguaje natural, almacenamiento distribuido y búsqueda de imágenes; es la primera en proporcionar funciones de búsqueda avanzadas basadas en la marca de la cámara, el modelo e incluso la búsqueda de blogs, que es más completa y actualizada que productos similares; Ventajas: proporciona "vista previa del artículo" y "archivo de blog". El motor de búsqueda también proporciona funciones de búsqueda avanzada basadas en la marca y el modelo de la cámara e incluso en la temporada.