buscadores

Entre los implementos que podemos aplicar a un website, uno muy práctico y apreciado por los usuarios es el sistema de búsqueda interna. Ya sea que programemos uno propio o aprovechemos las opciones que nos brinda Google, los asiduos visitantes agradecerán la posibilidad de efectuar veloces y precisas búsquedas en nuestro contenido. Aquí les acercamos algunos consejos para sacar partido de este elemento.
Suele suceder que ciertas páginas de nuestra web pueden poseer grandes cantidades de información, obligando al uso del scroll vertical. En estos casos, la mejor elección es duplicar los cuadros de búsqueda, ubicando uno en la parte superior y otro en la parte inferior de la pantalla. Así ganaremos en comodidad, pudiendo además analizar las estadísticas por separado.
Resulta muy importante también trabajar sobre la página de resultados que genera un cuadro de búsquedas. Lo mejor es que no la direccionemos a Google, sino que la mantengamos en la estructura interna del sitio para evitar la fuga de visitas, integrando además los anuncios AdSense que poseemos y un cuadro de búsqueda adicional para que el usuario pueda seguir buscando si no encontró lo que deseaba.
Finalmente, es imprescindible colocar los cuadros de búsqueda en lugares muy visibles, cómodos y fácilmente detectables. Normalmente, los lugares más indicados son a la izquierda de una barra de navegación, a la derecha o debajo de la cabecera. Lo principal es que los visitantes se enteren rápidamente de su existencia y puedan encontrarlo siempre en el mismo lugar.

Dentro del SEO, uno de los temas más recurrentes es el uso de meta-tags. Si bien ya se ha confirmado con seguridad que ninguna meta-tag podrá brindar una influencia notable sobre el posicionamiento, no puede dejarse de tener en cuenta que son una fuente de información sobre la página web, utilizada por los buscadores para indagar las características de la misma.
Una meta-tag se construye con la siguiente estructura:
<meta name="nombreMetaTag" content="Contenido de la Meta-tag"/>
Explicando un poco como funciona esto a nivel HTML, diremos que con la construcción "<meta" abrimos la etiqueta. Acto seguido, con el parámetro "name=" definimos el tipo de meta-tag que utilizaremos. Ya elegido el tipo de etiqueta, con el parámetro "content=" le daremos un valor a la etiqueta, siempre en función de su utilidad. Cerramos la etiqueta con la expresión "/>".
Utilizando estas líneas de código, podremos insertar con total facilidad una meta-tag, definiendo rápidamente su tipología y valor. Utilizando estas líneas de código podemos indicar a un buscador el tipo de contenido de un website, una descripción breve de cada página, una descripción del sitio en general, palabras clave sobre el sitio, datos de validación HTML e inclusive, indicar el comportamiento que debe tomar un buscador al llegar a esa página.
Es importante resaltar que las meta-tags deben estar definidas entre las etiquetas "<head>" y "</head>", justo al comienzo del código fuente de cada página.

Por lo general, los websites que uno construye terminan alojados en servidores contratados a empresas de hosting, ya que usualmente es un costo excesivo el mantenimiento de un servidor propio. Es así que muchas veces la respuesta del site a los requerimientos de un visitante no están en nuestras manos.
En ocasiones puede pasar que, buscando información o actualizando la ya disponible, un buscador husmee constantemente el sitio requiriendo accesos constantes al servidor. Cada petición exige una carga de trabajo que, si se repite excesivamente por un lapso prolongado de tiempo, ralentizará notablemente la velocidad de nuestro sitio.
Si se está en esa situación, una buena manera de disminuir este efecto es el siguiente código:
User-agent: MSNBot
Crawl-delay: 30
Escribiendo esas líneas, se imparte un intermedio de 30 segundos entre peticiones, lo que hará el ritmo más “soportable”.
Cómo explicamos anteriormente, un sitemap puede ser de gran utilidad en el proceso de indexación. Para incluir una referencia al mapa de sitio, bastará con el siguiente código:
Sitemap: www.misitioweb.com/docs/sitemap.xml
Es importante destacar que las instrucciones brindadas a los buscadores en el archivo robots.txt no son más que sugerencias. Los bots de buscadores las respetarán, pero es posible que robots programados para ingresar por fuerza bruta hagan caso omiso. Para trabajar sobre esas situaciones, se utiliza el archivo “.htaccess”, sobre el cuál hablaremos en una próxima serie de artículos.

Me encantan estos comparadores. Hace ya un par de años se hablaba de que la tendencia del mercado iba a ir por los buscadores verticales. Es decir, con toda la lógica, los buscadores genéricos como Google, por muy buenos que sean, al final no son capaces de ofrecer buenos resultados para cosas muy específicas.
Pongamos el ejemplo de queremos comprar un lavavajillas. Podemos esperar a que alguien haya escrito un post con una comparativa de lavavajillas, o bien podemos esperar que un buscador vertical de este tipo lo haga por nosotros. Es el caso de preciole, un comparador de precios en castellano que pretende ser a su vez red social en la que los usuarios puedan opinar sobre los productos, valorar, etc, etc.
La web está en beta, aunque es totalmente funcional (como toda web 2.0), y en el futuro prometen añadir bastantes novedades además de las que ya os hemos contado. Lo que más me gusta del proyecto es la clara orientación al usuario, lo importante no es tanto el producto en si como los propios usuarios, que pueden recomendar productos entre si y incluso ayudar en el proceso de toma de decisión en la compra de otros usuarios.
Pero preciole no sólo es una aplicación de comparativa de precios, hay más cosas interesantes y sobre todo útiles. Preciole cuenta con un canal de video en youtube desde donde podemos encontrar reviews, muy completas, hablando sobre productos de electrónica de todo tipo, desde cámaras digitales hasta ordenadores o teléfonos móviles. Si queréis saber pros y contras de un determinado modelo, éste es vuestro sitio :-).
Preciole es un proyecto de Diego Velázquez, un emprendedor que lleva trabajando en esta idea desde 2008, y que sólo por el entusiasmo con el que hable de él en su propio blog merece la pena darle una oportunidad :-).

En muchas webs actuales, y por sobretodo en los blogs, es muy común encontrarse con varias URL distintas para acceder al mismo artículo o post. Por lo tanto, en un blog de cocina podrá accederse de distintas maneras a la receta de salsa boloñesa escrita el 20 de Marzo de 2010:
cocinablog.com/recetas/salsa-bolognesa (permalink básico y principal)
cocinablog.com/2010/03/ (permalink del archivo del mes de Marzo)
cocinablog.com/recetas/ (permalink de la categoría en que se incluyó el artículo)
cocinablog.com/recetas/salsa-bolognesa/page/2 (permalink de la segunda página con comentarios)
Si los buscadores se encuentran indexando tanta cantidad de vías distintas para el mismo contenido, penalizan seriamente al website. Es muy difícil que un post de un blog sea limitado a una sola vía de acceso, por lo que resulta absolutamente imprescindible restringir la entrada del spider a las “direcciones extra”.
Para acotar las direcciones que indexa un spider, la mejor opción obviamente es el uso de “robots.txt”. Sin embargo, es necesario tener suma precaución, sobretodo en el uso de los comodines. Puede ser realmente peligroso porque por ejemplo, se puede errar en el bloqueo de direcciones.
En la próxima entrega, trabajamos sobre la inclusión de un sitemap y el uso de ancho de banda del servidor.

Como veíamos en el anterior artículo, mediante el parámetro “Disallow” es posible manejar las restricciones que se imponen a cada spider o a todos ellos a la vez. En ocasiones, es posible que deseemos restringir la entrada a todo el sitio o permitirla, por lo que bastará con escribir:
Disallow: /
o bien
Disallow:
Los robots tomarán la ausencia de un valor para el parámetro como la posibilidad de navegar el website libremente. También existe la posibilidad de restringir varias carpetas o archivos puntuales, cada uno a un crawler diferente. Veamos el ejemplo de restricción al crawler de Google de tres archivos y una carpeta:
User-agent: Googlebot
Disallow: /enlaces.html
Disallow: /fotos/galeria1.html
Disallow: /fotos/galeria2.html
Disallow: /docs/
Google no podrá acceder a los archivos “enlaces.html”, “galeria1.html” y “galeria2.html”, ni a la carpeta “docs”.
A medida que avanzamos en la complejidad de los permisos, entran en juego los comodines que podremos usar. Uno de ellos lo hemos visto ya (*) y el otro ($) pasaremos a visualizarlo en el siguiente ejemplo:
User-agent: Googlebot
Disallow: /noticias/*
Disallow: /descargas/*
Disallow: /*.pdf$
Disallow: /info/*/page/*
Con los primeros dos “Disallow” estamos restringiendo la indexación de direcciones que comiencen con “noticias/” y “descargas/” (muy útil para blogs). La tercer línea elimina de la indexación los documentos PDF y la cuarta se encarga de evitar al buscador las páginas que sólo se diferencian en los comentarios (contenido duplicado).
En la siguiente entrega trabajamos sobre el contenido duplicado.

Continuando un poco con las ventajas de modificar el fichero de texto “robots.txt”, podemos señalar también la posibilidad de eliminar el contenido duplicado de la indexación. Esto no es algo muy revisado en la mayoría de los casos, pero evitar que el robot de un buscador caiga en sectores que albergan el mismo contenido puede ser realmente perjudicial para nuestro ranking.
También es buena idea complementar la manipulación de “robots.txt” con el diseño de sitemap (mapa del sitio). Estos contienen un listado de las páginas del sitio o documentos a los cuáles el crawler puede acceder para recopilar información. Generalmente se presenta siguiendo un orden jerárquico, algo útil tanto para la indexación como para la navegación del usuario final.
Básicamente, para comenzar a trabajar con el fichero “robots.txt” es necesario crearlo, en lo posible dentro de la carpeta raíz del website (donde se encuentra el archivo “index.html” generalmente). A partir de aquí, tenemos una serie de parámetros con los cuales modificar el comportamiento de un spider.
Hay dos parámetros básicos que no se pueden evitar. El primero es “User-agent”, con el cual se especifica para que bot estamos planteando los permisos. El otro es “Disallow”, con el cual denegamos el acceso a una carpeta del website. Si queremos prohibir la entrada a una carpeta, a todos los buscadores, basta con escribir:
User-agent: *
Disallow: /nombreCarpeta/
Donde “nombreCarpeta” irá el nombre de la carpeta que deseemos restringir. Si dejamos el “*”, la regla será para todos los spiders. De lo contrario, deberemos especificar uno en particular.
Continúa en la tercera entrega.

Está claro que Google es uno de los mejores buscadores que se han diseñado (e implementado) hasta la fecha. Sin embargo, las necesidades de búsqueda "estándar" difieren mucho del mercado de nichos. Por ejemplo, no es lo mismo buscar una foto del mejor trabajo del mundo que hacer una búsqueda de un puesto de trabajo de ingeniero informático en Barcelona, por ejemplo.
Google es muy bueno, al igual que sus competidores, para ofrecer resultados de búsquedas en mercados de nichos generales. Sin embargo, cuando nos adentramos en el inmenso long tail, en la enorme variedad de pequeños nichos de subtemáticas los resultados dejan de ser todo lo bueno que necesitaríamos.
Además también influye el factor tiempo, en el que no sólo importa la información que se nos ofrece sino la "caducidad" por llamarla así de dicha información. Aqui los "megabuscadores" (Google, Yahoo, Bing, ...) no tienen nada que hacer frente a los metabuscadores, o los buscadores de nicho. Todos los hemos usado alguna vez para buscar trabajo, vender nuestra moto de segunda mano, encontrar el proveedor o el mejor vestido de novia para nuestra boda o, en general, para buscar publicidad madrid, en Barcelona o en la ciudad de cada uno.
Acostumbrados a los buscadores de nicho, saturados de información, el que nos han pedido que os enseñemos hoy sorprende por su sencillez. Al entrar en ianuncios, y tras seleccionar entre buscar trabajo, casa o coches vamos a encontrar simplemente una casilla de búsqueda con poco más que pueda distraer nuestra atención.
He probado algunas búsquedas, como "santa fe elche", "villaviciosa de odon chalet", etc. Y la verdad es que el concepto es agradable, muy centrado en los resultados y con poca complejidad que nos distraiga.
Por último hay que destacar que no se trata de una plataforma en si de anuncios, sino un metabuscador, con lo que desde el anuncio elegido seremos redireccionados hacia el anuncio en el portal donde se ha publicado dicho anuncio. Un proyecto interesante, verdad?
Enlace: http://ianuncios.com

Luego de que comScore finalizará el último informe del pasado año 2009, ya están disponibles los números definitivos al respecto de las búsquedas realizadas en este período. De estas cifras se desprende que hubo un aumento del 46% de un año para el otro, retratado en las 131.000 millones de búsquedas totales a un promedio de 4.000 millones de búsquedas por día, 175 millones por hora y 29 millones por minuto.
En una segunda instancia se ha realizado un estudio de crecimiento 08/09 por países, centrado en los diez países más importantes. Este revela un crecimiento del 22% en Estados Unidos, el 13% en China, 48% en Japón, 35% en Reino Unido, 38% en Alemania, 61% en Francia, 44% en Corea del Sur, 53% en Brasil, 28% en Canadá y, el más impactante, 92% en Rusia.
También se realizó un estudio de crecimiento por buscador, curiosamente encabezado por Bing, que mostró un avance del 70 por ciento en su volumen de búsquedas. De todas maneras, Google mantiene claramente su margen de superioridad con un crecimiento del 58% que le deja por delante del resto claramente. En un segundo plano aparecen Facebook y AskNetwork, con 54% y 43% de avance respectivamente.
Por el momento, la empresa de los binoculares no parece dar señales de decaimiento y reafirma permanentemente su superioridad respecto del resto. De todas maneras, aunque en este momento controla el 65% de las búsquedas y sigue creciendo, deberá mantener cierta atención en Microsoft Bing, un competidor que ya asoma con las condiciones necesarias para enfrentarle a largo plazo.

Larga e intrincada es la historia que han protagonizado Microsoft y Yahoo! con ese eterno ida y vuelta de negociaciones que nunca llegaban a su fin, o eran trabadas por obstáculos legales, o reculaban a último momento. Sin embargo, finalmente han llegado al punto de acuerdo necesario y la empresa “comprada” hará desaparecer su clásico buscador para fusionarlo con el emergente Bing.
Dentro del contrato, las cláusulas más determinantes especifican que Yahoo! utilizará el engine de búsqueda de Microsoft a cambio de una parte de las ganancias por publicidad que percibe. Con esta movida, Yahoo! ya no invertirá más en seguir trabajando sobre su motor de búsqueda (superado por Google y el mismo Bing hace tiempo) y se dedicará a otros proyectos.
Dichos proyectos tienen el objetivo de llevar otra vez a su antiguo lugar a Yahoo! como portal de referencia para la mayoría de los navegantes con el contenido como bandera de guerra, un puesto que ha perdido de un tiempo a esta parte. Microsoft por otra parte necesita de un espacio claro para competir con Google que se encuentre a la altura de las circunstancias.
Si bien en primera instancia podríamos pensar que el más perjudicado es el usuario porque deja de existir una modalidad de búsqueda para ser reemplazada por otra (amén de que esta se suponga superior), la realidad marca que un website con el potencial de Yahoo! puede verse radicalmente ayudado por esta nueva tecnología. Resta esperar la aprobación nacional de USA para la fusión. El resto está decidido.





Recent comments
2 weeks 1 day ago
2 weeks 3 days ago
3 weeks 38 min ago
3 weeks 6 days ago
4 weeks 3 days ago
4 weeks 6 days ago
5 weeks 2 days ago
5 weeks 2 days ago
5 weeks 3 days ago
5 weeks 5 days ago