html

HTML (acrónimo de HyperText Markup Language) es el pilar fundamental de una de las caras visibles de Internet para los usuarios, la WWW. Teniendo esto en cuenta es que consideramos interesante conocer algunas novedades de su próxima versión, conocida como HTML5.
La característica más destacada durante esta previa es la posibilidad de visualizar videos sin apelar a plug-ins de ningún tipo, un punto a favor tanto en términos de compatibilidad como de estabilidad y velocidad. Sin embargo, hay otras noticias igualmente agradables que quizá terminen siendo aún más determinantes para el día a día de los internautas.
HTML5 incorporará, entre otras cosas, Web Sockets. Esta función provee de una API ideada con el fin de mantener una conexión fluida y permanente entre página-servidor, de forma que ya no sería necesario realizar una petición por cada actualización. Gracias a Web Sockets, posiblemente podamos disfrutar de una cloud computing mucho más eficiente y segura de aquí en más.
Otra de las funciones nuevas es Web Storage, preparada para mejorar el funcionamiento en dispositivos sin conexión o con conexiones intermitentes (caso de los smartphones) almacenando mayores cantidades de información en el navegador y recuperándolos con más facilidad.
También se verán mejoras en la universalidad del renderizado de las páginas, algo que hasta ahora se ha logrado muy a medias pero resulta muy importante en vista de la durísima lucha “IE vs. Firefox” y el terreno ganado por opciones adicionales (caso de Opera y Chrome). Con el nuevo parser, HTML5 manejaría mejor los errores de código, neutralizando el manejo individual de los navegadores y reemplazándolo por una respuesta universal.

Dentro de la programación HTML, las etiquetas son el pilar sobre el cual se estructura la sintaxis del lenguaje. Existen miles de ellas, pero tres de ellas son las más conocidas, sobretodo por su aporte en términos de posicionamiento y usabilidad: “title”, “meta-keywords” y “meta-description”. De ellas hablaremos en este artículo.
La primera es la que brinda un título a la página, algo que normalmente resulta ser también lo primero que un usuario ve si aparecemos en los resultados de su búsqueda. Se utiliza de la manera tradicional, encerrando el contenido entre las marcas “<title>” y “</title>”. Un buen título es comprensible, conciso, coherente y atrayente, a la vez que contiene palabras clave o “keywords” relacionadas.
En cuanto a la etiqueta “meta-keywords”, podemos decir que se encuentra en el grupo de las “meta-tags”, desempeñando la función de brindar una lista de palabras clave relacionadas con el contenido de cada página. Normalmente no deberían ser más de seis diferentes, definiéndoselas mediante la siguiente expresión: “<meta name="keywords" content="keyword1, keyword2, keyword3" />”.
Finalmente, tenemos la etiqueta “meta-description”, integrante del mismo grupo que la “meta-keywords”. Su objetivo es alojar una descripción lo más breve y acertada posible sobre el contenido de una página, sirviendo esto para presentar debajo del link a nuestra web en los resultados de un buscador. Como el título, es bueno que contenga las palabras clave que hayamos definido, y además no debe sobrepasar los 150 caracteres. Se la utiliza con la expresión “<meta name="description" content="Texto que deseamos incluir como descripción." />”.

“robots.txt” es el nombre de un archivo de texto ubicado en la carpeta raíz de un website, utilizable para intentar el control de los “crawlers” que implementa cada buscador al momento de indexar las páginas y luego posicionarlas. Su uso entraña varias opciones a la vez que muchos beneficios. Iremos revisándolos poco a poco en esta serie de artículos.
En primer lugar, es importante repasar que los “crawlers” son aquellos sistemas automatizados mediante los cuales un buscador puede ingresar a una página web y recopilar información importante para el posicionamiento siguiendo la telaraña de links de la misma. Son también conocidos como “arañas”, “spiders” y “robots”.
Un beneficio palpable en este asunto es el control que se establece sobre la actividad de los robots. En ocasiones, estos pueden saturar de peticiones a un servidor, ocupando un excesivo ancho de banda en el mismo y complicando el trabajo del webmaster. Incluso puede irse más lejos, directamente “prohibiendo” la entrada de “crawlers” que nos resulten pesados y no reporten un gran beneficio.
Otra ventaja de manipular el archivo “robots.txt” es la indexación selectiva que podemos practicar. En ocasiones podemos necesitar que una serie de archivos y secciones estén en nuestro website pero pueden complicar el posicionamiento del sitio sobre ciertas “keywords”, en cuyo caso es mejor mantener estos archivos fuera de la vista para el buscador.
Sigue en la parte número dos.

Cuando se da la indexación por buscadores de nuestro sitio, hay varios métodos (generalmente basados en Tags/Etiquetas HTML aplicables al código fuente) para manejar hasta cierto punto el comportamiento de los motores de búsqueda sobre el mismo. Qué links seguir, qué links no, donde sí, donde no, de que manera, etc.
Uno de los Tag más clásicos es NoFollow, ya que es utilizable por diferentes métodos. Su principal característica reside en que, dónde lo apliquemos, el buscador no seguirá ningún link y cortará el rastreo, continuando con otras páginas del mismo nivel. Mantiene la página en las SERPs y no le quita rastreabilidad, pero se constituye en la herramienta ideal para manipular la indexación.
Entre las opciones nuevas se encuentra un Tag directamente creado por Google, Canonical, con el cual evitaremos la indexación de contenido duplicado (situación que puede acarrear una sanción en PageRank) controlando las URLs duplicadas mediante la designación de una principal y la marcación con esta etiqueta del resto. Es buena idea acompañar el uso de este método con un sitemap XML.
Un recurso de última instancia es el archivo robots.txt, de las vías más clásicas y más antiguas. Resulta particularmente efectivo si se trata con aplicaciones incapaces de identificar todo el resto de indicadores de duplicidad. La desventaja principal se relaciona a que directamente cierra el seguimiento interno a las páginas que le indiquemos, lo que las aisla y les resta relevancia. Puede ser efectivo si queremos evitar penalizaciones a toda costa, pero en situaciones más tranquilas desperdiciaremos puntuación por links.

“Canonical” es una etiqueta o “tag” que podemos utilizar en la programación web para fijar ante los buscadores el proceso de indexación en ciertas páginas de un sitio. A pesar de ser una excelente idea y un elemento de gran potencial, su carácter de novedad hace que no se tenga realmente claro hasta que punto funciona de una manera u otra.
Distintos debates en foros conducen a algunas respuestas, que si bien no dicen exactamente en que situación hacer uso de esta etiqueta, nos dan la pauta de cuando no hacerlo. Según algunos programadores, la etiqueta debería utilizarse como una redirección 301, marcando aquello que no debe ser indexado.
Sin embargo, surge un problema en el uso de “canonical” y es cuando se pagina el contenido. Colocar esta etiqueta en la paginación de un site de productos podría provocar que los productos o artículos paginados no sean encontrados en su totalidad por los robots.
Esta etiqueta de todas formas, vendría a reemplazar el uso de otras herramientas como “noindex” o “follow”, pensadas para estructuras más pequeñas. Sin embargo, por ahora requiere de bastante estudio y pruebas hasta tanto se determinen las vías correctas para lograr su funcionamiento adecuado.

Uno de los mitos más discutidos a lo largo y a lo ancho del mundo SEO, es el de que la maquetación mediante CSS genera una estructura de código fuente mucho más favorable y positiva para el posicionamiento en buscadores de una web. Aunque en un principio se creía que esto era totalmente real, recientes estudios acaban de revelar que utilizar tablas u hojas de estilo no genera ningún cambio.
En un primer paso se ha llevado adelante una serie de pruebas en las que diferentes websites eran portadas de su diseño en tablas a una maquetación CSS que las dejara exactamente iguales. Ninguna de las páginas tuvo problemas para ser indexada y luego ubicada, pero no pudo superar los resultados anteriores.
Por otra parte, la sección española de Google se encargó de traducir los dichos de Matt Cutts, el didáctico ingeniero que últimamente se encarga de revelar los costados más oscuros del masivo buscador para que el webmaster tenga acceso a información de primera mano. Según Cutts, CSS no representa ninguna ventaja por sobre las tablas, lo que confirma más aún la teoría antes expuesta.
De todas formas, CSS no deja de ser una herramienta mucho más “limpia” a nivel de código fuente para manejar la estructura de diseño de un website y hace muchísimo más sencillo cualquier cambio posterior que se desee hacer al diseño ya que separa los parámetros del mismo de lo que es el código base HTML, sin contar, aumenta la velocidad de carga de manera sensible en webs grandes.

Desde un largo tiempo atrás, se consideraba que la etiqueta META Keywords (recordemos, lenguaje HTML) no era de gran utilidad a la hora de favorecer el posicionamiento y la indexación de una página. Sin embargo, ya es oficial para los buscadores más importantes que este recurso no tiene más injerencia en dicho campo y es totalmente inútil ocuparse de ellas.
Poco tiempo atrás, Matt Cutts (uno de los ingenieros de Google más activos a nivel difusión), explicó mediante un video que el motor de búsqueda de la empresa no tomaba como un parámetro influyente las keywords o “palabras clave” insertadas en una etiqueta META. En sus palabras, no se trata de que la etiqueta sea inadecuada sino que es factible de ser utilizada para fines de Spam, lo que la hace poco confiable.
Cuidado, porque esto no implica que el resto de las etiquetas META (recordemos que son varias) no sea tomada en cuenta. Quizá la más importante de ellas sea META Description, la que aloja la descripción del sitio que se muestra en Google y un factor que muchas veces hace la diferencia para que un potencial visitante ingrese a nuestro website.
Finalmente, tanto Yahoo! como Bing han decidido tomar la misma política en lo que la etiqueta META Keywords respecta, por lo que ya no es tomada en cuenta dentro de sus búsquedas. A sabiendas de esto, debemos pararnos a pensar seriamente en lo actualizado que esté un webmaster cuando nos proponga trabajar sobre dicha etiqueta.

Las etiquetas h1 y las h2 son las que usan principalmente los buscadores a la hora de posicionar un determinado contenido de una página concreta frente a la de otra página. O, no lo veamos con la perspectiva de competencia pura y dura. Un h1 le dice a google cuál es la temática de un dominio mientras que el h2 le informa acerca del contenido que trata la sección o página del dominio que visitamos en ese momento.
Teniendo esto claro, la plantilla web de nuestra página no debería contener más que un solo h1 de la misma forma que tampoco debería contener más que uno y solo un h2. Ese es un error en muchas páginas que veo a menudo, y no estoy hablando de Conservas Paco S.L., hablo de Antena3 o 20minutos. Ahora bien, cómo distribuimos estas etiquetas?
Parece fácil, verdad? El h1 incluirá el título en general, de que trata la web que estamos visitando. Un ejemplo de etiqueta h1 podria ser: todas las novedades del buceo en la web. Por su parte el h2 debe incluir un título que describa la sección que estamos visitando. Por ejemplo: Buceo en isla Margarita.
Lo más bonito de este mundo en el que vivimos es que se te rompen los esquemas dia si y dia también, con teorías que puedes ver cómo otros compañeros han puesto en práctica con éxito. Por ejemplo, vamos a hacer un sencillo experimento. Cambiamos el h1 por el h2, dándole al título de la sección, "Buceo en isla Margarita" la etiqueta h1, y la h2 para el título de la web.
Que que podemos esperar que ocurra? Pues simplemente que Google llegará a una página que le dice que su contenido en general trata sobre "Bucear en isla Margarita", y eso le bastará para darle preferencia a otra cuya temática principal es "novedades sobre buceo", pero que tiene el "buceo en isla margarita" como actividad o información únicamente para esa sección.
Ahora bien, seamos un poco conspiranoicos. Con esta práctica en cierta forma le estamos diciendo a los buscadores que tenemos mucha más información sobre esa temática en concreta, que nos merecemos un mejor puesto que esa otra web que sólo habla de pasada sobre el tema, cuando la realidad puede ser bien diferente.
Que puede ocurrir? Probablemente nada, pero de la misma forma que se acabaron detectando y penalizando los contenidos de un mismo color que el fondo sobre el que estaban, esto en cierta forma es otro método de engaño. Un poco más sutil quizá pero, sinceramente, yo no lo pondría en práctica en una web de cuyo tráfico dependiera mi bolsillo. A fin de cuentas la máxima del posicionamiento web es: Nunca intentes engañar a los buscadores.
Dicho esto, tampoco quiere decir que no lo vayamos a probar en algún laboratorio improvisado ;-).
Mas información:
- Interesante experimento de gloobs
- seoprofesional también ponia en práctica la técnica de intercambio de etiquetas que os contaba en estas lineas





Recent comments
2 weeks 1 day ago
2 weeks 3 days ago
3 weeks 38 min ago
3 weeks 6 days ago
4 weeks 3 days ago
4 weeks 6 days ago
5 weeks 2 days ago
5 weeks 2 days ago
5 weeks 3 days ago
5 weeks 5 days ago