Jan
30
2009

SEO – Tips de optimización de páginas web para posicionamiento en buscadores web Google

Tips para optimizar el contenido de las páginas web para mejorar posicionamiento en buscadores y facilitar el trabajo del motor de búsqueda Googlebot.

Conceptos básicos:

Qué es SEO?

Es una terminología muy utilizada a nivel de desarrollos web que alude a la manera de como poder optimizar los sitios web para que los buscadores de información web (motor de búsqueda) como Google, Yahoo, etc., puedan considerar la información de un sitio web en particular para cuando alguna persona busca por información.

Google 101: sistemas que utiliza Google para rastrear, indexar y mostrar contenido de la Web


Cuando se sienta frente a su equipo informático y realiza una búsqueda en Google, obtiene de forma prácticamente instantánea una lista de resultados de la Web. ¿Qué sistemas utiliza Google para encontrar páginas web que coincidan con su consulta y para determinar el orden de los resultados de búsqueda?

Para explicarlo de forma sencilla, realizar una búsqueda en la Web es como consultar un libro muy extenso en el que un índice exhaustivo indica exactamente la ubicación de cada elemento. Cuando un usuario realiza una búsqueda en Google, nuestros programas consultan nuestro índice para decidir qué resultados de búsqueda son los más relevantes y mostrárselos.

A continuación se indican los tres procesos clave para la presentación de los resultados de búsqueda.

- Rastreo ¿conoce Google la existencia de su sitio?; ¿puede encontrarlo?

El rastreo es el proceso mediante el cual Googlebot descubre páginas nuevas y actualizadas y las añade al índice de Google.

Utilizamos una enorme cantidad de equipos informáticos para obtener (o “rastrear”) miles de millones de páginas de la Web. El programa encargado de recuperar este contenido es Googlebot, también conocido como “robot” o “araña”. Googlebot emplea un proceso basado en algoritmos: a través de programas informáticos, se determinan los sitios que deben rastrearse, la frecuencia y el número de páginas que hay que obtener de cada sitio.

El proceso de rastreo de Google empieza con una lista de URL de páginas web generada a partir de anteriores procesos de rastreo y se amplía con los datos de los sitemaps que ofrecen los webmasters. A medida que Googlebot visita cada uno de estos sitios web, detecta enlaces en sus páginas y los añade a la lista de páginas que debe rastrear. Los sitios nuevos, los cambios en los existentes y los enlaces obsoletos se detectan y se utilizan para actualizar el índice de Google.

Google no acepta retribuciones económicas para rastrear un sitio con mayor frecuencia y separa el servicio de búsqueda del programa de generación de ingresos, AdWords.

- Indexación: ¿puede Google indexar su sitio?

Googlebot procesa todas las páginas que rastrea para elaborar un índice completo de todas las palabras que detecta y de su ubicación en cada página. Además, procesa la información incluida en las etiquetas y los atributos de contenido clave, como las etiquetas “Title” y los atributos “ALT”. Googlebot puede procesar muchos tipos de contenido, pero no todos. Por ejemplo, no puede procesar el contenido de una serie de archivos multimedia y páginas dinámicas.

Publicación: ¿el sitio incluye contenido útil y de calidad que sea relevante para la consulta del usuario?

Cuando un usuario introduce una consulta, nuestro sistema busca en el índice las páginas que coinciden con esa consulta y muestra los resultados que considera más relevantes para el usuario. La relevancia se determina a partir de más de 200 factores, uno de los cuales es el PageRank de cada página. Este parámetro representa la importancia que Google asigna a una página en función de los enlaces procedentes de otras páginas web. En otras palabras, cada enlace a una página de un sitio influye en el PageRank del mismo. No todos los enlaces son iguales: Google se esfuerza en mejorar el servicio que ofrece al usuario identificando los enlaces fraudulentos y otras prácticas que influyen negativamente en los resultados de búsqueda. Los mejores enlaces son los que se basan en la calidad del contenido del sitio.

Para que su sitio consiga una buena posición en las páginas de resultados, es importante asegurarse de que Google pueda rastrearlo e indexarlo correctamente. En nuestras

Directrices para webmasters destacamos algunas de las prácticas recomendadas para evitar errores comunes y mejorar la posición del sitio.

El PageRank se puede ver utilizando la barra de Google, y no se actualiza frecuentemente para evitar que las personas pasen preocupados de eso constantemente.

Anatomía de página de resultados de Google

- Campo de texto con las palabras clave buscadas

- Adwords, Publicidad de Google

- Organíco: Los resultados en referencia a o las palabras buscadas por el buscador de Google

Cuando se busca una palabra con Google Search en el listado de resultados se despliegan destacadas con negrita BOLD a las palabras clave.

Dentro del contenido orgánico, cada link de resultado se divide en tres partes:

Título de la página, usualmente se utiliza el tag Html < title >Título de la página< /title >

Descripción, usualmente corresponde al campo meta: < meta name=”description” content=”Descripción informativa acerca de la página en particular”, en caso que es muy larga se dejan ….

URL, corresponde a la ruta URL en caso que es muy larga, se acorta y se dejan puntos suspensivos ….

Tags HTML considerados

1. < title >Título de la página< /title >

Corresponde al tag que indica el Título de la página web, el cual debe ser único dentro del todo el sitio web, el tag < title > debe estar dentro de los tags < head > < /head >

El tag del Title de las páginas HTML usualmente aparece en la página de resultado de Google en la primera línea.

2. < meta name=”description” content=”Información descriptiva de la página web” >

Meta Tag “description” que describe a cada página web, la información contenida tiene que ser relevante a la página y única para todo el sitio web y a la página en particular, es decir, no deberá repetirse en otra página dentro del sitio.

No agregar sólo palabras clave, sino una frase que facilite su lectura.

3. Anchor text < a href=”…” < /a >

Evitar palabras genéricas como: “page1″, “page2″, “artículo”, “click aquí”, que no tienen relevancia con la referencia o fuera del tema.

Evitar manejo de CSS haciendo que los links parezcan texto normal.

Crear links que ayuden a la navegación como las migas de pan.

4.- Heading tags < h1 >, < h2 >, < h3 >, < h4 >, < h5 >, < h6 >

Muy útil para diferenciar y estructurar a la información de la página web.

Usarla de tal manera de que permita ayudar a tener sentido cuando comienza y termina un tópico.

Ejemplo:

< h1 >Título de la página< /h1 >

< h2 >Sección de la página< /h2 >

5.- Imágenes < img ….. alt=”esto es una foto” >

Siempre utilizar el atributo alt para el tag < img >

El nombre de la imagen se recomienda que sea descriptivo.

URL

La dirección de la página web también es considerada por Google, se privilegia que sea amigable y en lo posible descriptiva.

Evitar que sea demasiado larga o compleja con texto poco reconocible, evitar pseudo-palabras.

Se recomienda utilizar palabras separadas con guión (-)

Ejm: www.midominio.cl/noticias/20090325/ranking-de-cantantes-con-mas-gaviotas-del-festival-de-la-cancion-2009.html

Navegación del sitio web

- Jerarquía

La estructura del sitio debe ser utilizando una jerarquía natural de lo más general a lo más particular.

- Links

Los links en su mayoría deberán ser del tipo texto, prefiriéndose más que Javascript y Flash.

Aunque GoogleBot puede indexar algo del contenido en Flash, implica un mayor tiempo y mayores recursos dificultando el proceso que termina siendo poco eficaz.

- Migas de Pan

Corresponde a una Fila con links internos del sitio web ubicados en la parte superior o inferior del sitio web, es de suma importancia pues permite al usuario mejorar su ubicación en relación al sitio web, pudiendo volver a la sección superior de algún contenido o a la página principal del sitio web.

Evitar Indexación de Google

- Directorios y páginas html

Utilizar archivos de texto “robots.txt” el cual indica a los robots de búsqueda que puede y no indexar, se recomienda utilizarlo para directorios de contenido público solamente en el caso que no se desee acceso de ningún tipo al directorio se deberá utilizar archivos del tipo HTACCESS.

- Links HTML

Considerar que Google considera a todos los links que posee todo el sitio web, pudiendo determinar la calidad de cada uno (reputación), por lo que se debe preveer tener solamente links externos de sitios que poseen buena reputación, para evitar perjudicar al propio sitio con la mala fama de otros.

Para prevenir que GoogleBot no considere ciertos links con dudosa reputación, se debe agregar al tag < a > el atributo rel con el texto “noindex” quedando de la siguiente manera:

< a href=”http:://sitio-dudosa-reputacion.com” rel=”noindex” > Granja de links < /a >

Adicionalmente si uno desea que GoogleBot no considere al momento de la indexación ningún link de cierta página, se deberá agregar dentro del head, al siguiente campo meta:

< meta name=”robots” content=”nofollow” >

En el caso que Google ha indexado alguna página que no tenía que hacerlo, utilizando la herramienta Google webmaster se puede solicitar que se elimine.

Mapa del sitio

Para falicitar a GoogleBot se puede generar un archivo XML con todos los links importantes para sumar mayor información del sitio web, se recomienda utilizar la herramienta Google Webmaster para conocer en detalle del archivo.

Google Webmaster

Google Provee una herramienta que permite ayudar al webmaster a conocer mayor información acerca de su website, es totalmente independiente de Google Analitycs.

https://www.google.com/webmasters

¿Cuál ES EL CONTENIDO INDEXADO POR GOOGLE DEL WEBSITE?

Para conocer las páginas indexadas por Google, se puede realizar búsquedas avanzadas directamente ingresando en el buscador de Google las siguientes palabras destacadas:

site: Páginas indexadas del sitio site:www.dominio.com

link: Páginas que enlazan a la página de presentación del sitio web link:www.dominio.com

cache: Caché actual del sitio cache:www.dominio.com

info: Información acerca del sitio info:www.domino.com

related: Páginas similares al sitio related:www.dominio.com

Y los más importante de todo!!!

CREAR CONTENIDOS ORIGINALES, ÚTILES, INTERESANTES Y DE CALIDAD…

Referencias:

- Guía de Inicio SEO

http://www.google.com/webmasters/docs/search-engine-optimization-starter-guide.pdf

- Sistemas que utiliza Google para rastrear, indexar y mostrar contenido de la Web

http://www.google.com/support/webmasters/bin/answer.py?answer=70897

- Directrices para webmaster

http://www.google.com/support/webmasters/bin/answer.py?answer=35769

Related posts:

  1. Google Chrome Beta
  2. Crear usuarios con shell y sin shell para servidor virtual apache, grupos en ubuntu

Written by doutdex in: SEO | Tags: ,

2 Comments »

RSS feed for comments on this post. TrackBack URL


Leave a Reply

TheBuckmaker.com Wordpress Themes | Geld von Privat, Streaming Audio