Como crear un Sitemap de noticias para Google – El formato

0
379

El formato de un sitemap de Google News utiliza el mismo protocolo que los sitemaps normales de Google, además de las etiquetas específicas para este protocolo.

El formato de un sitemap de Google News utiliza el mismo protocolo que los sitemaps normales de Google, además de las etiquetas específicas para este protocolo
Ejemplo de sitemap de Google Noticias:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:n="http://www.google.com/schemas/sitemap-news/0.9">
<url>
<loc>http://www.example.org/business/article55.html</loc>
<n:news>
<n:publication>
<n:name>El Mundo</n:name>
<n:language>es</n:language>
</n:publication>
<n:access>subscription</n:access>
<n:genres>pressrelease, blog</n:genres>
<n:publication_date>23-12-2008</n:publication_date>
<n:title>A y B negocian una posible fusión</n:title>
<n:keywords>business, merger, acquisition, A, B</n:keywords>
<n:stock_tickers>NASDAQ:A, NASDAQ:B</n:stock_tickers>
</n:news>
</url>
</urlset>

Definiciones de etiquetas específicas de Google Noticias

Etiqueta ¿Necesaria? Descripción
<publication_name>
La etiqueta <publication> especifica la publicación en la que aparece el artículo. Contiene dos etiquetas secundarias obligatorias: <name> y <language>. La etiqueta <name> es el nombre de la publicación. Debe coincidir exactamente con el nombre que aparezca en los artículos de su sitio incluidos en news.google.com/news?ned=es, omitiendo cualquier paréntesis posterior. Por ejemplo, si el nombre aparece en Google Noticias como “El Mundo (suscripción)”, debe utilizar el nombre “El Mundo”. La etiqueta <language> indica el idioma de la publicación. Debe estar representado mediante un código de idioma ISO 639 (de 2 o 3 letras). Excepción: en el caso del chino, se debe utilizar “zh-cn” para el chino simplificado o “zh-tw” para el chino tradicional.
<access>
Sí, si el acceso no es libre; si no, se debe omitir. Entre los posibles valores se incluyen “Subscription” y “Registration”, que describen la accesibilidad del artículo. Si los lectores de Google Noticias pueden acceder al artículo sin registrarse ni suscribirse, esta etiqueta se debe omitir.
<genres>
Sí, si procede especificar el género; si no, se puede omitir. Una lista separada por comas de las propiedades que caractericen el contenido del artículo como, por ejemplo, “PressRelease” o “UserGenerated”. Para obtener una lista de posibles valores, consulte las propiedades de contenido de Google Noticias. El tipo de contenido se debe especificar con exactitud para poder ofrecer unos resultados coherentes a los usuarios.
<publication_date>
Fecha de publicación del artículo en formato W3C; se puede utilizar el formato de “fecha completa” (DD-MM-AAAA) o el formato de “fecha completa, más horas, minutos y segundos” (DD-MM-AAAAThh:mm:ss), al que se pueden añadir opcionalmente los sufijos de fracción de segundo y zona horaria. Asegúrese de indicar la fecha y hora de publicación del artículo en su sitio, no la fecha/hora de inclusión del artículo en el sitemap.
<title>
Título del artículo informativo. Nota: el título puede aparecer truncado en Google Noticias por restricciones de espacio.
<keywords>
No Una lista separada por comas de palabras clave que describan el tema del artículo. Las palabras clave se pueden extraer de la lista de palabras clave de Google Noticias existente, pero también se pueden extraer de otros lugares.
<stock_tickers>
No Una lista separada por comas de un máximo de cinco indicadores de cotización de empresas, fondos de inversión u otras entidades financieras que constituyan el tema principal del artículo. Estas etiquetas resultan especialmente interesantes para los artículos empresariales. Cada indicador debe comenzar con el nombre de su bolsa de valores y coincidir con su entrada en Google Finance. Por ejemplo, “NASDAQ:AMAT” (no “NASD:AMAT”) o “BOM:500325” (no “BOM:RIL”).

Ten en cuenta lo siguiente:

  • Tu sitemap de noticias solo debe contener direcciones URL de los artículos que se hayan publicado en su sitio en los dos últimos días.
  • Actualiza tu sitemap de noticias continuamente con artículos nuevos en cuanto se publiquen. Google Noticias rastrea los sitemaps de noticias con la misma frecuencia con la que rastrea el resto del sitio.
  • Un sitemap de noticias no puede contener más de 50.000 direcciones URL. Si quiere incluir más, puedes repartirlas en varios sitemaps y utilizar un archivo de índice de sitemaps para administrarlas. Utiliza el formato XML que se facilita en el protocolo de sitemaps. Su archivo de índice de sitemaps no debe contener más de 1.000 sitemaps. Esta limitación nos permite garantizarle que su servidor web no sufrirá una sobrecarga causada por la transmisión de archivos de gran tamaño a Google Noticias.

Más información en:
http://www.google.com/support/webmasters/bin/answer.py?hl=es&answer=74288

 

Dejar respuesta