TagCloud (beta)
TagCloud es servicio on-line de creación de nubes de etiquetas a partir de un conjunto de feeds RSS que vía javascript puede incorporarse a cualquier sitio web. Se definen como una herramienta de automatización de folcsonomías originadas a partir de grupos de feeds.
Las direcciones de los feeds pueden agregarse manualmente una a una, o bien especificar un archivo OPML a partir de una URL o subiendo directamente el archivo.
Las palabras clave del contenido de los feeds se extraen mediante el servicio web Content Analysis de Yahoo, y la relevancia entre ellas -que hace que se muestren con mayor o menor tamaño en la nube de etiquetas- se resuelve por el número de artículos que hacen referencia a una misma palabra clave.
Lo he probado y en blogs en inglés funciona bastante bien:
http://www.tagcloud.com/cloud/html/code_dotnet/default
Sin embargo, para una serie de feeds en castellano, deja bastante que desear:
http://www.tagcloud.com/cloud/html/sobre_cine/default
La diferencia en la calidad de los resultados es enorme, destacando que la palabra “que” no ha sido descartada por la herramienta de análisis de Yahoo. No sé si el problema estará en que TagCloud ignora directamente la especificación de idioma de los feeds, o bien que algunos feeds omiten la declaración de idioma, o que el analizador de Yahoo no permite indicar el idioma y solo funciona en inglés.
Actualización: Les he enviado un e-mail avisando de estos problemas con el contenido en castellano y me han confirmado que se trata de la herramienta de análisis de Yahoo, que de momento solo extrae adecuadamente palabras de contenidos en inglés. Sin embargo me comentan que para resolver este problema próximamente incluirán la funcionalidad de descartar palabras no deseadas:
…We will soon be releasing a ’stop-words’ list for each cloud, so you can exclude certain terms…

