Las nubes de palabras son gráficos que presentan las palabras de un texto en diversos tamaños y colores en proporción a su frecuencia. Suponen un gran recurso estadístico y visual que ofrece buena información y no pocas sorpresas.
Jason Davis, experto en visualización de datos, publica un magnífico generador wordcloud que busca en internet (twitter, wikipedia….) la palabra o frase deseada y genera la nube correspondiente con 250 palabras (por defecto) o la cantidad que se asigne. Puede elegirse el tipo de presentación variando la fuente, la cantidad de posturas de las palabras y el rango de inclinación, cualquier intervalo contenido en [−90º, 90º], así como el tipo de espiral (arquimediana o rectangular) y la escala (log n, √n, n), lo que sirve de paso para experimentar y aprender estos conceptos.
Y además el autor ofrece el código, que requiere D3 de Mike Bostock, con detalladas explicaciones sobre su uso, incluyendo una crítica a la representación en nube, y unos buenos enlaces para profundizar en este tipo de visualización de datos.
Introduciendo Carnaval de Matemáticas he obtenido la nube de la imagen, donde no podían faltar Dixit, Tito, blog, 3,141592… y otras palabras míticas del evento.
Clic en la imagen envía al wordcloudgenerator, donde se puede probar y ver que en cada momento se obtiene un resultado distinto.
Esta entrada participa en la edición 3.1415926535 del Carnaval de Matemáticas cuyo blog anfitrión es La Aventura de la Ciencia.