Etiquetando fotos: ¿gatos que se parecen a Hitler?

2 septiembre 2013, 20:37

Sergio Parra

No falla. Cuando un lindo gatito aparece en forma de vídeo o fotografía por la Red, enseguida oiremos comentarios de voz aguda, casi llena de helio de tan chillona, pronunciando variantes de “quéééé monoooo”. Los gatitos son omnipresentes. Internet no sería lo mismo sin los gatitos. Eso es así.

Para alguien que tenga una concepción jerárquica de la cultura o de la pureza de los datos, tal invasión felina debe resultarle una epidemia peligrosa. Sin embargo, cuando el mundo se llena de datos masivos, entonces lo abundante y lo confuso (aunque esté jalonado de gatos) se vuelve preferible a lo poco abundante y exacto.

En un mundo 1.0, donde los datos, a pesar de todo, no eran demasiado abundantes, la categorización de contenidos funcionaba relativamente bien. Las bibliotecas podían indexar sus libros. Pero de un tiempo a esta parte, obtener los mismos resultados de organización resultan estériles.

Por ejemplo, en 2011, la inmensa red social de fotografías Flickr contenía nada menos que 6.000.000 de fotos y 75.000.000 usuarios. Imaginaos tratar de etiquetar, una a una, todas las fotografías, y además hacerlo en categorías fijas. Tal taxonomía, por ejemplo, jamás habría tenido en cuenta los “gatos que se parecen de Hitler”, tal y como explican Viktor Mayer-Schönberger y Kenneth Cukier en Big Data:

En vez de eso, las taxonomías estrictas están dejando el sitio a unos mecanismos más imprecisos pero eminentemente más flexibles y adaptables a un mundo que evoluciona y cambia. Cuando subimos fotos a Flickr, las “etiquetamos”. Es decir, que les asignamos un número cualquiera de etiquetas textuales, y las usamos para organizar el material y buscar por él. Las etiquetas las crean y colocan los usuarios de forma ad hoc: no hay categorías estándar predefinidas, ninguna taxonomía preexistente a la que haya que ceñirse. Más iben, cualquiera puede añadir nuevas etiquetas, tags, con solo escribirlas. El etiquetado se ha impuesto como el estándar de facto para la clasificación en Internet, y se emplea en las redes sociales como Twitter, especialmente por lo que se refiere a contenidos como imágenes, vídeos y música que no están basados en texto, para los que las búsquedas por palabras no dan resultados.

A pesar de los errores y lagunas que produce el etiquetado manual por parte del usuario, e incluso de lo surrealista que puedan existir categorías del tipo “gatos que se parecen de Hitlet”, este sistema resulta más eficaz para ordenar las ingentes cantidades de información que los usuarios generan cada día: se sacrifica un poco de exactitud para obtener mayor abundancia de contenido, adquiriendo, además, un universo taxonómico mucho más rico y flexible.

Este pequeño caos permite que monstruos como Wikipedia se muestren más eficaces que sus homólogos monolíticos: probablemente Wikipedia tiene algunos errores más que la Enciclopedia Británica, pero ello es precisamente lo que permite que Wikipedia tenga una entrada sobre los “escraches” a las pocas horas de producirse el fenómeno en España, con vídeos, links a artículos y toda la pesca.

Wikipedia puede ser miles de veces más grande e inmediata que cualquier otra enciclopedia de la historia porque su fundador comprendió la filosofía que reside bajo el hecho de gestionar grandes cantidades de información que no son la verdad revelada y está sujeta continuamente a revisión.

La imprecisión inherente al etiquetado implica aceptar el desorden natural del mundo. Es un antídoto para sistemas más precisos que intentan imponer una esterilidad falaz sobre el tumulto de la vida real, fingiendo que todo cuanto hay bajo el sol puede disponerse en unas filas y columnas ordenadas. Hay más cosas en el cielo y en la tierra de las que sueña esa filosofía.

Ver todos los comentarios en https://www.xatakaciencia.com

VER 6 Comentarios

Portada de Xataka Ciencia