La forma en que Morse averiguó qué letras se usan más para que las comunicaciones fueran más ágiles

Antes de la llegada de las telecomunicaciones, si querías que alguien que vivía lejos recibiera un mensaje debías encomendarte al correo a caballo o correr tú mismo con el mensaje, al estilo Forrest Gump.

Otra opción era ir encendiendo fuego en diversas atalayas interconectadas visualmente, como sucede en El señor de los anillos. Una opción que, por ejemplo, se empleó en la Guerra de Troya: entonces se recorrieron cientos de kilómetros en menos de un día, tal y como podéis leer con más con más detalle en Recorriendo el fuego griego al estilo de ‘El señor de los anillos’ en plena guerra de Troya.

Más tarde, la velocidad de los mensajes, entonces, se volvió casi instantánea gracias a un invento bastante reciente: el telégrafo. Este dispositivo fue inventado por Samuel Finley Breese Morse, estadounidense, en 1832. El 24 de mayo de 1844, Morse transmitió el mensaje que se haría tan famoso: “Qué nos ha forjado Dios“ (traducción literal) o también: “Lo que Dios ha creado“ (What hath God wrought, una cita bíblica, Números 23:23) desde la Corte Suprema de los Estados Unidos en Washington, D.C. a su asistente, Alfred Vail, en Baltimore, Maryland.

Sin embargo, escribir en Morse aún era más lento que hablar, así que Morse y Vail, en aras de incrementar la velocidad de transmisión, se dieron cuenta de que podían ahorrar golpes de telégrafo reservando las secuencias más cortas de puntos y rayas para las letras más corrientes. Sin embargo, en aquella época todavía se conocía muy poco sobre las estadísticas del alfabeto. Hasta que Vail tuvo una idea.

Viajó a New Jersey para visitar las oficinas del periódico local de Morristown. Examinó las cajas tipográficas, descubriendo que había un surtido de 12.000 “e”, 9.000 “t” y sólo 200 “z”, tal y como explica James Gleick en su libro La información:

Vail y Morse reorganizaron el alfabeto según estos datos. Originalmente habían usado raya-raya-punto para representar la “t”, la segunda letra más corriente; así que ascendieron a la “t” y le asignaron una sola raya, ahorrando así a los operadores telegráficos del futuro millones y millones de pulsaciones en el teclado. Mucho tiempo después, los teóricos de la información calcularían que aquello había supuesto una ganancia de casi un quince por ciento para un texto telegráfico inglés.

Un siglo más tarde, los estudios sobre la frecuencia de las letras y de las palabras en distintos idiomas se han desarrollado mucho más, sobre todo a raíz de la investigación del el lingüista de Harvard George Kingsley Zipf (1902-1950), que afirmó que un pequeño número de palabras son utilizadas con mucha frecuencia, mientras que frecuentemente ocurre que un gran número de palabras son poco empleadas.

Para conocerlas, debemos coger un texto con más de 5.000 palabras y, entonces, se calcula cuántas veces aparece una palabra concreta. Se ordena la tabla de palabras de más a menos frecuente. El orden en que aparece cada palabra en esta lista ordenada se llama “rango”.

En el idioma español, por ejemplo, las palabras que encabezan este rango siempre son artículos y preposiciones. El Quijote tiene 23.516 palabras distintas, de las 11.584 aparecen una sola vez. Como las otras 11.932 palabras se repiten una o más veces, el total de palabras contenidas en el libro es de 383.382.

Cifras que no se podían calcular cuando nos comunicábamos binariamente con fuegos desde atalayas, pero que resultan muy pertinentes a la hora de organizar y transmitir la información de la forma más económica posible. Podéis leer más sobre ello en La ley de Zipf: la frecuencia con la que una palabra aparece en un texto.

Ver todos los comentarios en https://www.xatakaciencia.com

VER 1 Comentario

Portada de Xataka Ciencia