El por qué de las palabras cortas y largas


En 1935 George Kingsley Zipf, un lingüista de la Universidad de Harvard, afirmó que la magnitud de las palabras tiende a una relación inversa, aunque no necesariamente proporcional, con el número de ocurrencias. En otras palabras, las palabras más cortas se utilizan con más frecuencia que las largas. Ahora, unos investigadores del MIT (Massachusetts Institute of Technology) han demostrado una mejora sustancial a la ley de Zipf.


Estos investigadores descubrieron una propiedad universal del lenguaje humano: las palabras más frecuentes tienden a ser cortas, ya que hacen la comunicación más eficiente que usando palabras largas. Esto es debido a la presión de la eficacia comunicativa, tal y como Zipf conjuró. No sería práctico preguntar a todos en una cena de navidad si quieren un plato de sopa usando una palabra de 15 letras para la preposición “de”.

En el “Brown University Standard Corpus”, texto de 1960 que contiene alrededor de dos millones de palabras de texto, la palabra “of” es la cuarta más usada. Por otro lado, la palabra “the” es la palabra escrita más usada en la lengua de Shakespeare, seguida de otras como: “be”, “on”, “have”, “with” y “some”; todas ellas palabras muy cortas.

Sin embargo, científicos cognitivos del MIT han revelado una mejora sustancial de la ley Zipf. Han demostrado que, en unas 10 lenguas, la previsibilidad de lo que una persona dice se ve más influenciado por la longitud de la palabra que la frecuencia con la que esa persona la usa. Esto es así, porque la longitud de una palabra es inversamente proporcional a la cantidad de información que contiene.

De esta forma, el objetivo de la investigación era relacionar la teoría de la frecuencia de las palabras de Zipf con la previsibilidad de una palabra y su longitud.

Utilizando una base de datos enorme, los investigadores estudiaron todas las posibles combinaciones de dos, tres y cuatro palabras con idea de estimar como de previsible es su utilización. Conociendo esto podrían determinar si el contexto y la previsibilidad son más determinantes que la frecuencia de uso, en el tamaño de la palabra.

Sus conclusiones fueron que la frencuencia con las que usamos las palabras es un mejor predictor que la longitud de éstas. Tal y como afirma Steven Piantadosi, unos de los investigadores del MIT:

Me sorprendió que encontráramos este efecto en tantos idiomas: checo, holandés, inglés, francés, español, sueco, etc. Pensaba que las diferencias en la morfología, estructura de las palabras, etc. podrían modificar este hecho.

Vía | National Science Foundation

Portada de Xataka Ciencia