La Evolución de la palabra "Gay" fue descubierta por Twitter. |
En 1950 la palabra se asociaba a conceptos como elegante y alegre, pero en la actualidad hace alusión a homosexual y lesbiana.
En octubre de 2012, el huracán Sandy se acercaba a la costa este de Estados Unidos. Al mismo tiempo, el idioma inglés estaba viviendo un pequeño terremoto propio. Apenas unos meses antes, la palabra "sandy" era un adjetivo que significaba "cubierto de o compuesto por arena", o "de color marrón claro amarillento". De la noche a la mañana, esta palabra adquirió un significado adicional, como nombre propio de una de las tormentas que más daños ha producido en la historia de EEUU.
La palabra "ratón" sufrió un cambio parecido a principio de los años 70, cuando se le concedió el nuevo significado de "dispositivo informático de input". En la década de 1980 la palabra "apple" (manzana) se convirtió en un nombre propio sinónimo de la empresa de ordenadores. Y un poco más tarde la palabra "windows" (ventanas) siguió un curso parecido con el lanzamiento del sistema operativo de Microsoft.
Todo esto sirve para demostrar que el lenguaje está en evolución constante, normalmente muy despacio, pero otras veces casi de un día para otro. Mantenerse al día de estos nuevos sentidos y significados siempre ha sido difícil. Pero eso se acabó.
Ahora, el investigador Vivek Kulkarni de la Universidad Stony Brook en Nueva York (EEUU), y su equipo han demostrado cómo seguir estos cambios lingüísticos minando el corpus de palabras almacenadas en bases de datos como Google Books, críticas de cine de Amazon y por supuesto Twitter, la red de microblogs.
Han desarrollado tres formas de detectar cambios en el lenguaje. La primera es un sencillo recuento de la frecuencia de uso de las palabras, mediante herramientas como Google Trends. Por ejemplo, en octubre de 2012, la frecuencia de la palabra "Sandy" y "huracán" se dispararon ante la llegada de la tormenta. Sin embargo, sólo una de estas palabras cambió de significado, algo que un recuento de la frecuencia no puede detectar.
Así que Kulkarni y su equipo tienen un segundo método en el que etiquetan todas las palabras de las bases de datos según su clasificación: nombre común, nombre propio, verbo, adjetivo y así sucesivamente. Este segundo método revela un cambio claro en el uso de la palabra "Sandy", de adjetivo a nombre propio y también demuestra que la palabra "huracán" no cambió.
Este análisis del tipo de palabras es útil pero no infalible, no detecta por ejempo el cambio de significado de la palabra ratón, que en ambos casos es un sustantivo. Así que el equipo ha desarrollado un tercer enfoque.
Este elabora un mapa del espacio vectorial lingüístico en el que se incorporan las palabras. La idea es que las palabras de este espacio están cerca de otras palabras que aparecen en contextos similares. Por ejemplo, la palabra "grande" está cerca de palabras como "extenso", "inmenso", "enorme" y así sucesivamente.
Al examinar el espacio lingüístico en distintos momentos históricos, se puede ver cómo han cambiado los significados. Por ejemplo, en la década de 1950, la palabra "gay" estaba cerca de palabras como "alegre" y "elegante". Hoy, sin embargo, se ha acercado significativamente a palabras como "lesbiana" u "homosexual".
Kulkarniy compañía examinan tres bases de datos distintas para ver cómo han cambiado las palabras: la serie de secuencias de cinco palabras que aparecen en el corpus de Google Books, las críticas de cine de Amazon desde el año 2000, y mensajes publicados en Twitter entre septiembre de 2011 y octubre de 2013.
Sus resultados revelan no sólo qué palabras han cambiado de significado, sino cuándo tuvo lugar el cambio y cuán rápido fue. Por ejemplo, antes de la década de 1970, la palabra "cinta" se usaba casi exclusivamente para describir la cinta adhesiva, pero a partir de entonces adquirió el significado adicional de "cinta de casete".
Antes de 1950, la palabra "plástico" se refería a algo flexible, pero la introducción del poliestireno popularizó su uso como definición de polímero sintético. Y antes de 1970, la palabra "dieta" se refería a la comida consumida por un individuo. Pero tras la publicación, en 1972 de Dr. Atkins' Diet Revolution, adquirió el significado adicional de un estilo de vida de consumo de comida.
Los investigadores han observado tendencias parecidas en Twiitter y Amazon con cambios en el uso de palabras como "candy", "streaming", y "sombras", que corresponden a la popularidad del juego Candy Crush Saga, el fenómeno de streaming de vídeo y la publicación de Cincuenta sombras de Grey en junio de 2012.
Es un vistazo fascinante a la evolución del lenguaje que demuestra cómo cambia nuestro idioma a todas las escalas y en una amplia gama de medios. "El efecto es especialmente prevalente en internet, donde el rápido intercambio de ideas puede cambiar el significado de una palabra de la noche a la mañana", afirma Kulkarni.
Y es algo que podría resultar útil para construir máquinas de procesado del lenguaje más capaces de comprender el lenguaje actual. Pero quizá lo más útil es que proporciona un registro del cambio del lenguaje y un mecanismo para observar los cambios actuales más o menos en tiempo real.