Hero Image

Noticias

Profesora investigadora de Faro UDD participó en seminario realizado en Vancouver, Canadá

Se trata de la Annual Meeting of the History of Economic Society, que esta vez fue en Vancouer, Canadá, del 22 al 25 de junio. La Profesora Investigadora de Faro UDD, María Paz Raveu y el profesor de la Facultad de Gobierno Juan Pablo Couyoumdjian expusieron «Towards an economic ontology based on automatic word analysis», en la sesión sobre «Text as data».

¿Es posible encontrar familias temáticas en toda la economía? ¿El uso y la connotación de los términos de uso frecuente en economía cambian a lo largo del tiempo y los autores?  Este trabajo pretende abordar estas cuestiones a través de una metodología de análisis automático de textos y teoría de redes. Para ello, analizamos las obras de autores clásicos de economía en diferentes épocas y proponemos un análisis basado en las relaciones semánticas entre palabras de connotación económica. En general, el “giro cuantitativo” en el campo de la historia y la metodología de la economía debería aspirar a ser una herramienta complementaria que ayude a los investigadores a encontrar nuevos conocimientos y preguntas de investigación. Como ha sido en otras áreas de la ciencia, las humanidades digitales pueden ser una herramienta útil si conocemos y aceptamos sus limitaciones.

Los textos analizados cubren distintas etapas de la historia en economía, desde Adam Smith hasta autores más modernos como Francis Edgeworth. En total se analizaron 24 textos de 19 autores. La mayor parte de los textos fueron extraídos de Gutenberg Project y de la Online Library of Liberty de Liberty Fund.

El tamaño total del corpus es de 4.329.629 palabras, o 128.336 frases. Para homogenizar el lenguaje usamos sólo textos en inglés, o sus traducciones en los casos en que los textos originales están en francés o alemán. En general, se eliminaron los prefacios y las tablas de contenido, y no se eliminaron las notas al pie. En los textos más recientes, no se eliminaron fórmulas o expresiones matemáticas.

Un primer propósito de este trabajo es encontrar una ontología, o una estructura de conceptos relacionados en economía. Para eso usamos redes, que nos permiten entender relaciones entre elementos. En este caso, los elementos son las palabras y los enlaces entre palabras representan la relación semántica entre ellas. Una herramienta para capturar las relaciones semánticas son los Embeddings, modelos que permiten mapear palabras en un espacio vectorial multidimensional de tal forma que, dos palabras cercanas en dicho espacio tendrán una relación semántica. El modelo que usamos es Word2Vec, una red neuronal que aprende asociaciones entre palabras a partir de un corpus de texto.  La esencia de este modelo es que las palabras que comparten un vecindario similar – están rodeadas por las mismas palabras – tienen un significado similar.

El preprocesamiento para entrenar un modelo Word2Vec incluye la segmentación de frases, la lematización, eliminación de signos de puntuación, stopwords y números. Se entrenó un modelo usando el paquete gensim de Python, en este caso un modelo con una capa oculta de tamaño 300, con una ventana de 5 elementos. Como salida del modelo, se tiene un vector de 300 dimensiones para cada palabra única del vocabulario. La relación entre dos palabras podemos calcularla entonces como la similaridad coseno entre sus respectivos vectores. Puesto que la cantidad de palabras únicas es muy grande, y no todas ellas revisten un interés para el presente estudio, se creó un listado de palabras de interés económico. Para encontrar este vocabulario de interés se analizaron las 100 palabras más frecuentes de cada texto del corpus, y se escogieron de ellos los que tienen una interpretación principalmente económica, como “value”, “price”, “supply”, etc.

Luego, se representa la relación entre las palabras de nuestro vocabulario de interés mediante una red. En primer lugar, probamos creando una red mínima, una Minimum Spanning Tree, en la que todos los nodos están conectados, pero sólo hacia el nodo más cercano.

Un primer análisis a esta red debe hacerse para ver que tenga alguna interpretación con validez externa. Para ello, observamos las distintas ramas, y ciertos nodos que conectan las ramas. Observamos que un nodo de gran centralidad es “value” y nos fijamos en que abre una rama en dirección a “weigth” y de ahí emergen dos ramas que representan el dinero como estándar, una como estándar regulativo (“standard”, “law”) y otra como estándar de medición (“dollar”,”silver”). Continuando con el dinero, se abre desde “coin” una rama que tiene que ver con las instituciones relacionadas al dinero, como por ejemplo “paper”, “bank” o “bill”. Relacionado a este último término, está “debt”, que sirve como enlace a “government”, de donde se abren otras dos ramas, una relacionada con comercio internacional y otra relacionada con el Estado y la prosperidad de la nación.

El nodo “value” está conectado también a “exchange” y a una rama que parte en “price”. Esto representa uno de los ejes centrales de la economía, como es el precio y la teoría del valor.  En esta rama encontramos los elementos que determinan el precio, como “cost”, “demand” y “supply”. A partir del precio de equilibrio encontramos una rama, más reciente, que representa la teoría económica como un área de estudio. Finalmente, en lo que resta de la red encontramos el tema de la producción. Vemos los conceptos asociados a los factores de producción en la teoría clásica (labor, capital, land) y sus respectivos pagos (wage, interest, rent). Además de los conceptos asociados a los factores productivos, encontramos otros términos asociados a la producción, como “population”, y “industry” y “manufacture” en la estructura de la producción.

El análisis anterior tiene la ventaja de que, al ser una red mínima, no es necesario fijar umbrales para la creación de enlaces, y además la visualización es más clara. Ello nos permite aproximarnos a la red para entender los principales temas y nodos que hay.  Sin embargo, dado que solo admite un enlace entre nodos, la estructura es muy sensible a cualquier cambio. Por ello, para hacer un análisis que involucre la estructura, debemos crear una red con más enlaces. La red original es completa, dado que entre cada par de nodos se puede calcular una distancia coseno. Sin embargo, la red completa – aun con peso en los enlaces – no aporta tanta información (por ejemplo, no funcionan los algoritmos de detección de comunidades). Por ello se debe fijar un umbral para la creación de los enlaces. Luego de esto, aplicamos un algoritmo de detección de comunidades, específicamente el de Louvain. Las comunidades detectadas resultaron consistentes con los temas que aparecieron en la Minimum Spanning Tree. El análisis de redes se hizo con el paquete Igraph en lenguaje R. El trabajo en curso pretende analizar distintas etapas de la economía y comprar el uso de ciertos términos usando para ello redes locales.

Noticias relacionadas