Nuestro Trabajo
La pertinencia de esta iniciativa radica en que las plataformas digitales han transformado la esfera pública y las formas en que se debaten y configuran las ideas. Los discursos ya no pertenecen solo a sus comunidades de origen: se reinterpretan, se mezclan y adquieren nuevos sentidos a medida que transitan por redes sociales, medios y repositorios digitales.
Los discursos ya no pertenecen solo a sus comunidades de origen:
se reinterpretan, se mezclan y adquieren nuevos sentidos a medida que transitan por redes sociales, medios y repositorios digitales.
Comprender esos procesos es fundamental para interpretar fenómenos contemporáneos como la recepción de la ciencia, las narrativas sobre tecnología o el papel social de la literatura.
Este proyecto nace de la necesidad de comprender cómo los discursos literarios, científicos y tecnológicos influyen hoy en la manera en que una sociedad define lo que considera aceptable.
Temas Principales
Esfera Pública
Es el espacio social donde la ciudadanía debate asuntos de interés colectivo, diferente tanto de la vida privada como de la gestión gubernamental.
Leer másLiteratura
Se entiende como un archivo vivo de obras, prácticas creativas y experiencias de lectura que dialogan con el mundo y con la tradición cultural.
Leer másCiencia y Tecnología
La ciencia se entiende como un conjunto de prácticas y discursos que circulan socialmente; la técnica es el saber hacer, la tecnología su aplicación, y el objeto técnico su resultado.
Leer másMetodología
Para comprender un volumen de información tan amplio y heterogéneo como el que circula hoy en la esfera pública, el proyecto recurre a las Humanidades Digitales, un campo que combina saberes de distintas disciplinas, desde la lingüística y la filosofía hasta la estadística, la ciencia de datos y la informática.
Este enfoque permite que, desde el proyecto, se puedan gestionar repositorios en múltiples formatos y analizar grandes conjuntos de textos mediante técnicas propias del Big Data y del Procesamiento del Lenguaje Natural, que identifican patrones semánticos, relaciones conceptuales o variaciones en el tono afectivo de los discursos.
A la vez, los métodos interpretativos tradicionales de las humanidades serán claves para trabajar con los corpus digitales seleccionados, articulando así la lectura crítica con herramientas computacionales.
En síntesis, esta iniciativa busca ofrecer una mirada profunda y actualizada sobre cómo se configuran los discursos que orientan la vida social, y cómo las humanidades y las tecnologías pueden trabajar juntas para comprenderlos mejor.
Proceso
1.
Extracción
Para la caracterización de los discursos en la esfera pública mediante Humanidades Digitales, este proyecto se apoya en técnicas de procesamiento de texto y Lenguaje Natural, integradas en una adaptación del modelo CRISP-DM. El proceso inicia con la extracción de datos, donde se emplean herramientas de visión computacional, para reunir y estructurar la información.
2.
Preprocesamiento
Luego se hace el preprocesamiento, en el que los textos se depuran y se transforman en representaciones numéricas, de modo que el corpus quede en condiciones óptimas para el análisis computacional.
3.
Procesamiento
En la fase de procesamiento, los datos se convierten en vectores o matrices que permiten captar patrones relevantes del discurso.
4.
Visualización y análisis
Finalmente, la etapa de visualización y análisis traduce los resultados en formas interpretables que facilitarán la comprensión de temas, relaciones y dinámicas discursivas dentro del corpus.
Presentación corpus
El proyecto trabaja actualmente con un corpus construido a partir de columnas de opinión publicadas en El Espectador, Semana y El Tiempo, tres de los medios más influyentes en Colombia. Estas columnas se obtienen mediante técnicas de web scraping, un procedimiento que implica la revisión de aspectos legales y éticos
Por ello, el equipo avanza bajo las recomendaciones del Comité de Ética de la Universidad EAFIT, garantizando el uso responsable de la información y la firma de cláusulas de confidencialidad cuando sea necesario. Este proceso adquiere especial importancia ante la posibilidad de que algunos sitios modifiquen o restrinjan su acceso en el futuro, lo que hace urgente asegurar la preservación del material.
La selección temporal, 2019, 2020 y 2021, responde al impacto que tuvo la pandemia de COVID-19 en la esfera pública colombiana. Estos años concentran transformaciones significativas en los modos de comunicar, interpretar y debatir asuntos de interés colectivo.
Las columnas publicadas en este periodo en las páginas web de los medios mencionados permiten observar cómo la literatura, la ciencia y el vocabulario asociado a ambas áreas emergen y dialogan en el espacio mediático.
El corpus busca identificar menciones a obras, autores y lugares literarios, así como rastrear el uso de conceptos científicos que circularon en un momento de crisis sanitaria global. En conjunto, esta selección ofrece un material privilegiado para estudiar la manera en que distintos discursos se entrelazan y configuran la conversación pública en Colombia.
En los próximos años, el proyecto integrará otros corpus textuales.