Nuestro Trabajo
La pertinencia de esta iniciativa radica en que las plataformas digitales han transformado la esfera pública y las formas en que se debaten y configuran las ideas. Los discursos ya no pertenecen solo a sus comunidades de origen: se reinterpretan, se mezclan y adquieren nuevos sentidos a medida que transitan por redes sociales, medios y repositorios digitales.
Comprender esos procesos es fundamental para interpretar fenómenos contemporáneos como la recepción de la ciencia, las narrativas sobre tecnología o el papel social de la literatura.
Este proyecto nace de la necesidad de comprender cómo los discursos literarios, científicos y tecnológicos influyen hoy en la manera en que una sociedad define lo que considera aceptable.
En síntesis, esta iniciativa busca ofrecer una mirada profunda y actualizada sobre cómo se configuran los discursos que orientan la vida social, y cómo las humanidades y las tecnologías pueden trabajar juntas para comprenderlos mejor.
El proyecto también responde a un interés institucional por fortalecer las Humanidades Digitales y crear capacidades de análisis interdisciplinario.
- El desarrollo de archivos digitales.
- La articulación de semilleros y programas de formación avanzada.
- El uso de metodologías que integran lectura crítica, modelamiento computacional y análisis del discurso.
Con ello, la universidad amplía su potencial para generar conocimiento relevante y aportar a la reflexión pública de manera informada y rigurosa.
Temas Principales
Esfera Pública
Es el espacio social donde los ciudadanos debaten asuntos que afectan al conjunto de la sociedad. Allí confluyen las voces, prácticas y expresiones de la sociedad civil que reaccionan, discuten, cuestionan o respaldan decisiones colectivas.
Leer másLiteratura
Se entiende como un archivo vivo y plural que recoge, a lo largo del tiempo, los modos en que las sociedades imaginan, narran y debaten sus experiencias, incluyendo obras, subjetividades de autores, contextos culturales y prácticas de recepción.
Leer másCiencia y Tecnología
La ciencia se entiende como un conjunto de prácticas y discursos que circulan socialmente. La técnica es el saber hacer; la tecnología surge al combinar conocimiento científico y técnica para resolver problemas; y el objeto técnico es el producto concreto de ese proceso.
Leer másMetodología
Para comprender un volumen de información tan amplio y heterogéneo como el que circula hoy en la esfera pública, el proyecto recurre a las Humanidades Digitales, un campo que combina saberes de distintas disciplinas, desde la lingüística y la filosofía hasta la estadística, la ciencia de datos y la informática.
Este enfoque permite que, desde el proyecto, se puedan gestionar repositorios en múltiples formatos y analizar grandes conjuntos de textos mediante técnicas propias del Big Data y del Procesamiento del Lenguaje Natural, que identifican patrones semánticos, relaciones conceptuales o variaciones en el tono afectivo de los discursos.
A la vez, los métodos interpretativos tradicionales de las humanidades serán claves para trabajar con los corpus digitales seleccionados, articulando así la lectura crítica con herramientas computacionales.
Proceso
1.
Extracción
Para la caracterización de los discursos en la esfera pública mediante Humanidades Digitales, este proyecto se apoya en técnicas de procesamiento de texto y Lenguaje Natural, integradas en una adaptación del modelo CRISP-DM. El proceso inicia con la extracción de datos, donde se emplean herramientas de visión computacional para reunir y estructurar la información.
2.
Preprocesamiento
Luego se hace el preprocesamiento, en el que los textos se depuran y se transforman en representaciones numéricas, de modo que el corpus quede en condiciones óptimas para el análisis computacional.
3.
Procesamiento
En la fase de procesamiento, los datos se convierten en vectores o matrices que permiten captar patrones relevantes del discurso.
4.
Visualización y análisis
Finalmente, la etapa de visualización y análisis traduce los resultados en formas interpretables que facilitarán la comprensión de temas, relaciones y dinámicas discursivas dentro del corpus.
Presentación del corpus
El proyecto trabaja actualmente con un corpus construido a partir de columnas de opinión publicadas en El Espectador, Semana y El Tiempo, tres de los medios más influyentes en Colombia. Estas columnas se obtienen mediante técnicas de web scraping, un procedimiento que implica la revisión de aspectos legales y éticos.
Por ello, el equipo avanza bajo las recomendaciones del Comité de Ética de la Universidad EAFIT, garantizando el uso responsable de la información y la firma de cláusulas de confidencialidad cuando sea necesario. Este proceso adquiere especial importancia ante la posibilidad de que algunos sitios modifiquen o restrinjan su acceso en el futuro, lo que hace urgente asegurar la preservación del material.
La selección temporal —2019, 2020 y 2021— responde al impacto que tuvo la pandemia de COVID-19 en la esfera pública colombiana. Estos años concentran transformaciones significativas en los modos de comunicar, interpretar y debatir asuntos de interés colectivo.
Las columnas publicadas en este periodo permiten observar cómo la literatura, la ciencia y el vocabulario asociado a ambas áreas emergen y dialogan en el espacio mediático.
El corpus busca identificar menciones a obras, autores y lugares literarios, así como rastrear el uso de conceptos científicos que circularon en un momento de crisis sanitaria global. En conjunto, esta selección ofrece un material privilegiado para estudiar la manera en que distintos discursos se entrelazan y configuran la conversación pública en Colombia.
En los próximos años, el proyecto integrará otros corpus textuales.