¿Qué es Text Mining?
Con el proceso de Text Mining se pueden descubrir patrones en un texto que serán útiles para escribir uno nuevo que tenga el mismo “mood” que la escritura original.
El Text Mining, también llamado Minería de Textos, es el conjunto de técnicas y tecnologías que se utilizan para explorar grandes cantidades de texto, de manera automática o semiautomática, y descubre patrones repetitivos, tendencias o reglas que explican el comportamiento del texto.
También puedes leer: ¿Qué es Data Science?
El objetivo del Text Mining, que es parte esencial de la Ciencia de Datos, es ayudar a comprender el contenido de un conjunto de textos por medio de estadísticas y algoritmos de búsqueda relacionados a la Inteligencia Artificial.
Jorge Samayoa, director del Instituto de Investigación en Operaciones (IIO) en la Universidad Galileo, explica que: “Con Texto Mining estudiamos algoritmos que nos ayudan a entender la estructura de un texto, así como el contexto en el que fue escrito; con el objetivo de extraer información no evidente”.
Otro artículo que puede interesarte: Expertos afirman que el data scientist es una profesión “trendy”

“Así que, un ejemplo es tomar tres libros de un autor y crear un algoritmo para que una máquina escriba un nuevo párrafo que, en pocas palabras, tenga ‘sabor a ese autor’ porque incluirá una estructura similar a los textos originales”, añade.
“Primero se retiran palabras que no sumarán al proceso de minado, como los artículos ‘el’, ‘la’ y ‘los’. De esa ‘bag of words’ que queda, se procede a identificar palabras clave y patrones de oraciones que se relacionan específicamente con el texto que se analiza”, expresa Samayoa.

En este proceso se incluyen tareas de Sentiment Analysis, con el objetivo de identificar la subjetividad y la polaridad con la que el texto fue escrito.
“La medición del sentiment nos ayuda a entender no solamente qué se está diciendo sobre un tema, sino también la actitud, ya sea positiva o negativa con la que fue escrito”, explica Preng Biba, coordinador académico de IIO.

“Una aplicación que ha tomado mucha relevancia son los chatbots, que son algoritmos de text mining que simulan a una persona atendiendo consultas por medio de chats,” comenta José Ramírez, sub-director del IIO.
Si quieres saber más acerca del IIO y de las maestrías que trabajan con Data Science y Text Mining, ingresa en: Maestría en Business Intelligence and Analytics o Maestría en Data Science