¿Qué es Data Science?
Data Science es un campo interdisciplinario que utiliza conceptos de estadística, matemática y programación, en conjunto con herramientas tecnológicas, para extraer información de los datos para tomar mejores decisiones.
La extensa cantidad de datos que las empresas y compañías generan por medio de sus clientes, procesos y usuarios, se ha convertido en los últimos años en una especie de diamante en bruto, ya que su valor es incalculable. Ahora, ¿cómo se pueden aprovechar estos datos para el beneficio de sus decisiones de negocio?
Para tomar decisiones más acertadas en una empresa, necesitamos extraer información de los datos. Esto se logra estructurando, visualizando, analizando y haciendo predicciones acerca de posibles comportamientos del futuro del negocio.
También puede interesarte: Expertos afirman que el data scientist es una profesión “trendy”
Así surge Data Science, un campo interdisciplinario que unifica la estadística, la matemática aplicada, la informática y herramientas tecnológicas, con el objetivo de comprender, analizar y predecir el comportamiento de los datos.
“Data Science es una disciplina que nace dentro de la Investigación de Operaciones, área que busca darle un racional a las decisiones, con el objetivo de analizar grandes cantidades de datos”,
Explica Jorge Samayoa, director del Instituto de Investigación en Operaciones (IIO) en la Universidad Galileo que ofrece la Maestría en Business Intelligence and Analytics y la Maestría en Data Science.
“Por ejemplo, en Estados Unidos, muchas empresas vieron cómo Google implementó las recomendaciones a sus usuarios basadas en sus propias búsquedas. Como fue exitoso, otras empresas se interesaron en hacerlo también. Esto es Data Science”, comenta Preng Biba, coordinador académico del IIO.

Otros términos que debes conocer
Data Science, como su nombre lo dice, es una ciencia la cual ha sido utilizada en una gran variedad de aplicaciones, las cuales han dado lugar a confusión acerca del término.
Te presentamos algunos de los términos que se relacionan directamente con Data Science, inclusive, algunos son subáreas, pero no resultan equivalentes.
- Big Data: Es el almacenamiento de grandes cantidades de datos y los procedimientos usados para encontrar patrones repetitivos dentro de esos datos. Por la enorme cantidad de datos almacenados, Big Data debe utilizar técnicas de sincronización y cooperación entre máquinas.
- Data Mining: Es el proceso de identificación de toda la información que es relevantes y es extraída de grandes cantidades de datos. Extrae información útil y de valor en donde, en un principio, no es evidente. Y, normalmente, se parte de datos no estructurados, como un texto generado por una persona o una imagen.
- Machine Learning: Es una disciplina científica del ámbito de la Inteligencia Artificial que crea sistemas que “aprenden” de manera automática. La “máquina” que realmente aprende es un algoritmo que utiliza los datos y realiza predicciones de comportamientos futuros, basados en modelos matemáticos, programados por un científico de datos.
Texto: GES Comunicación / Foto: Envato