Читать книгу Big data. IFCT128PO - José Antonio Castillo Romero - Страница 16
3.1. Conceptos clave
ОглавлениеComo habrás notado, un término que aparece en infinidad de veces es el de datos, ya que es la esencia del big data. Conviene que aprendas algunos términos que definen los tipos de conjuntos de datos creados y otros relacionados con estos, ya que aparecerán en más ocasiones:
1 Algoritmo: conjunto o secuencia de operaciones sistemáticas, lógicas y finitas que permiten realizar un cálculo y encontrar la solución a un problema como, por ejemplo, analizar datos.
2 Analytics: forma en la que una información se puede capturar, procesar y analizar para convertirla en aprendizaje. Este proceso se ejecuta después del data mining.
3 Small data: menor que el big data. Este concepto define un volumen menor de datos con lo que se trabaja.
4 Datos estructurados y no estructurados: los datos estructurados cuentan con una estructura lógica ordenados en columnas y tablas, y es necesario que el sistema conozca el formato de los datos para su guardado, pero son una fuente menor de extracción de información para el big data. Los datos no estructurados o desorganizados, como los e-mail, son una fuente mayor de aprendizaje con fines comerciales para el big data. Además, el sistema los guardará sin una estructura definida, solo como una de datos codificada.
5 Dark data: son datos que si un sistema no está configurado específicamente para leerlos, se considerarán desconocidos.
6 Data cleansing: método por el cual los bancos de datos mantienen su integridad, evitando datos corruptos irrelevantes.
7 Data lake: gran volumen de datos o lago de datos en estado natural, donde el científico de datos o data scientist debe adquirir el conocimiento.
8 Dirty data: conjunto de registros de datos capturados en bruto y sin limpiar.
9 Fast data: datos que deben analizarse en tiempo real, ya que su período de información útil es corto.
10 Slow data: datos con información de larga duración.
11 Medium data: cantidad de datos suficiente para generar conocimiento, pero menor cantidad que el big data.
12 Predictive analytics: análisis predictivo de datos.
13 Deep learning: conjunto de algoritmos destinados al aprendizaje automático.