EBOOK

Ciencia de Datos a través de R Aprendizaje no Supervisado: Clasificación y Segmentación

César Pérez LópezSeries: Data Science
(0)

About

La ciencia de datos es un campo interdisciplinario que utiliza métodos, algoritmos, procesos y sistemas para extraer conocimiento y conclusiones de datos estructurados y no estructurados. Combina elementos de estadística, informática, matemáticas y técnicas analíticas para resolver problemas, hacer predicciones y generar valor a partir de los datos. Se apoya en el big data para descubrir patrones, tendencias y relaciones que puedan utilizarse para la toma de decisiones en diversas industrias. Es un soporte importante para la Inteligencia Artificial. La ciencia de datos utiliza dos tipos de técnicas: el aprendizaje supervisado, que entrena un modelo con datos de entrada y salida conocidos para predecir resultados futuros, y el aprendizaje no supervisado, que encuentra patrones ocultos o estructuras intrínsecas en los datos de entrada. La mayoría de estas técnicas de aprendizaje no supervisado se desarrollan a lo largo de este libro desde un punto de vista metodológico y desde un punto de vista práctico con aplicaciones a través del software Python. Se cubren las siguientes técnicas: reducción de dimensión, análisis de componentes principales, análisis factorial, análisis de correspondencia simple, análisis de correspondencia múltiple, escalamiento multidimensional, redes neuronales (SOM Kohonen, etc.), reconocimiento de patrones, detección de anomalías, autocodificadores, procesamiento de imágenes y redes neuronales convolucionales (redes CNN). PhD. Mathematician, Economist and Government Statistician. Professor at the Complutense University of Madrid in the Department of Statistics and Data Science. Author of more than 100 books and articles on Mathematics, Statistics, Economics, and Computer Science.

Related Subjects

Extended Details

Artists