M3. Computación distribuïda para Big Data

La minería de datos se ha utilizado de manera intensiva y extensiva por muchas organizaciones. En ciencias de la vida, la minería de datos es cada vez más popular, incluso se podría decir cada vez más esencial. Las aplicaciones de minería de datos pueden beneficiar enormemente a todas las partes involucradas en el sector de la salud. Por ejemplo, la minería de datos puede ayudar a las aseguradoras a detectar el fraude y el abuso, las organizaciones sanitarias toman decisiones de gestión de relaciones con los clientes, los médicos identifican tratamientos eficaces y las mejores prácticas, y los pacientes reciben mejores y más asequibles servicios asistenciales. La enorme cantidad de datos generados por las transacciones de atención médica son demasiado complejos y voluminosos para ser procesados y analizados por métodos tradicionales. La minería de datos proporciona la metodología y la tecnología para transformar estas cantidades ingentes de datos en información útil para la toma de decisions

INTRODUCCIÓN A LA MINERÍA DE DATOS

Proceso de minería de datos

Tipos de datos. .Atributos de los datos. Datasets

Descripción estadística básica de los datos

Data Visualization

Reducción de la dimensionalidad: selección de características

Herramientas para minería de datos: Anaconda + Python + Pandas + SkLearn

PRE-PROCESAMIENTO DE DATOS

Data Cleaning

Data Integration

Data Reduction

Data Transformation and Discretization

CREACIÓN DE MODELOS: APRENDIZAJE NO SUPERVISADO

Metodos supervisados y no supervisados

Clusterización I: Algoritmo k-means

Clusterización II: Aglomeración jerárquica

Búsuqeda de patrones frecuentes: Reglas d

Campus d'excel·lència internacional U A B