+51 997218531
proyectos_tic@jagi.pe
Regístrate
si no tienes cuenta
Ingresa
con tu cuenta
Mi Perfil
mi reseña de usuario
JAGI S.A.C.
Soluciones Integrales TIC
Inicio
Nuestros servicios
Nuestro trabajo
Qué aportamos
Nosotros
Por qué elegirnos
Te apoyamos
Sobre nosotros
Nuestro equipo
Servicios Profesionales
Proceso de trabajo
Nuestro trabajo
Nuestros servicios
Clientes satisfechos
Blog
Contacto
Búsqueda general
Home
All Courses
Exámenes Internacionales
Academia de Ciencia de Datos Next-Gen
Científico de Big Data Examen
Curriculum
2 Sections
2 Lessons
52 Weeks
Expand all sections
Collapse all sections
Módulo 4: Fundamentos de Análisis y Ciencia de Big Data
Se cubren los siguientes temas principales:
Ciencia de datos, minería de datos y modelado de datos
Categorías de conjuntos de datos de Big Data
Conjuntos de datos de alto volumen, alta velocidad, alta variedad, alta veracidad, alto valor
Análisis exploratorio de datos (EDA)
Resúmenes numéricos de EDA, reglas y reducción de datos
Tipos de análisis de EDA, incluyendo univariante, bivariante y multivariante
Estadísticas esenciales, incluyendo categorías variables y matemáticas relevantes
Análisis estadísticos, incluyendo descriptivo, inferencial, covarianza, pruebas de hipótesis, etc.
Medidas de variación o dispersión, rango intercuartil y valores atípicos, puntuación Z, etc.
Probabilidad, frecuencia, estimadores estadísticos, intervalo de confianza, etc.
Manipulación de datos y Machine Learning
Variables y notaciones matemáticas básicas
Medidas estadísticas e inferencia estadística
Análisis confirmatorio de datos (CDA)
Prueba de hipótesis CDA, hipótesis nula, hipótesis alternativa, significancia estadística, etc.
Distribuciones y técnicas de procesamiento de datos
Discretización de datos, Binning y agrupamiento
Técnicas de visualización, incluyendo gráfica de barras, gráfica de líneas, histograma, polígonos de frecuencia, etc.
Predicción de regresión lineal, error cuadrático medio y coeficiente de determinación R2, etc.
Agrupamiento K-medias, distorsión del agrupamiento, valores de características faltantes, etc.
Resúmenes numéricos
1
0.0
Módulo 5: Análisis y Ciencia de Big Data Avanzados
Se cubren los siguientes temas principales:
Modelado, evaluación de modelos, ajuste de modelos y sobreajuste de modelos
Modelos estadísticos, medidas de evaluación de modelos
Validación cruzada, sesgo-varianza, matriz de confusión y puntuación F
Algoritmos de Machine Learning e identificación de patrones
Reglas de asociación y algoritmo Apriori
Reducción de datos, selección de la dimensión de las características
Extracción de datos, discretización de los datos (Binning y agrupamiento)
Técnicas estadísticas avanzadas
Paramétrico versus no paramétrico, agrupamiento versus no agrupamiento
Basado en distancia, supervisado versus semisupervisado
Regresión lineal y regresión logística para Big Data
Reglas de clasificación para Big Data
Regresiones logísticas, Naïve Bayes, Suavizamiento de Laplace, etc.
Árboles de decisiones para Big Data
Poda de árboles, división de características, algoritmo de una regla (1R)
Identificación de patrones, reglas de asociación, algoritmo Apriori
Análisis de series de tiempo, tendencia, estacionalidad
K-vecinos cercanos (kNN), K-medias
Analíticas de texto para Big Data
Bolsa de palabras, frecuencia de términos, frecuencia de documentos inversos, distancia de coseno, etc.
Detección de datos atípicos para Big Data
Técnicas estadísticas, basadas en distancia, supervisadas y semisupervisadas
1
0.0
This content is protected, please
login
and
enroll
in the course to view this content!
Shopping Basket
error:
¡Este contenido está protegido!
Modal title
Main Content