Este curso proporciona una visión a profundidad de las áreas temáticas esenciales y avanzadas relacionadas con las técnicas de ciencia de datos y análisis relevantes y exclusivas de Big Data, con énfasis en la forma en que el análisis y la analítica deben llevarse a cabo individual y colectivamente para apoyar las características, requisitos y retos particulares asociados con los conjuntos de datos de Big Data.
Se cubren los siguientes temas principales:
– Exploratory Data Analysis, Essential Statistics, including Variable Categories and Relevant Mathematics
– Statistics Analysis, including Descriptive, Inferential, Covariance, Hypothesis Testing, etc.
– Measures of Variation or Dispersion, Interquartile Range & Outliers, Z-Score, etc.
– Probability, Frequency, Statistical Estimators, Confidence Interval, etc.
– Variables and Basic Mathematical Notations, Statistical Measures and Statistical Inference
– Confirmatory Data Analysis (CDA)
– Data Discretization, Binning and Clustering
– Visualization Techniques, including Bar Graph, Line Graph, Histogram, Frequency Polygons, etc.
– Prediction Linear Regression, Mean Squared Error and Coefficient of Determination R2, etc.
– Numerical Summaries, Modeling, Model Evaluation, Model Fitting and Model Overfitting
– Statistical Models, Model Evaluation Measures
– Cross-Validation, Bias-Variance, Confusion Matrix and F-Score
– Association Rules and Apriori Algorithm
– Data Reduction, Dimensionality Feature Selection
– Feature Extraction, Data Discretization (Binning and Clustering)
– Parametric vs. Non-Parametric, Clustering vs. Non-Clustering
– Distance-Based, Supervised vs. Semi-Supervised
– Linear Regression and Logistic Regression for Big Data
– Logistics Regression, Naïve Bayes, Laplace Smoothing, etc.
– Decision Trees for Big Data
– Pattern Identification, Association Rules, Apriori Algorithm
– Time Series Analysis, Trend, Seasonality, K Nearest Neighbor (kNN), K-means
– Text Analytics for Big Data and Outlier Detection for Big Data
– Statistical, Distance-Based, Supervised and Semi-Supervised Techniques
Duración: 1 día
Tomar el Curso en un Taller
Este curso se puede tomar como parte de los talleres guiados e impartidos por Instructores Certificados de Arcitura. Estos talleres pueden estar abiertos para registrarse públicamente o pueden ser impartidos de manera privada para una organización en particular. Los Instructores Certificados pueden impartir los talleres en persona en una localidad específica o virtualmente utilizando un sistema remoto habilitado para video, como puede ser WebEx.
Visite la página del Calendario de Talleres para consultar el calendario actual de talleres públicos.
Visite la página de Capacitación Privada para obtener más información sobre las opciones de impartición de talleres privados que ofrece Arcitura en todo el mundo.
Tomar el Curso usando un Kit de Estudio Electrónico
Este curso puede ser completado por medio del autoestudio al adquirir una suscripción para kit de Estudio Electrónico, la cual incluye lecciones de video en línea, así como acceso en línea y offline a los materiales electrónicos del curso y a materiales y recursos adicionales diseñados para el autoestudio y la preparación de exámenes.
Visite la página de Kits de Estudio Electrónico para obtener más información sobre las suscripciones a material en línea.
Visite la tienda en línea de Transformación Digital para obtener información sobre compras.
Tomar el Curso usando un Kit de Estudio Impreso
Este curso puede ser completado por medio del autoestudio al adquirir un kit de estudio impreso, el cual incluye los materiales del curso a todo color, así como materiales y recursos adicionales diseñados específicamente para el autoestudio y la preparación de exámenes.
Visite la página de Kits de Estudio Impresos para obtener más información sobre los kits de estudio impresos a todo color.
Visite la tienda en línea de Transformación Digital para obtener información sobre compras.
Certificaciones
Este curso es parte de la(s) siguiente(s) ruta(s) de certificación:
– Científico de Datos de Transformación Digital