Nikkosoft | ¿Cómo funciona el Machine Learning?
Explicación básica de las estrategias de aprendizaje automático (Machine Learning) utilizados actualmente para procesar el Big Data generado diariamente en el mundo moderno.
Machine Learning, ERP, Negocios Inteligentes, Big Data
459
post-template-default,single,single-post,postid-459,single-format-standard,ajax_fade,page_not_loaded,,qode_popup_menu_push_text_right,qode-theme-ver-10.1.1,wpb-js-composer js-comp-ver-5.0.1,vc_responsive

Nikko Blog

¿Cómo funciona el Machine Learning?

¿Cómo funciona el Machine Learning?

El mundo actual está cada vez mas automatizado y las maquinas aprenden a diario.

 

Aprendizaje de Maquinas o Aprendizaje Automático (Machine Learning) es el uso sistemático de algoritmos para procesar una cantidad enorme de datos (Big Data) producidos por un ecosistema a fin de poder predecir conductas futuras de los individuos que interactúan con dicho ecosistema.

En el post ¿QUÉ ES BIG DATA? comentamos sobre como los datos fluían incesantemente hacia los llamados Lagos de Datos y que estos necesitaban ser procesados de alguna forma.  Esto es una realidad por más de 50 años, sólo que en el momento actual, el flujo diario de datos crece exponencialmente.  Por esta razón, los Científicos de Datos son cada vez más necesarios y valorados.  En este contexto, el Machine Learning se encarga de automatizar la clasificación e interpretación de dichos datos y convertirlos en información de valor en las tomas de decisiones.

 

¿Qué es un  Algoritmo?

En el proceso de toma de decisiones, un algoritmo provee el grupo de instrucciones y reglas definidas para ejecutar una secuencia de pasos a fin de obtener la solución a un problema determinado.

 

¿Cómo funciona el Flujograma del Machine Learning?

En un intento de sobresimplificar el complejo proceso de Inteligencia artificial, podemos seguir tomando el ejemplo del Lago de Datos.  La información potencial depositada en dicho lago se vierte hacia una primera línea de clasificación cuando el algoritmo se pregunta: ¿Las características de los datos son ya conocidas? La respuesta implicara la siguiente clasificación:

  1. Aprendizaje Supervisado: para los datos conocidos.  Bajo este esquema, se gestiona la reducción de una función para que sea capaz de predecir el valor de entrada de cualquier proceso en función a la repetición de una serie de ejemplos previos.  La salida de este proceso puede ser un número o una clasificación.
  2. Aprendizaje No Supervisado: para los datos desconocidos.   En este caso, el algoritmo tendrá que inferir el valor de los datos de entrada según un grupo de datos o por alguna probabilidad de producir un dato concreto que en su momento se convertirá en un dato ya conocido.

 

Como segundo paso, el algoritmo hace un segundo agrupamiento al preguntarse si el torrente de datos puede compartir atributos comunes entre sí para crear una Categoría o si forma parte de un flujo continuo de datos no estructurados.  La repuesta implicará una segunda clasificación:

  1. Aprendizaje Continuo: la data se hace disponible siguiendo un orden secuencial y para la cual se necesitara algún tipo de regresión o de agrupación por lo que el algoritmo deberá ajustarse dinámicamente.
  2. Aprendizaje en Categorías: la data se va agrupando por alguna clasificación o siguiendo un análisis por asociación.

Basados en estas 4 clasificaciones, existen al menos 7 grandes grupos de algoritmos usados para el aprendizaje automatizado:

1a.- Aprendizaje Supervisado Continuo:

  • Regresión
    • Lineal: aproxima una relación de dependencia entre variables (dependientes o independientes) y un término aleatorio.
    • Polinomial: infiere valores sobre una curva de datos multidimensionales
  • Arboles de Decisión: diagramas construidos sobre reglas lógicas y condiciones sucesivas.
  • Bosques Aleatorios: los Arboles de Decisión son empaquetados en promedios para reducir la variación y poderlos procesar con mayor eficiencia.

 

1b.- Aprendizaje Supervisado en Categorías:

  • Por Clasificación
    • KNN (k-nearest neighbors o los vecinos más próximos a k): datos clasificados por la probabilidad de que sean afines a una clase especificada.
    • Arboles: modelo predictor de variables de entrada con fuente en una base de datos.
    • Regresión Logística: predice el resultado de una variable ilimitada también en función a la probabilidad de un evento.
    • Naive-Bayes: se asume ingenuamente que un dato pueda poseer o no una característica especifica.
    • SVM (Support Vector Machines o Máquinas de Vectores de Soporte): se etiquetan muestras de datos para predecir la clase de una nueva muestra.

 

2a.- Aprendizaje No Supervisado Continuo:

  • Clustering y Reducción Dimensional
    • SVD (Singular Value Decomposition o Descomposicion en Valores Singulares): factorización estadística de matrices complejas de datos.
    • PCA (Principal Component Analysis o Análisis de Componentes Principales): un conjunto de datos se reduce su dimensionalidad en base a componentes que posiblemente estén correlacionados.
    • K-means: partición de un conjunto de datos en k grupos donde cada grupo pertenece a un valor medio cercano.

 

2b.- Aprendizaje No Supervisado en Categorías:

  • Análisis por Asociación
    • A Priori: generación de reglas de asociación de datos para lograr búsquedas más eficientes
    • Crecimiento-FP (Patrones Frecuentes): se cuentan las ocurrencias de valores y se agrupan en función al crecimiento de la frecuencia de dicha ocurrencia.
  • Modelo Oculto de Markov: se determinan parámetros ocultos en función a la observación de atributos visibles y la distribución probable de los datos de salida.

 

Las NikkoApps de Nikkosoft sirven como herramientas de procesamiento de datos al transformarlos en información de valor para una mejor toma de decisiones.

Contáctenos, le asesoramos sobre cómo sacar el mayor provecho de su Sistema de Información Empresarial.

Nikkosoft, Negocios Inteligentes.

info@nikkosoft.net

@nikkosoft

¿Te parecio interesante?, comparte este articulo con tus amigos!


¿Te parecio interesante?, comparte este articulo con tus amigos!