Machine Learning es un subconjunto de la inteligencia artificial que se enfoca en un objetivo específico: configurar las computadoras para que puedan realizar tareas sin la necesidad de una programación explícita. Las computadoras se alimentan de datos estructurados (en la mayoría de los casos) y "aprenden" a ser mejores en la evaluación y actuación sobre esos datos a lo largo del tiempo. Piense en los "datos estructurados" como entradas de datos que puede colocar en columnas y filas. Puede crear una columna de categoría en Excel llamada 'comida' y tener entradas de fila como 'fruta' o 'carne'. Esta forma de datos 'estructurados' es muy fácil de usar para las computadoras, y los beneficios son obvios (no es coincidencia que uno de los lenguajes de programación de datos más importantes se llame SQL 'lenguaje de consulta estructurado'). Una vez programada, una computadora puede tomar nuevos datos indefinidamente, clasificándolos y actuando sobre ellos sin necesidad de más intervención humana. Con el tiempo, la computadora puede reconocer que la 'fruta' es un tipo de alimento, incluso si deja de etiquetar sus datos. Esta "autosuficiencia" es tan fundamental para el aprendizaje automático que el campo se divide en subconjuntos en función de la cantidad de ayuda humana continua involucrada.
Es un subconjunto del aprendizaje automático que requiere la participación humana más continua, de ahí el nombre "supervisado". La computadora recibe datos de entrenamiento y un modelo diseñado explícitamente para "enseñarle" cómo responder a los datos. Una vez que el modelo está en su lugar, se pueden ingresar más datos en la computadora para ver qué tan bien responde, y el programador/ científico de datos puede confirmar predicciones precisas o puede emitir correcciones para cualquier respuesta incorrecta. Imagine a un programador tratando de enseñarle a una computadora la clasificación de imágenes. Ingresarían imágenes y le pedirían a la computadora que clasificara cada imagen, confirmando o corrigiendo cada salida de la computadora. Con el tiempo, este nivel de supervisión ayuda a perfeccionar el modelo hasta convertirlo en algo que pueda manejar con precisión nuevos conjuntos de datos que sigan los patrones "aprendidos". Pero no es eficiente seguir monitoreando el desempeño de la computadora y haciendo ajustes. En el aprendizaje semisupervisado, la computadora recibe una mezcla de datos correctamente etiquetados y datos no etiquetados, y busca patrones por sí misma. Los datos etiquetados sirven como "guía" del programador, pero no emiten correcciones continuas.
lleva esto un paso más allá mediante el uso de datos no etiquetados. La computadora tiene la libertad de encontrar patrones y asociaciones como mejor le parezca, a menudo generando resultados que podrían no haber sido evidentes para un analista de datos humano . Un uso común para el aprendizaje no supervisado es la "agrupación" , donde la computadora organiza los datos en temas comunes y capas que identifica. Los sitios web de compras/comercio electrónico utilizan habitualmente esta tecnología para decidir qué recomendaciones hacer a usuarios específicos en función de sus compras anteriores.
En el aprendizaje aprendizaje supervisado y no supervisado, no hay 'consecuencias' para la computadora si no comprende o categoriza correctamente los datos. Pero, ¿y si, como un niño en la escuela, recibiera comentarios positivos cuando hizo lo correcto y comentarios negativos cuando hizo lo incorrecto? Presumiblemente, la computadora comenzaría a descifrar cómo realizar tareas específicas a través de prueba y error, sabiendo que está en el camino correcto cuando recibe una recompensa (por ejemplo, una puntuación) que refuerza su 'buen comportamiento'. Este tipo de aprendizaje reforzado es fundamental para ayudar a las máquinas a dominar tareas complejas que vienen con conjuntos de datos grandes, altamente flexibles e impredecibles. Esto abre la puerta a las computadoras que intentan lograr un objetivo: realizar una cirugía, conducir un automóvil, escanear el equipaje en busca de objetos peligrosos, etc.