Tecnología

¿Qué es la clasificación ANN y cómo puede ayudar este análisis a una empresa?

Haga clic aquí para obtener más información sobre el autor Kartik Patel. experimentar.

En este artículo discutiremos el método de análisis de clasificación ANN.

¿Qué es el algoritmo de clasificación KNN?

El algoritmo K Neighbors Neighbours (KNN) analiza todos los puntos de datos disponibles y clasifica estos datos y luego clasifica nuevos casos basados ​​en estas categorías establecidas. Es útil para reconocer y estimar patrones. Suponga que queremos determinar la probabilidad de incumplimiento crediticio utilizando dos predictores (edad y tipo de crédito), con el incumplimiento como objetivo.

Primero determinaríamos que K = número de vecinos más cercanos (en términos de distancia) para verificar el mapeo de clases. Luego, calcularíamos la distancia entre una instancia y todas las instancias de entrenamiento. Luego clasificaríamos las instancias por distancia y encontraríamos los vecinos más cercanos. En otras palabras, encontraríamos la distancia más corta desde la nueva instancia. Después de eso, recopilaríamos las clases vecinas más cercanas para encontrar la mayoría. Esta mayoría de la clase es el valor final predicho de una clase.

Veamos un ejemplo de la clasificación KNN basada en dos atributos: resistencia a los ácidos y fuerza. El objetivo es dividir un tejido en clases de buena / mala calidad.

Fuente de imagen: MicroWeb elegante

La clase mayoritaria = buena para los tres vecinos más cercanos (dos de los tres conjuntos de datos tienen clase = buena), la clase predicha de una instancia = buena, es decir, la calidad de una toalla de papel con resistencia al ácido = 3 y firmeza = 7 es buena.

¿Cómo puede ayudar la clasificación ANN a una empresa?

El análisis de clasificación ANN puede ser útil al evaluar muchos tipos de datos.

  • Análisis de aprobación de crédito / crédito: Utilizando una lista de atributos de transacciones de clientes, la empresa puede predecir si un cliente incumplirá con un préstamo bancario.
  • Pronóstico del tiempo: En función de la temperatura, la humedad, la presión, etc., una organización puede predecir si estará lluvioso / soleado / frío.
  • Análisis de fraude: Según varias facturas enviadas por un empleado para el reembolso de alimentos, viajes y otros gastos, una empresa puede predecir la probabilidad de fraude.

Veamos dos casos de uso para ilustrar la utilidad de la clasificación ANN.

Caso de uso 1

Problema empresarial: Un oficial de préstamos bancarios quisiera predecir si el solicitante del préstamo está en mora o no en mora basándose en características tales como monto del préstamo, cuota mensual, duración del empleo, número de atrasos, ingresos anuales, relación deuda / ingresos, etc. Aquí la variable objetivo sería «Estado de incumplimiento pasado» y la Clase prevista contendría los valores o «sí o no» que representan la clase de «probabilidad de incumplimiento / probabilidad de incumplimiento».

Ventaja comercial: Una vez que se hayan asignado las clases, el banco tendrá un registro para los solicitantes de préstamos en el que cada solicitante se marca como «predeterminado probable / improbable». Con estas etiquetas, el banco puede tomar fácilmente una decisión sobre la concesión de un préstamo a un solicitante, así como el límite de crédito y la tasa de interés para cada solicitante en función del nivel de riesgo.

Caso de uso 2

Problema empresarial: Un médico quiere predecir la probabilidad de tratar con éxito a un nuevo paciente en función de varios atributos, como la presión arterial, la hemoglobina, el azúcar en sangre, el nombre de un medicamento que se le administra al paciente, el tipo de tratamiento que se le administra, etc. Aquí, la variable objetivo sería «estado de curación pasada» y la clase predicha contendría los valores «sí o no», que significa «susceptible de curación / no susceptible de curación».

Ventaja comercial: Dado el perfil de salud y corporal de un paciente y los tratamientos y medicamentos recientes que se le han recetado, el médico puede predecir la probabilidad y hacer recomendaciones sobre cambios de tratamiento / medicación.

El algoritmo de clasificación KNN es útil para determinar resultados probables y resultados, y para predecir y predecir resultados cuando hay múltiples variables.