# Aprendizaje Automático.

## Perceptrón Multicapa. Aspectos Básicos.

En esta práctica se familiarizará con la implementación de un perceptrón multicapa en  [scikit-learn](https://scikit-learn.org/) para resolver un problema de clasificación binaria utilizando datos sintéticos. Además, podrá observar cómo la arquitectura de la red influye en la superficie de decisión y el sobre ajuste.


**Instrucciones:**

- siga las indicaciones y comentarios en cada apartado.
<br></br>
- siempre que una función o algoritmo lo permita, establezca $random\_state=const$, donde $const$ es un valor constante de su preferencia, por ejemplo $1$. Esto para garantizar que se puede replicar experimento.
<br></br>
- incluya el código requerido entre los apartados:
   - \#\<code>
   - \#\</code>

### Instalación de librerías e importación de dependencias

Para comenzar, es preciso instalar e incluir las librerías necesarias. En este caso, el entorno de Colab incluye las necesarias.

Ejecute la siguiente casilla prestando atención a las explicaciones dadas en los comentarios.

In [None]:
# instalar imblearn

!pip install imblearn==0.0

from matplotlib import pyplot
from sklearn  import datasets, neural_network
import pr_utils


### Carga de datos y análisis exploratorio

En este paso, obtendremos los datos y realizaremos un análisis exploratorio muy básico. Para simplificar, utilizaremos datos sintéticos que plantean un problema de clasificación binaria. Cada instancia se representa por un vector bidimensional y tiene asignada una clase de entre dos posibles.

En la siguiente casilla incluya el código necesario para:

**a.1)** crear un conjunto de datos  utilizando la función `make_blobs` disponible en scikit-learn. Cuide que la variable que contiene la representación de cada instancia se llame `XTr` y la variable que indica la clase se llame `YTr`.

- Número de instancias: 100
- Coordenadas de los centros: (0.0, 0.0) y (2.0, 2.0)
- Desviación estándar de cada clúster: 1.5 y 1.0


**a.2)**  visualizar los datos en un gráfico de dispersión usando la librería de su preferencia. El código necesario ya se provee utilizando [matplotlib](https://matplotlib.org/).

In [None]:
centers = [[0.0, 0.0], [2.0, 2.0]]
clusters_std = [1.5, 1.0]

# a.1 
#<code>


#</code>



#  visualizar datos
fig = pyplot.figure(clear=True, figsize=(3,3))
ax = fig.subplots()
ax.set_title('Datos')
ax.scatter(XTr[:,0], XTr[:,1], c=YTr)

### Entrenamiento de Perceptrón Multicapa

**b)** Verificada la etapa de preparación de los datos, entrenaremos un perceptrón multicapa utilizando la implementación que provee [scikit-learn](https://scikit-learn.org/stable/modules/generated/sklearn.neural_network.MLPClassifier.html).

En la siguiente casilla incluya el código necesario para:

**b.1)** crear una instancia de un perceptrón multicapa con los siguientes hiperparámetros:
- configuración capas ocultas: (1) es decir, una capa de una neurona
- factor de aprendizaje: 0.3
- rondas de entrenamiento: 2000
- función activación: sigmoide
- algoritmo de entrenamiento: lbfgs
- no utilice momentum

Cuide que la variable tenga por nombre `clf`.


**b.2)** entrenar el clasificador utilizando `XTr` y `YTr`.


**b.3)** visualizar superficie de decisión inducida por el clasificador. El código necesario ya se provee.

In [None]:
# b.1 
#<code>


#</code>



# b.2
#<code>


#</code>



# b.3
fig = pyplot.figure(clear=True, figsize=(3,3))
ax = fig.subplots()
ax.set_title(f'Arquitectura de la Red: {(1)}')
pr_utils.plot_decision_boundary(clf, XTr, YTr, plotData=True, ax=ax)

### Probando Otras Arquitecturas

**c)** Por último, observaremos el efecto del tamaño de la red sobre los resultados.

Añada dos casillas de código donde replique el experimento en **b**, pero esta vez de acuerdo a estos parámetros:

**c.1)** red con hiperparámetros idénticos a **b**, pero esta vez con una capa oculta de 10 neuronas.

**c.2)** red con hiperparámetros idénticos a **b**, pero esta vez con dos capas ocultas, cada una con 10 neuronas.

In [None]:
# c.1
#<code>


#</code>

In [None]:
# c.2
#<code>


#</code>

### Consideraciones finales.

Obviamente el experimento realizado es muy sencillo como para extraer conclusiones generalizables a otros problemas. No obstante, ¿observa alguna relación entre el tamaño de la red y la complejidad del problema capaz de resolver?