WEBVTT

00:01.850 --> 00:07.340
Hola y bienvenidos de nuevo al curso sobre deplorar hoy, vamos a concluir con la propagación de regreso.

00:07.340 --> 00:11.520
De acuerdo, sabemos casi todo lo que necesitamos saber sobre lo que

00:11.520 --> 00:17.990
sucede en todo lo que sabemos que hay un proceso llamado Reenvío directo donde la información se ingresa en

00:17.990 --> 00:24.620
la capa de entrada y luego se propaga hacia adelante para obtener nuestros sombreros blancos nuestros valores de salida y

00:24.620 --> 00:29.240
luego los comparamos con los valores reales que tenemos en nuestro conjunto de capacitación.

00:29.240 --> 00:36.110
Y luego calculamos los errores y luego los errores se propagan a través de la red en

00:36.110 --> 00:41.570
la dirección opuesta y eso nos permite entrenar la red ajustando los pesos.

00:41.660 --> 00:49.670
algoritmo avanzado impulsado por matemáticas muy interesantes y sofisticadas que nos permite ajustar los pesos.

00:49.670 --> 00:58.890
Entonces, la clave de una cosa importante para recordar aquí es que la propagación de retorno es un

00:59.030 --> 01:02.540
Todos ellos al mismo tiempo todos los pesos se ajustan simultáneamente.

01:02.540 --> 01:08.990
Entonces, si lo hiciéramos manualmente o si tuviéramos un tipo de algoritmo muy diferente de Aún si calculamos

01:08.990 --> 01:14.150
el error y luego intentamos entender qué efecto tiene cada uno de los pesos

01:14.150 --> 01:21.040
en el error, de alguna manera tendríamos que ajustar cada una de las pesas de forma independiente o individualmente.

01:22.000 --> 01:29.170
La gran ventaja de backwardation y es una cosa clave para recordar es que durante el

01:29.170 --> 01:35.910
proceso de propagación de retorno simplemente debido a la forma en que se estructura el algoritmo.

01:36.850 --> 01:43.990
que básicamente sabes de qué parte del error es responsable cada uno de tus pesos en la red neuronal.

01:43.990 --> 01:47.400
Puedes ajustar todo el camino al mismo tiempo, así

01:47.450 --> 01:54.220
Ahora ese es el principio fundamental fundamental subyacente de la propagación hacia atrás.

01:54.220 --> 02:02.650
Y esta fue la razón por la que se recuperó tan rápidamente en la década de 1980 y este fue un gran avance.

02:02.770 --> 02:08.890
Y si desea obtener más información sobre eso y cómo funcionan exactamente las matemáticas en segundo plano, entonces un

02:09.190 --> 02:14.800
buen artículo que ya hemos mencionado es el de las redes neuronales y el aprendizaje profundo, en realidad

02:14.800 --> 02:16.640
es un libro de Michael Nielsen.

02:16.720 --> 02:23.610
Encontrarás las matemáticas escritas y te ayudarán a entender cómo es posible esto.

02:23.650 --> 02:30.550
si desde el punto de vista de la intuición, la parte importante es recordar que eso es lo que hace la backwardation.

02:31.240 --> 02:33.310
Pero por ahora para nuestros propósitos

02:33.310 --> 02:36.750
Ajusta todos los pesos al mismo tiempo.

02:36.940 --> 02:43.300
Y ahora vamos a resumir todo con una guía paso a paso de lo que sucede en

02:43.300 --> 02:45.370
el entrenamiento de una red neuronal.

02:45.370 --> 02:51.000
Muy bien, así que paso uno inicializamos aleatoriamente los pesos a números pequeños cercanos a cero, pero no a cero.

02:51.010 --> 02:56.830
Realmente no nos enfocamos en la inicialización de los pesos durante los tutoriales de intuición, pero

02:56.830 --> 03:02.610
luego tenemos que comenzar en alguna parte y se inicializan con valores aleatorios cercanos a cero.

03:02.620 --> 03:09.730
a través del proceso de propagación por propagación, estos pesos se ajustan hasta que el error se minimiza.

03:09.730 --> 03:11.690
Y a partir de ahí,

03:11.970 --> 03:13.550
Entonces, la función de costo se minimiza.

03:13.820 --> 03:19.330
Luego haga dos entradas la primera observación todos sus conjuntos de datos a la primera fila en la entrada

03:19.510 --> 03:21.440
Lehre cada característica es una entrada.

03:21.440 --> 03:27.610
Así que, básicamente, tome los panales y colóquelos en los nodos de entrada por separado para la propagación de izquierda a

03:27.610 --> 03:27.910
derecha.

03:27.910 --> 03:32.620
neuronas de visión. La activación está limitada por los pesos. Los pesos básicamente determinan

03:32.620 --> 03:39.150
la importancia de la activación de cada neurona y luego propagan la activación hasta obtener el resultado del producto.

03:39.160 --> 03:43.100
Las neuronas se activan de una manera que captan en nuestras

03:43.150 --> 03:43.850
En este caso.

03:43.990 --> 03:46.640
Entonces, básicamente, se propaga de izquierda a derecha.

03:46.690 --> 03:50.110
Sigues todo el camino hasta que llegas y sacas tu sombrero.

03:50.320 --> 03:52.720
Luego compara el resultado con el resultado real.

03:52.750 --> 03:58.140
Mida el error generado y luego realice la retroalimentación de derecha a izquierda, el aire es bipolar

03:58.150 --> 03:58.620
nuevamente.

03:58.630 --> 04:02.080
Actualice las ponderaciones de acuerdo con cuánto son responsables del error.

04:02.260 --> 04:08.500
De nuevo, puede calcular que, debido a la estructura del algoritmo de perturbación de propagación hacia

04:08.500 --> 04:13.750
atrás, la tasa de aprendizaje decide por cuánto actualizamos las ponderaciones la tasa de

04:13.990 --> 04:17.710
aprendizaje como parámetro que puede controlar en su red neuronal.

04:17.710 --> 04:23.110
Paso 6 repite los pasos 1 2 5 y actualiza los pesos después de cada observación.

04:23.320 --> 04:30.670
Eso se llama aprendizaje de refuerzo y en nuestro caso fue descenso de gradiente estocástico o repetir los pasos 1

04:30.670 --> 04:31.490
a 5.

04:31.510 --> 04:37.840
descenso de gradiente completo o una insignia de Nissan verde o un gradiente de gradiente mini batido y el paso siete

04:37.870 --> 04:43.150
cuando todo el tren pasó por una red neuronal artificial que hace que una época rehaga más épocas.

04:43.150 --> 04:49.030
Pero de esa forma es solo después de un lote de observaciones o aprendizaje por lotes, o bien un

04:49.040 --> 04:55.090
Así que, básicamente, sigue haciendo eso y haciendo eso y haciendo eso, y permite que tu

04:55.120 --> 05:02.510
red neuronal se entrene mejor y mejor y se ajuste constantemente a medida que minimizas la función de costos.

05:02.740 --> 05:04.330
Entonces ahí vamos

05:04.420 --> 05:09.770
Esos son los pasos que debe seguir para construir sus redes neuronales artificiales y entrenarlo.

05:10.030 --> 05:16.060
Y estos son los pasos que tomará hasta que haya almorzado en los tutoriales prácticos.

05:16.120 --> 05:19.520
Te deseo la mejor de las suertes y espero verte la próxima vez.

05:19.540 --> 05:21.280
Hasta entonces disfruta el aprendizaje.