WEBVTT

00:00.450 --> 00:05.400
Hola y bienvenidos a este camino en Torro, ahora vamos a hacer que la función de reenvío

00:05.400 --> 00:11.040
propague la señal a través de todo el cerebro desde el comienzo con las imágenes de entrada hasta las

00:11.130 --> 00:16.860
salidas que contendrán los valores clave para el actor y el devalor que es el valor tomado por la función

00:17.040 --> 00:17.950
para el crítico.

00:18.240 --> 00:23.820
Por lo tanto, será bastante similar a lo que hicimos con Dume, pero esta vez algo va a cambiar.

00:23.880 --> 00:25.550
La modificación va a cambiar eso.

00:25.560 --> 00:27.510
Ahora tenemos una ilustración en el cerebro.

00:27.510 --> 00:32.470
Entonces, todos debemos hacer algo más para propagar la señal y tener cuidado con eso.

00:32.850 --> 00:38.280
Y la otra cosa menos importante, pero aún así los cambios en comparación con antes es que

00:38.280 --> 00:44.220
no vamos a utilizar una función de activación real ya que conoce la función de activación no lineal,

00:44.220 --> 00:48.880
pero vamos a utilizar el loo, que es un poco más sofisticado realmente función.

00:48.980 --> 00:51.390
Verás que en el pasado estamos hablando de mentation.

00:51.780 --> 00:55.970
Así que hagamos esto, vamos a hacer que esta función comience con una muerte.

00:56.040 --> 00:59.190
En realidad es la última función de esta clase execrada.

00:59.280 --> 01:06.900
Así que lo llamaremos como Einstein y esta cuarta función tomará el objeto por sí misma porque vamos

01:06.900 --> 01:09.930
a usar los objetos y las entradas.

01:10.170 --> 01:13.520
Tan importante para entender cuáles serán estas entradas.

01:13.590 --> 01:19.170
Esto no solo serán las imágenes de entrada, sino que estas entradas también contendrán los nodos ocultos y los

01:19.170 --> 01:20.980
nodos de las celdas del mismo.

01:21.090 --> 01:25.120
Entonces, es por eso que quería resaltar que algunas cosas van a cambiar ahora.

01:25.180 --> 01:30.820
Básicamente estamos considerando la función de avance de Internet y los nodos de la lista.

01:31.200 --> 01:38.900
Y hablando de ellos ahora, lo que vamos a hacer es separar estas dos entradas de este argumento al poner en

01:38.900 --> 01:41.540
marcha la función y cómo podemos separarlas.

01:41.700 --> 01:46.160
Bueno, podemos recordar un nuevo voivoda que será las imágenes de entrada.

01:46.230 --> 01:55.620
Así que eso es imágenes de entrada diseñadas y las separamos con el derrumbe H x y C X, que es un templo de los

01:55.620 --> 01:59.090
estados ocultos y los estados celulares en el Coliseo.

01:59.370 --> 02:04.470
Entonces H x otros estados y C X son los estados del sur.

02:04.540 --> 02:09.580
Está bien y eso será igual a la entrada que es este argumento aquí.

02:09.580 --> 02:14.950
Entonces, ahora hicimos esa separación y, por lo tanto, podemos comenzar a propagar la

02:15.220 --> 02:21.400
señal por todo el cerebro y para hacerlo vamos a obtener capas sucesivamente diferentes desde la

02:21.700 --> 02:28.690
primera hasta la última utilizando nuestras conexiones, que son las convoluciones, la conexión LACMA y la conexión lineal

02:29.020 --> 02:30.300
aquí las conexiones completas.

02:30.490 --> 02:31.400
Entonces, hagamos esto.

02:31.450 --> 02:33.620
Ahora va a ser lo mismo que antes.

02:33.750 --> 02:40.420
Vamos a obtener nuestra primera capa a la que vamos a llamar X y obtener esta primera capa que necesitamos para propagar

02:40.510 --> 02:46.240
la señal desde las entradas a esta primera capa y, por lo tanto, necesitamos usar la primera convolución porque

02:46.240 --> 02:51.770
es la primera convolución que propaga la señal desde las imágenes de entrada a la primera capa.

02:52.030 --> 02:58.450
Entonces, lo que vamos a hacer ahora es copiar esto porque esta es la primera convolución que tuvimos aquí

02:58.450 --> 03:06.100
y aplicamos esta primera convolución a nuestras imágenes de entrada que ahora son las entradas correctas y que obtenemos que propaga la

03:06.100 --> 03:09.560
señal de las imágenes de entrada a la primera capa.

03:09.820 --> 03:16.390
Pero ahora recuerden que tenemos que usar una función de activación no lineal para romper la linealidad con el fin de

03:16.390 --> 03:23.170
poder aprender las relaciones no lineales dentro de las imágenes y para hacer esto vamos a usar como dijimos la función de

03:23.500 --> 03:28.050
activación que estamos a punto de ver ahora mismo y eso por contacto atascado.

03:28.180 --> 03:30.110
Pero antes de eso, entiéndalo.

03:30.130 --> 03:36.430
Entonces para obtenerlo es como si realmente tomáramos el módulo funcional que tiene un atajo

03:36.490 --> 03:45.790
y luego ese y luego un bucle y luego ponemos todo esto entre paréntesis porque queremos activar las neuronas de forma no lineal.

03:45.880 --> 03:51.160
Esta primera capa aquí que obtuvimos aplicando la primera convolución en las entradas.

03:51.160 --> 03:55.310
Así que ahora vamos a la antorcha PI Doug para entender de qué se trata.

03:55.360 --> 03:56.110
Aquí está.

03:56.200 --> 04:00.320
Entonces puede acceder a la antorcha pegada o barra oblicua.

04:00.340 --> 04:06.940
Y luego esa H G y L y luego tienes que encontrar activaciones no lineales y luego las funciones de activación

04:06.940 --> 04:08.080
no lineal que encontrarás.

04:08.170 --> 04:14.040
Bueno, ese es el clásico cuando sabemos que es solo un máximo de cero y X tienes el gráfico en mente.

04:14.260 --> 04:17.160
Entonces tienes seis, que es este.

04:17.160 --> 04:19.350
Así que un poco más sofisticado

04:19.570 --> 04:21.190
Y luego vamos, echamos un vistazo.

04:21.550 --> 04:26.470
Y como puedes ver, azul es un rehacer más un elemento adicional.

04:26.620 --> 04:29.280
Entonces es como un más sofisticado realmente.

04:29.340 --> 04:34.180
Y ese es el que usamos para activar no linealmente las neuronas y las diferentes capas.

04:34.180 --> 04:39.420
Y, por cierto, esta nueva función de activación se llama exponencial en su unidad.

04:39.490 --> 04:40.250
Entonces ahí vamos

04:40.270 --> 04:44.230
Aplicamos el elu en la primera capa convolucional.

04:44.470 --> 04:46.300
Y ahora las cosas van a ser fáciles.

04:46.370 --> 04:52.270
que llamaremos X porque básicamente estamos agregando X ahora x es la primera convolución allí.

04:52.270 --> 04:59.440
Vamos a pasar al siguiente para la propagación de la señal que va de la primera capa convolucional

04:59.470 --> 05:02.190
a la segunda capa convolucional a la

05:02.290 --> 05:07.990
Y al propagar la señal desde la primera capa convolucional a la siguiente, X se convertirá en

05:07.990 --> 05:09.190
la siguiente capa convolucional.

05:09.520 --> 05:15.130
Y para propagar la señal de la primera capa convolucional a la segunda

05:15.220 --> 05:20.490
no podemos simplemente copiar esto y pegarlo aquí y reemplazar uno por dos.

05:20.510 --> 05:27.340
Y ahora, por supuesto, la segunda convolución no se aplica a las imágenes de entrada sino a X, que es

05:27.340 --> 05:29.530
la primera capa convolucional que está aquí.

05:29.830 --> 05:30.790
Muy bien, perfecto.

05:30.790 --> 05:32.800
Ahora tenemos nuestro segundo convolucional allí.

05:33.010 --> 05:38.230
Y ahora propaguemos la señal nuevamente desde el segundo convolucional hasta el tercero.

05:38.230 --> 05:46.000
Y, por lo tanto, podemos copiar esto directamente y pegarlo aquí y reemplazar dos por tres.

05:46.000 --> 05:46.840
Aquí vamos.

05:46.990 --> 05:47.900
Y el último.

05:47.920 --> 05:53.770
Ahora, para propagar la señal desde el tercer convolucional hasta el cuarto y el último,

05:53.770 --> 05:58.770
podemos simplemente copiar esto de nuevo aquí y reemplazar tres por cuatro.

05:58.840 --> 05:59.790
Aquí vamos.

06:00.220 --> 06:01.870
Así que vamos a recapitular.

06:01.870 --> 06:03.310
Comenzamos con nuestras entradas.

06:03.460 --> 06:07.170
Aplicamos la primera convolución para obtener el primer convolucional allí.

06:07.360 --> 06:12.130
Luego aplicamos la segunda convolución a la primera capa de convolución para obtener la segunda

06:12.130 --> 06:12.850
capa convolucional.

06:12.970 --> 06:17.830
Luego aplicamos esta tercera circunvolución al segundo convolucional allí para obtener la tercera

06:17.830 --> 06:18.510
capa convolucional.

06:18.550 --> 06:24.650
Y finalmente aplicamos la cuarta circunvolución al tercer convolucional allí para obtener allí el cuarto

06:24.650 --> 06:25.180
convolucional.

06:25.510 --> 06:29.900
Y así es como la señal se propaga a través de los ojos del ojo.

06:30.130 --> 06:35.620
Así que ahí vamos tenemos ahora la señal de salida después de las cuatro circunvoluciones y

06:35.620 --> 06:40.790
ahora sabemos qué hacer, necesitamos expandir toda esta señal de salida en un vector dimensional.

06:40.900 --> 06:42.640
Ese es el paso de aplanamiento.

06:42.880 --> 06:45.440
Así que vamos a actualizar x de nuevo x.

06:45.490 --> 06:49.010
Ahora se convertirá en este vector unidimensional aplanado.

06:49.230 --> 06:57.070
Y para hacer eso es lo mismo, necesitamos tomar X, que es hasta ahora la cuarta capa convolucional X, pero luego

06:57.520 --> 07:05.660
usamos una función de vista y primero ponemos menos uno para decir que queremos un vector dimensional y luego como un segundo

07:05.660 --> 07:11.810
argumento que necesitamos poner el número de elementos en el vector y eso es recordar tres dos

07:11.880 --> 07:13.560
veces tres veces tres.

07:13.670 --> 07:20.270
Y, por lo tanto, podemos poner aquí 32 veces tres veces tres.

07:20.270 --> 07:20.720
Aquí vamos.

07:20.720 --> 07:24.570
Ahora tenemos nuestro vector aplanado y el paso de aplanamiento está hecho.

07:24.680 --> 07:25.580
Perfecto.

07:25.580 --> 07:28.030
Ahora ocupémonos de la parte LCN.

07:28.280 --> 07:33.030
Entonces, como usted entendió, el LSD toma como entrada el vector aplanado.

07:33.200 --> 07:37.190
Este vector unidimensional de tres dos veces tres veces tres elementos.

07:37.190 --> 07:40.310
Entonces ya está listo y bien preparado para el icn.

07:40.320 --> 07:49.070
El equipo ahora está listo para tomar este vector Flaten como entradas y, por lo tanto, podemos tomar nuestro LACMA y las

07:49.190 --> 07:52.010
entradas como argumento primero X están listos.

07:52.010 --> 07:55.960
FLATOW Y vector que es este rayo x aquí que acabamos de expandir.

07:56.270 --> 08:00.810
Pero también y ahí es donde entran en juego los problemas.

08:00.890 --> 08:04.540
Necesitamos poner H x y z x.

08:04.550 --> 08:10.820
Y podemos usar ha-Satan vea X aquí porque hicimos esas separaciones de los argumentos de entrada

08:11.060 --> 08:12.980
originales de la función forward.

08:12.980 --> 08:20.460
Entonces, LACMA X muestra el vector de salida de las platinas después de las cuatro circunvoluciones y todo lo oculto en la nota de la celda.

08:20.480 --> 08:21.390
Entonces ahí vamos

08:21.440 --> 08:27.530
Entonces no debemos olvidarnos de nosotros mismos porque LSD es una variable o función, por lo que una variable

08:27.530 --> 08:35.210
unida al objeto en sí y un CM y esto realmente regresará a las salidas un total de dos salidas que serán los

08:35.210 --> 08:37.850
nodos de salida y los sonidos de salida.

08:37.880 --> 08:42.250
Entonces, en realidad es tópico y, por lo tanto, podemos actualizar H.

08:42.260 --> 08:48.890
X y y z x los nodos de celda porque esa es exactamente la salida de este NCM aquí.

08:50.030 --> 08:50.500
Estupendo.

08:50.510 --> 08:52.750
Así que casi hemos terminado ahora.

08:52.790 --> 08:58.850
Ahora que tenemos los resultados de la ilustración, necesitamos obtener el resultado útil porque en realidad solo

08:58.850 --> 09:05.570
las notas ocultas son útiles y, por lo tanto, vamos a obtenerlo de nuevo para X y X ahora

09:05.570 --> 09:12.490
será igual a atax el primer elemento de la muestra de salida de los EE. UU. una X es igual.

09:12.680 --> 09:14.270
Y casi hemos terminado.

09:14.270 --> 09:18.590
Recuerde que tenemos dos cerebros, un cerebro para el actor en una habitación para el crítico.

09:18.860 --> 09:24.380
Y, por lo tanto, tenemos que emitir señales para devolver la señal de salida del actor y la señal

09:24.380 --> 09:25.480
de salida del crítico.

09:25.580 --> 09:30.730
Y por lo tanto, ahora lo que vamos a hacer es devolver estas dos señales de salida y cómo podemos hacer eso.

09:30.830 --> 09:32.010
Bueno, eso es muy fácil.

09:32.030 --> 09:38.690
Simplemente necesitamos tomar nuestras conexiones lineales, pero por separado, que es una conexión lineal del crítico y que

09:38.770 --> 09:40.740
la conexión completa del actor.

09:41.180 --> 09:47.870
la salida X que es una salida útil de LACMA y que será lo único que será la señal de salida.

09:47.870 --> 09:50.470
Y aplicamos cada una de estas conexiones a

09:50.480 --> 09:50.990
Entonces ahí vamos

09:50.990 --> 09:51.840
Vamos a hacerlo.

09:51.900 --> 09:59.660
Primero tomamos self u objeto entonces obtenemos la conexión lineal del crítico que es crítico y este colinear

09:59.690 --> 10:08.090
que aplicamos a X la señal de salida el CM y luego mismo tomamos self luego de eso y luego

10:08.090 --> 10:15.290
tomamos la conexión lineal del actor que es actor y es colineal son los mismos que aplicamos

10:15.290 --> 10:16.200
a x.

10:16.310 --> 10:19.580
Ahí vamos, así que eso es lo principal que necesitamos.

10:19.710 --> 10:26.040
Pero luego también devolveremos la parte superior de Ajax a un nodo y veremos que X vende el nodo

10:26.040 --> 10:29.490
porque los utilizaremos más adelante y el aspecto retro del LCN.

10:29.520 --> 10:30.430
Muy bien, perfecto.

10:30.480 --> 10:32.960
Así que ahora hemos terminado con el cerebro.

10:32.970 --> 10:38.040
O debería decir los cerebros porque en realidad hicimos dos cerebros uno para el actor y un crítico.

10:38.250 --> 10:41.990
Así que felicitaciones por hacer el octavo con los cerebros.

10:42.180 --> 10:47.940
Espero que no haya sido demasiado abrumador combinarlo en CNN y en Anniston, pero al menos la buena noticia es

10:47.940 --> 10:51.190
que realmente estamos trabajando con el modelo mejor y más poderoso.

10:51.300 --> 10:53.010
Entonces ahí vamos

10:53.010 --> 10:55.950
De hecho, hemos terminado con este primer modelo familiar que.

10:56.010 --> 10:56.810
Y.

10:56.880 --> 11:02.040
Y así en los próximos dos años nos haremos cargo del optimizador porque vamos a hacer

11:02.190 --> 11:03.300
un optimizador por separado.

11:03.300 --> 11:08.850
No vamos a cortar cada línea de código porque gran parte proviene de los trabajos de investigación

11:08.850 --> 11:10.520
y esto es bastante específico.

11:10.530 --> 11:16.470
la función de tren para hacer, que será una función enorme y que contiene el algoritmo que ver.

11:16.470 --> 11:22.410
Y si profundizamos en los detalles de lo que está sucediendo con este optimizador, esto podría ser un

11:22.410 --> 11:26.890
poco demasiado abrumador para lo que va a suceder a continuación porque todavía tenemos

11:27.030 --> 11:29.240
Entonces confía en mí, quieres conservar algo de energía para eso.

11:29.310 --> 11:32.300
Y, por lo tanto, no pasaremos demasiado tiempo en esto.

11:32.490 --> 11:37.830
Pero aún ampliaré el código y comprenderá la idea detrás de esta optimización.

11:38.190 --> 11:44.740
Felicidades de nuevo por hacer esta clase de actividad y nos vemos en el próximo optimizador Statoil 290.

11:44.760 --> 11:46.140
Hasta entonces, disfrute yo.
