WEBVTT

00:00.300 --> 00:06.120
Hola y bienvenido a la parte súper emocionante de nuestra creación, la parte en la que la hacemos inteligente.

00:06.270 --> 00:08.540
Entonces eso es exactamente lo que sucede cuando se entrena el aire.

00:08.590 --> 00:13.200
Entrenaré su inteligencia para alcanzar la meta que queríamos lograr.

00:13.350 --> 00:18.870
Y para hacer esto, básicamente vamos a entrenar la red neuronal para generar las predicciones correctas.

00:19.110 --> 00:24.360
Y entonces ya todo está listo porque estas señales de salida del cerebro ya tienen la transmisión

00:24.360 --> 00:27.300
correcta al cuerpo para reproducir las acciones finales.

00:27.660 --> 00:32.130
Así que básicamente ahora lo que estamos a punto de hacer es algo que ya hicimos antes.

00:32.280 --> 00:37.680
Solo vamos a tomar algunos lotes aleatorios de la memoria, obtener nuestra entrada de estas muestras, obtener

00:37.680 --> 00:42.930
la salida, obtener el objetivo, obtener las predicciones, calcular el último error entre las predicciones y el

00:42.930 --> 00:48.360
objetivo, y luego realizar la propagación hacia atrás. para obtener el descenso de gradiente para actualizar los pesos

00:48.360 --> 00:51.430
de acuerdo a cuánto contribuyeron a este último error.

00:51.900 --> 00:53.040
Así que hagamos todo esto.

00:53.040 --> 00:57.660
Verás cómo va a ser tan fácil porque ya tenemos todas las herramientas para

00:57.660 --> 00:58.020
implementarlo.

00:58.200 --> 01:04.230
No solo tenemos el camino hacia herramientas como el optimizador y las funciones de pérdida, sino que también tenemos todas

01:04.440 --> 01:09.600
las clases que hicimos antes, como nuestro cerebro, por supuesto, que vamos a usar para obtener

01:09.600 --> 01:10.290
las predicciones.

01:10.620 --> 01:17.970
Luego, nuestra experiencia, el seguimiento de elegibilidad de implementación de repetición y todas estas herramientas se combinaron con el piloto,

01:17.970 --> 01:23.790
qué herramientas harán que el entrenamiento tenga un rendimiento excelente y, por lo tanto, eventualmente obtendremos

01:23.790 --> 01:26.250
una A. YO. Así que hagamos realidad este entrenamiento.

01:26.400 --> 01:28.110
Hagamos que nuestros ojos sean inteligentes.

01:28.290 --> 01:33.380
Y lo primero que vamos a hacer ahora es obtener la última función que usaremos durante

01:33.390 --> 01:36.200
el entrenamiento para calcular el error y optimizarlo.

01:36.540 --> 01:37.680
Eso es lo primero que haremos.

01:37.980 --> 01:40.590
Entonces, creemos una variable para la última función.

01:40.590 --> 01:42.150
Lo llamaremos pérdida.

01:42.810 --> 01:50.340
Y esto será igual a la función de pérdida MSE del módulo final.

01:50.850 --> 01:52.470
Y luego ese Mercilus.

01:52.740 --> 01:56.940
Esa es la última función que usaremos porque básicamente nuestras predicciones son valores.

01:56.940 --> 01:59.940
Sabes, estamos prediciendo los valores fundamentales de las diferentes acciones.

01:59.940 --> 02:05.970
Y, por lo tanto, dado que estos son números reales, bueno, estamos haciendo una red neuronal para la regresión y, por lo tanto,

02:05.970 --> 02:08.910
la función de pérdida es el medio para el error.

02:09.120 --> 02:11.880
Esa es la función de pérdida que usamos en general para la regresión.

02:12.450 --> 02:12.960
Todo bien.

02:13.080 --> 02:18.180
Entonces, ahora que tenemos nuestra última función, optimicemos nuestro optimizador aquí.

02:18.180 --> 02:21.240
Esa es la variable que creamos para el optimizador.

02:21.270 --> 02:23.940
Y lo vamos a tomar como de costumbre.

02:23.940 --> 02:30.750
En cuanto al automóvil autónomo, el optimizador de átomos, es un optimizador muy poderoso que hará maravillas en

02:30.930 --> 02:31.710
el entrenamiento.

02:32.130 --> 02:35.820
Así que llevemos este hasta ese átomo.

02:36.810 --> 02:42.720
Y recuerde, eso es exactamente lo que tiene el coche autónomo para introducir dos argumentos fundamentales.

02:43.080 --> 02:49.200
El primero es el que hará la conexión entre el optimizador y los parámetros de nuestra red neuronal,

02:49.200 --> 02:52.650
que son los pesos de las neuronas de nuestro cerebro.

02:53.040 --> 02:56.640
Y para hacer esto, tomamos nuestro cerebro, al que llamamos CNN.

02:57.030 --> 02:59.040
Ese es el objeto que creamos para nuestro cerebro.

02:59.280 --> 03:05.860
Y así CNN que recordamos los parámetros que vamos y algunos paréntesis.

03:06.270 --> 03:11.970
Entonces eso hace la conexión entre el optimizador y los pesos de las neuronas en el

03:11.970 --> 03:18.630
cerebro de nuestro A. YO. Y luego el segundo argumento es una tasa de aprendizaje, y eso está dado por l. R.

03:18.990 --> 03:24.510
Y aquí tenemos que tomar una tasa de aprendizaje menor porque no queremos converger demasiado rápido y queremos tener algo de exploración

03:24.510 --> 03:29.370
y, por lo tanto, una buena forma de aprendizaje que podemos decir aquí es una pequeña que es de

03:29.370 --> 03:33.150
cuatro puntos o una que es 0. 01 por ciento.

03:33.390 --> 03:36.270
Creo que es el mismo que usamos para el automóvil autónomo.

03:37.320 --> 03:43.410
Muy bien, ahora tenemos un optimizador de funciones perdido, así que estamos casi listos para comenzar el ciclo completo.

03:43.470 --> 03:45.890
Bueno, en realidad, comenzaremos el ciclo completo ahora mismo.

03:46.140 --> 03:52.100
Pero justo antes de hacerlo, vamos a decidir el tamaño del número de épocas en las que

03:52.100 --> 03:58.170
nos convertiremos y, por lo tanto, crearemos una nueva variable aquí que responderá a este número de épocas.

03:59.320 --> 04:02.140
Y pongámoslo igual a cien.

04:02.530 --> 04:08.350
Eso estará bastante bien para entrenar al aire y hasta apuesto a que el aire logrará llegar de la mejor

04:08.500 --> 04:11.140
manera antes de cien como veinte o treinta.

04:11.500 --> 04:12.000
Veamos.

04:12.010 --> 04:13.750
Pero por ahora, tomemos cien.

04:13.990 --> 04:15.940
Y si lo necesitamos, lo aumentaremos.

04:16.090 --> 04:17.710
Pero no creo que sea necesario.

04:18.370 --> 04:22.660
Bien, ahora que tenemos nuestra cantidad de aeropuertos, podemos comenzar a hacer el ciclo completo, ya

04:22.840 --> 04:26.680
sabes, este ciclo completo principal de la capacitación cuando entrenamos sobre los aeropuertos.

04:27.010 --> 04:31.530
Entonces, para entonces, todo el voleibol estará en funcionamiento.

04:31.540 --> 04:34.240
Eso es lo que elegimos para volver.

04:34.990 --> 04:42.310
Ahora, por supuesto, usaremos la función de rango para decir que queremos ir del primero al

04:42.670 --> 04:44.500
número de aprox.

04:47.120 --> 04:52.730
Más uno, porque, recuerde, el límite superior de un rango no está incluido, y por lo

04:52.730 --> 04:58.730
tanto, si quiere subir hasta 100, bueno, tenemos que especificar y ser un más uno para subir a 100.

04:59.390 --> 04:59.840
Todo bien.

04:59.840 --> 05:00.800
Entonces, Colin.

05:00.980 --> 05:02.800
Y ahora entremos en el ciclo.

05:03.620 --> 05:03.980
Todo bien.

05:03.980 --> 05:08.300
Entonces, lo primero que vamos a hacer es hacer 200 ejecuciones de diez pasos.

05:08.660 --> 05:13.630
Así que cada época serán 200 corridas, una tras otra de 10 pasos.

05:13.940 --> 05:19.550
Y para hacer esto, tenemos esta función de un paso de nuestra clase de experiencia y, por lo tanto,

05:19.550 --> 05:24.770
usamos esta función, que en realidad es un método porque la obtendremos de nuestro objeto de

05:24.770 --> 05:30.080
memoria, que es un objeto de la clase de reemplazo para generar estas dos ejecuciones. de diez pasos.

05:30.320 --> 05:36.020
Bueno, tenemos que tomar nuestro objeto de memoria que les recuerdo que creamos aquí mismo.

05:36.170 --> 05:40.400
La memoria es un objetivo para reproducir la clase de memoria con Insteps.

05:40.400 --> 05:43.300
Eso es 10 pasos y una capacidad de diez mil.

05:43.910 --> 05:52.370
Creamos este objeto y a partir de este objeto tomamos bien, esta función de Rundstedt ejecuta pasos y

05:52.370 --> 06:00.430
especificamos doscientas rondas sucesivas de diez pasos para que en cada una, básicamente, ejecutemos 200 pasos.

06:00.860 --> 06:08.060
Y ahora que tenemos estos 200 pasos ejecutándose en cada apoc, bueno, es hora de probar algunos lotes de estas

06:08.060 --> 06:10.630
ejecuciones y de probar estos lotes.

06:10.640 --> 06:16.700
Tenemos otra función de nuestra memoria, que es un lote de muestra, y que generará exactamente algunos

06:16.700 --> 06:18.910
lotes de estas 200 ejecuciones.

06:19.400 --> 06:26.720
Pero recuerde, estos lotes son, esta vez, lotes de una serie de transiciones que son una serie de diez pasos a diferencia

06:27.020 --> 06:31.630
de antes, donde los lotes eran solo algunos lotes de transiciones individuales aquí.

06:31.640 --> 06:37.040
Esta vez van a ser lotes de diez pasos, diez transiciones, y por lo tanto ahora

06:37.040 --> 06:41.870
es el momento de sacar de nuestra memoria estos lotes aleatorios y conseguirlos.

06:41.870 --> 06:48.320
Usamos la función de lote simple a la que tenemos que aplicar el tamaño de lote y para el tamaño

06:48.320 --> 06:53.480
de lote podemos tomar treinta y dos o incluso sesenta y cuatro o incluso ciento veintiocho.

06:54.080 --> 06:57.830
Recuerde, para ese tamaño es una práctica común usar treinta y dos.

06:58.070 --> 07:03.470
Eso es lo que verá en general en las arquitecturas de redes neuronales cuando realice un aprendizaje por lotes.

07:03.740 --> 07:05.470
Pero esta vez es bastante diferente.

07:05.660 --> 07:11.530
Nosotros, solo estamos probando algunos lotes de 10 pasos, por lo que es mejor tomar lotes con tamaños más grandes.

07:11.690 --> 07:14.710
Así que ahí es donde podemos tomar sesenta y cuatro, ciento veintiocho.

07:15.170 --> 07:16.940
Así que vamos a tomar ciento veintiocho.

07:17.150 --> 07:25.130
Y en realidad esto estará dentro del ciclo porque queremos tomar varios lotes y los estamos tomando en

07:25.130 --> 07:28.870
lo que devuelve esta función de lote simple.

07:29.420 --> 07:36.020
Entonces, este ciclo completo para lote en lote de muestra de memoria, ciento veintiocho significa que cada

07:36.020 --> 07:41.720
ciento veintiocho pasos, bueno, nuestra memoria nos dará un lote de tamaño, ciento veintiocho,

07:41.720 --> 07:47.210
que contendrá en realidad el último. Ciento veintiocho pasos que acabamos de ejecutar.

07:47.960 --> 07:53.060
Solo estamos obteniendo algunos lotes de seis, ciento veintiocho y el aprendizaje ocurrirá en

07:53.210 --> 07:54.080
estos lotes.

07:54.320 --> 07:58.910
Y además dentro de estos lotes, tendremos bandejas de elegibilidad funcionando, ya sabes, para aprender cada 10

07:58.910 --> 07:59.480
pasos.

08:00.230 --> 08:00.620
Todo bien.

08:00.620 --> 08:06.950
Entonces ahora dentro de este ciclo, que todavía está sucediendo en una época, pero ahora esta vez estamos en un lote

08:06.950 --> 08:07.360
específico.

08:07.790 --> 08:14.060
Entonces, ahora lo primero que vamos a hacer es obtener nuestras entradas y nuestro objetivo por separado.

08:14.570 --> 08:16.610
Y eso, como te dije, es muy fácil.

08:16.610 --> 08:21.290
Podemos hacerlo con una de las herramientas que implementamos, que es el seguimiento de elegibilidad.

08:21.620 --> 08:27.950
Como puede ver aquí, esta función de seguimiento de elegibilidad toma como entradas y ahora tenemos el

08:28.310 --> 08:32.060
lote y devoluciones como salida, las entradas y los objetivos.

08:32.420 --> 08:37.490
Entonces, en este momento, lo que podemos hacer simplemente es crear dos nuevas variables, que serán las entradas y

08:37.490 --> 08:38.300
el objetivo.

08:38.690 --> 08:48.080
Y estas entradas llegan a los objetivos exactamente igual a lo que devuelve esta función de seguimiento de elegibilidad que se aplica a un

08:48.080 --> 08:48.610
lote.

08:49.010 --> 08:51.950
Entonces aplicaremos esta función al lote de nuestro ciclo.

08:52.280 --> 08:55.160
Entonces, lo que haremos es solo elegibilidad.

08:56.460 --> 09:00.110
Traza aplicada al lote de nuestra esperanza.

09:00.660 --> 09:07.110
De acuerdo, eso nos da las entradas y los objetivos, pero en los tacaños, siempre hay algo más que tenemos

09:07.110 --> 09:07.850
que hacer.

09:08.100 --> 09:13.530
Y, por supuesto, esto es para convertir la entrada de la red neuronal y también el objetivo en algunas variables

09:13.530 --> 09:14.030
tahj.

09:14.340 --> 09:16.170
Pero tampoco hay nada nuevo.

09:16.200 --> 09:17.310
Sabemos cómo hacerlo.

09:17.490 --> 09:18.450
Podemos hacerlo de esta manera.

09:18.460 --> 09:24.930
Tomamos nuestras entradas, luego nuestros objetivos y bueno, serán iguales a verbales.

09:25.820 --> 09:26.510
Entrada de.

09:27.750 --> 09:30.210
Eso es por la entrada y verbal.

09:31.150 --> 09:33.580
Objetivos, y eso es para los objetivos.

09:34.090 --> 09:42.250
Muy bien, entonces las entradas del cerebro se convierten en algunas variables tahj y los objetivos también se convierten en

09:42.250 --> 09:43.900
algunas variables tahj.

09:44.320 --> 09:48.320
Entonces ahora podemos introducir las entradas en la red neuronal.

09:48.640 --> 09:50.530
¿Y por qué tenemos que hacer esto?

09:50.530 --> 09:55.270
Debido a que el siguiente paso es obtener las predicciones, tenemos las entradas que tenemos que apuntar.

09:55.540 --> 09:59.980
Ahora, por supuesto, necesitamos nuestras predicciones porque entonces lo que sucede es que calcularemos la pérdida

10:00.190 --> 10:02.120
entre las predicciones y los objetivos.

10:02.890 --> 10:06.350
Así que obtengamos estas predicciones para obtenerlas.

10:06.640 --> 10:07.930
Bueno, de nuevo, esto es tan simple.

10:07.930 --> 10:14.650
Ahora solo necesitamos tomar nuestro cerebro, que es CNN, nuestra red neuronal convolucional, y aplicarlo

10:14.830 --> 10:16.730
a nuestras entradas.

10:17.320 --> 10:17.950
Aquí vamos.

10:18.320 --> 10:23.320
Las entradas van a la red neuronal y la red neuronal generará las predicciones.

10:24.170 --> 10:29.270
Perfecto, ahora tenemos las predicciones, tenemos los objetivos para que podamos obtener las leyes y ese es el

10:29.270 --> 10:34.640
siguiente paso, vamos a introducir un nuevo más porque ahora mismo vamos a obtener el último error, que es

10:34.790 --> 10:39.660
diferente. que la última función, porque la usamos como una función para obtener el último error.

10:40.100 --> 10:50.570
Entonces, menos error aquí y lo obtendremos con la función menos aplicada a nuestras predicciones y los objetivos que vamos

10:50.570 --> 10:54.860
a ver cómo todo va bien ahora.

10:55.070 --> 10:56.170
Todo es lógico.

10:56.180 --> 11:00.590
Primero obtenemos la entrada, los objetivos, luego, gracias a la entrada, obtenemos las predicciones.

11:00.590 --> 11:03.800
Y luego, gracias a las predicciones y los objetivos que obtenemos, menos error.

11:05.070 --> 11:08.850
Muy lógico y fluido, y ahora, ¿cuál es el siguiente paso?

11:09.150 --> 11:14.940
Bueno, la misma ruta lógica ahora que tenemos la última, podemos volver a propagar este error menor a la

11:14.940 --> 11:16.890
nueva red para actualizar los pesos.

11:17.190 --> 11:21.540
Y lo hacemos con descenso de gradiente estocástico y para realizar un descenso de gradiente estocástico.

11:21.540 --> 11:24.010
Necesitamos nuestro optimizador, pero ya lo tenemos.

11:24.030 --> 11:26.040
Aquí están Adam Optimizer.

11:26.430 --> 11:29.010
Pero ahora, en este punto, recuerde lo que tenemos que hacer.

11:29.370 --> 11:32.380
Tenemos que inicializarlo e inicializarlo.

11:32.400 --> 11:40.620
Recuerde, tomamos nuestro objeto optimizador y luego aplicamos el método de graduación cero.

11:41.440 --> 11:48.220
Ahí vamos, no nos olvidamos del paréntesis que lo inicializa, y ahora el siguiente paso es

11:48.220 --> 11:55.630
propagar hacia atrás el último error a la nueva red y para hacer esto, tomamos nuestro último error

11:55.630 --> 11:58.950
y le aplicamos el método hacia atrás.

11:58.960 --> 12:01.800
Entonces eso es exactamente para aplicar la propagación hacia atrás.

12:02.110 --> 12:06.380
Y finalmente, ahora que ha vuelto el último error, propaguelo a la nueva red.

12:06.610 --> 12:09.610
Bueno, podemos actualizar los pesos con el descenso de gradiente de Cassi.

12:10.300 --> 12:16.950
Y para hacer esto, recuerda, tomamos nuestro optimizador y luego aplicamos el método de pasos.

12:17.500 --> 12:18.210
Aquí vamos.

12:18.400 --> 12:19.900
Los pesos ahora están actualizados.

12:20.200 --> 12:25.500
Como te dije, no solo ya lo hicimos, sino que ahora parece tan simple y tan natural.

12:26.200 --> 12:28.440
Así que ahora vamos a hacer algo divertido.

12:28.600 --> 12:31.650
Vamos a imprimir la recompensa promedio cada apoc.

12:31.840 --> 12:35.830
Entonces, ya sabes, podemos realizar un seguimiento de cómo el A. YO. va, cómo va el entrenamiento.

12:36.190 --> 12:40.420
Queremos ver que la recompensa promedio aumenta con los pasos, en el cuadro.

12:40.630 --> 12:44.070
Y al principio, por supuesto, está esta fase de exploración.

12:44.080 --> 12:49.690
Por lo tanto, es posible que la recompensa promedio no aumente al principio, pero luego, una vez que

12:49.690 --> 12:56.050
llegue a la fase de explotación, veremos que la recompensa promedio aumenta definitivamente y aumentará hasta cierto nivel, que es cuando

12:56.290 --> 12:58.740
llega al oeste tan rápido como posible.

12:59.380 --> 13:01.210
Así que comencemos con la impresión.

13:02.200 --> 13:07.660
Ya sabes, estamos haciendo esto en una sola, así que tenemos que volver a la impresión en

13:07.660 --> 13:12.610
bucle y luego vamos a imprimir bien, primero alrededor de una columna, luego en porcentaje.

13:12.610 --> 13:18.850
S, porque vamos a convertir todo en una cadena que sea mejor y luego

13:18.850 --> 13:21.100
agregaremos la recompensa promedio.

13:22.490 --> 13:27.620
Y luego también agregamos el porcentaje, luego cerraremos la cotización.

13:28.890 --> 13:35.220
Y luego agregamos un porcentaje y por otro lado, ya sabes, ingresamos las variables que van a ser la primera

13:35.220 --> 13:41.430
persona, ya que esa es la épica aquí y la segunda variable correspondiente a la recompensa promedio, que se

13:41.610 --> 13:42.840
computará ahora mismo.

13:43.020 --> 13:45.560
Entonces, la variable de recompensa promedio aún no existe.

13:45.780 --> 13:47.600
Lo vamos a crear ahora mismo.

13:48.120 --> 13:51.930
Entonces vamos a utilizar ETR en el trabajo.

13:52.470 --> 13:55.440
Incluso si Époque es el número, lo convertiremos en una cadena.

13:55.440 --> 13:57.090
Eso es mejor y.

13:58.110 --> 14:03.150
Vamos a agregar, Estie, si esa será la recompensa promedio y entonces vamos

14:03.150 --> 14:09.810
a crear una variable que llamaremos una gran recompensa y ahora vamos a crear esta variable y calcularla. ?

14:10.560 --> 14:12.430
OK, entonces hagamos esto.

14:12.450 --> 14:13.980
Eso es lo único que nos queda por hacer.

14:13.980 --> 14:15.900
Entonces Époque, ya lo hemos hecho.

14:16.170 --> 14:20.040
Ahora calculemos el mundo promedio y necesitamos calcularlo aquí.

14:20.130 --> 14:27.090
Todavía en el ciclo, pero fuera del ciclo, porque ahora tenemos nuestro lote muestreado y nuestro entrenamiento ocurre en

14:27.090 --> 14:28.050
el lote.

14:28.350 --> 14:31.940
Pero ahora la propagación hacia adelante más la propagación hacia atrás se realiza en el lote.

14:32.190 --> 14:39.900
Así que estamos volviendo al ciclo y ahora podemos calcular las recompensas acumulativas que podemos hacer con nuestro

14:39.900 --> 14:41.100
objeto empeines.

14:41.430 --> 14:47.910
Debido a que nuestro objeto de empeines contiene esta función, haríamos pasos que nos permitan obtener las recompensas acumulativas que suceden

14:47.910 --> 14:51.250
en los pasos, ya sabes, durante la carrera de empeines.

14:51.660 --> 14:57.330
Así que lo usaremos ahora mismo para actualizar las nuevas recompensas de los pasos.

14:57.660 --> 15:05.640
Y luego actualizaremos el objeto de promedio móvil agregando las recompensas acumulativas al objeto cotidiano en movimiento y luego

15:05.640 --> 15:07.770
volveremos a calcular el promedio.

15:07.780 --> 15:09.910
Y así es como vamos a conseguir la recompensa media.

15:10.590 --> 15:11.510
Así que hagamos esto.

15:11.520 --> 15:14.640
Lo primero que necesitamos son los datos de recompensas de DARABA.

15:14.970 --> 15:16.950
Así que llamémosles recompensas.

15:18.100 --> 15:27.700
Pasos y luego, como dijimos, tomamos nuestro objeto de pasos finales, que fue, les recuerdo, creado aquí un objeto de la clase de

15:27.700 --> 15:33.310
progreso instantáneo a partir de nuestra experiencia que contagiamos al sujeto tan sensible.

15:34.000 --> 15:39.410
Luego agregamos recompensas, pasos y luego algunos paréntesis.

15:39.760 --> 15:40.150
Todo bien.

15:40.180 --> 15:43.690
Eso nos dará las nuevas recompensas acumulativas de los pasos.

15:43.990 --> 15:44.500
Todo bien.

15:45.310 --> 15:50.800
Pero luego debemos agregar estas nuevas recompensas acumulativas en nuestros objetos de promedio móvil.

15:50.980 --> 15:57.760
Y para hacer esto, tenemos un método esta vez en la clase de media móvil, que es este método publicitario que es muy

15:57.760 --> 15:58.210
simple.

15:58.220 --> 16:03.190
Tomamos nuestro objeto de media móvil, que creamos aquí con cien pasos.

16:03.790 --> 16:11.710
Luego, usaremos nuestro método ADD y luego en la atmósfera ingresamos nuestros pasos de recompensa y esto agregará las

16:11.710 --> 16:15.130
recompensas de los pasos a la media móvil.

16:15.970 --> 16:16.360
Todo bien.

16:16.360 --> 16:21.960
Y finalmente, podemos calcular la recompensa promedio y eso está bien, ya sabes, esa es la misma variable aquí.

16:22.690 --> 16:26.440
Entonces eso es lo que será igual a la recompensa promedio.

16:26.860 --> 16:33.250
Y para obtenerlo, solo necesitamos usar el método de promedio esta vez de nuestro objeto de promedio móvil.

16:33.700 --> 16:41.470
Y eso es lo que hacemos y un promedio de puntos así, porque nuestro promedio móvil ya se actualizó con los nuevos

16:41.710 --> 16:45.520
pasos de recompensas que acabamos de agregar al método ADD.

16:46.430 --> 16:46.890
Excelente.

16:46.960 --> 16:52.990
Así que ahora tenemos nuestro premio promedio, por lo que es muy popular aquí y se imprimirá todos los años.

16:53.420 --> 16:54.990
Está bien, así que terminamos.

16:55.030 --> 16:57.170
Así que estoy muy emocionado de ver los resultados.

16:57.170 --> 17:01.670
Y de hecho, voy a tener una sorpresa para ti en el próximo tutorial mientras miras los resultados.

17:01.700 --> 17:03.380
Así que va a ser muy emocionante.

17:03.650 --> 17:06.740
Y ahora creo que es hora de jugar con el aire y divertirse.

17:07.610 --> 17:08.060
Todo bien.

17:08.060 --> 17:11.240
Así que prepárate un buen café o un buen té.

17:11.480 --> 17:17.410
Ahora es el momento de sentarse cómodamente en nuestra silla y ver algunos videos geniales de nuestro avión para ver, eso es

17:17.430 --> 17:18.760
en el siguiente tutorial.

17:18.770 --> 17:20.160
Y hasta entonces, disfruta.
