WEBVTT

00:00.360 --> 00:06.360
Hola y bienvenidos al divertido tutorial de este primer módulo de auto sin conductor, va a ser épico.

00:06.360 --> 00:11.850
Vamos a poner a prueba nuestro ojo en el medio ambiente y vamos a probarlo en cuatro niveles diferentes.

00:11.850 --> 00:16.620
Es decir, vamos a jugar un juego, el juego tendrá cuatro niveles de dificultad y el objetivo

00:16.620 --> 00:18.280
tendrá que superar estos cuatro niveles.

00:18.420 --> 00:20.640
Así que vamos a ser estos cuatro niveles.

00:20.640 --> 00:27.480
Primer Nivel Uno, el primer nivel será llegar al aeropuerto y luego hacer algunos viajes de ida y vuelta entre el aeropuerto

00:27.480 --> 00:29.160
y el centro de la ciudad.

00:29.340 --> 00:35.430
estos viajes redondos Bueno, pasamos al nivel 1, luego el Nivel 2, Nivel 2, será para realizar estos viajes de ida y vuelta.

00:35.450 --> 00:37.490
Entonces, tan pronto como veamos el auto hacer

00:37.560 --> 00:43.290
Pero en el camino específico que dibujamos nosotros mismos, pero va a ser un camino fácil porque es el

00:43.290 --> 00:43.840
nivel 2.

00:43.980 --> 00:49.030
Y, por supuesto, el automóvil tendrá que conducir solo al permanecer en esa carretera.

00:49.170 --> 00:53.420
Entonces será un camino que va del aeropuerto al centro de la ciudad y luego a la inversa.

00:53.420 --> 00:57.010
Y entonces el automóvil tendrá que hacer estos viajes de ida y vuelta sentados en ese camino.

00:57.210 --> 01:00.980
Si lo hace, pasaremos el nivel 2 y el nivel 3.

01:01.030 --> 01:07.410
dibujar algunos obstáculos en el mapa para ver si el automóvil logra evitar los obstáculos y aún así alcanzar su objetivo.

01:07.410 --> 01:08.850
El nivel 3 consistirá en

01:08.910 --> 01:12.730
Entonces, no hay preocupaciones que tracen algunos obstáculos difíciles que el automóvil tendrá que evitar.

01:12.930 --> 01:20.010
Y veremos si logró llegar al aeropuerto y al centro de la ciudad y, finalmente, al nivel más desafiante para

01:20.010 --> 01:25.380
el automóvil será dibujar un camino muy difícil para llegar al centro de la ciudad.

01:25.440 --> 01:28.060
Así que no sé si sabes que será un camino como un zigzag.

01:28.200 --> 01:31.720
No soy un arquitecto brillante, pero intentaré hacer un camino desafiante.

01:31.950 --> 01:37.830
Así que esperemos que pasemos al menos el primer nivel que sería genial, entonces esperemos que también podamos pasar el

01:37.920 --> 01:39.190
nivel dos y tres.

01:39.420 --> 01:42.180
Y si pasamos el nivel 4 eso sería maravilloso.

01:42.180 --> 01:44.540
Entonces, hagamos esto, aceptemos el desafío.

01:44.610 --> 01:49.840
Bueno, en realidad, el auto sin conductor aceptará el desafío, pero nosotros somos los cerebros detrás de esto.

01:49.860 --> 01:52.110
Entonces, veamos cómo funciona eso.

01:52.110 --> 01:57.280
Muy bien, así que lo primero que voy a hacer es solo darle un recordatorio rápido sobre el mapa.

01:57.330 --> 01:59.060
Entonces ese es el mapa.

01:59.190 --> 02:03.810
Y primero vamos a ver el mapa que vamos a ver en el auto que conduce

02:04.020 --> 02:09.540
sin la inteligencia artificial. Será un auto que tenga esas acciones aleatorias que viste al principio de este modelo.

02:09.600 --> 02:10.970
Entonces, ¿cómo podemos ver eso?

02:11.040 --> 02:15.330
Bueno, tenemos que desactivar la IA y la actividad.

02:15.570 --> 02:19.590
Simplemente necesitamos poner una temperatura igual a cero.

02:19.620 --> 02:22.380
Recuerde que el parámetro aquí es la temperatura.

02:22.560 --> 02:24.240
Y en este momento es igual a siete.

02:24.300 --> 02:25.830
Esa es una temperatura baja.

02:25.830 --> 02:27.280
Vamos a aumentar eso luego.

02:27.510 --> 02:32.700
no queremos activar la inteligencia artificial, simplemente debemos establecer la temperatura a cero igual a cero.

02:32.700 --> 02:36.210
Pero si no queremos que el auto tenga un cerebro, si

02:36.210 --> 02:39.980
Y lo mismo aquí, por supuesto, esa es la temperatura real en el frío también.

02:39.990 --> 02:40.460
Aquí vamos.

02:40.470 --> 02:45.580
Y luego no debemos olvidar decir porque de lo contrario eso no incluirá el cambio.

02:45.800 --> 02:47.120
Supongo que ahora no tenemos ninguno.

02:47.130 --> 02:49.210
Veo que solía activarlo.

02:49.260 --> 02:53.180
Echemos un vistazo al mapa solo para darnos un repaso rápido.

02:53.220 --> 02:55.370
Un recordatorio rápido de cómo se ve.

02:55.530 --> 03:01.070
Así que voy a seleccionar todo y presionar enter.

03:01.090 --> 03:01.630
Todo bien.

03:01.630 --> 03:03.840
Y ahí está nuestro mapa y allí está nuestro automóvil.

03:03.880 --> 03:09.540
Entonces, como puedes ver que el auto está teniendo acciones totalmente aleatorias, sabes que debes ir a la izquierda para ir

03:09.540 --> 03:16.480
hacia la derecha y por lo tanto no está llegando al aeropuerto, que es lo que recuerdo en la esquina superior izquierda del mapa y no

03:16.870 --> 03:17.500
lo alcanzo.

03:17.550 --> 03:18.410
Bueno, simplemente lo hizo.

03:18.470 --> 03:20.230
Eso es totalmente aleatorio.

03:20.230 --> 03:26.680
Lo ves ahora mismo, está en el aeropuerto y no está llegando a la otra meta que está en el centro, en la

03:26.680 --> 03:28.220
parte inferior derecha del mapa.

03:28.480 --> 03:34.030
Así que estábamos como aquí pero ahora podemos ver claramente que las acciones son totalmente aleatorias.

03:34.030 --> 03:40.270
No va a ninguna parte y definitivamente no hay inteligencia artificial, pero no preocupaciones.

03:40.270 --> 03:42.080
Lo activaremos ahora mismo.

03:42.370 --> 03:49.480
Voy a cerrar el mapa y luego voy a reiniciar el kernel para reiniciar DeCarlo.

03:49.760 --> 03:52.390
Haga clic en este botón de herramienta aquí y luego sí.

03:52.820 --> 04:00.730
es el momento para el espectáculo en el que finalmente pondremos el tren que fabricamos en el automóvil y activaremos la IA.

04:00.730 --> 04:01.350
Y ahora

04:01.700 --> 04:04.090
Estoy muy emocionado de ver lo que va a pasar.

04:04.180 --> 04:10.730
Vamos a activar el aire en este momento y para hacerlo necesitamos elevar la temperatura para

04:10.730 --> 04:17.300
cambiar la temperatura, que es reemplazada por cero, así que comencemos con siete como lo hicimos antes.

04:17.450 --> 04:19.660
Así que especifiquemos siete aquí.

04:19.670 --> 04:21.510
Está bien, no olvidemos decirlo.

04:21.590 --> 04:26.870
Y ahora volvamos a nuestro mapa y ahora podemos volver a ejecutar esto porque

04:26.870 --> 04:27.790
reiniciamos el kernel.

04:27.890 --> 04:29.470
Entonces digámoslo.

04:29.990 --> 04:31.790
Y ahí vamos tenemos el auto.

04:31.790 --> 04:33.600
Y qué está haciendo?

04:33.890 --> 04:41.180
Bueno, está tratando de encontrar su camino, está explorando su comprensión de lo que tiene que hacer y está a punto de llegar

04:41.180 --> 04:47.900
al aeropuerto, y allí vamos primero, llegamos a lo maravilloso y ahora el próximo objetivo es llegar al centro de la

04:48.140 --> 04:50.540
ciudad y llegar al centro de la ciudad.

04:50.810 --> 04:56.750
Y ahora está tratando de encontrar el aeropuerto de regreso yendo al aeropuerto y allí, de nuevo,

04:56.750 --> 04:57.450
Wonderfalls funciona.

04:57.470 --> 05:03.200
En realidad, no tomó tiempo explorarlo para aprender de los errores que sabe que el error aquí es

05:03.200 --> 05:04.380
alejarse de la marcha.

05:04.520 --> 05:08.770
Ahí es donde castigamos al automóvil dándole una recompensa ligeramente negativa.

05:08.780 --> 05:10.270
Sabes que es menos 0. 2.

05:10.550 --> 05:16.760
Así que aprende de ese error y, al aprender de ese error, logró obtener las recompensas

05:17.000 --> 05:18.980
positivas acercándose a la meta.

05:19.310 --> 05:21.940
Y ahora finalmente entendió lo que tiene que hacer.

05:21.980 --> 05:28.530
Definitivamente llegar al aeropuerto y luego llegar al centro de la ciudad y luego hacer estos viajes redondos.

05:28.550 --> 05:29.970
Eso es perfecto.

05:29.990 --> 05:36.090
Tenemos un auto sin conductor, pero no puedo evitar darme cuenta de que parece un insecto.

05:36.170 --> 05:38.510
El auto realmente no parece estar seguro de sí mismo.

05:38.510 --> 05:40.610
No, no tiene un movimiento muy seguro.

05:40.610 --> 05:44.570
Es como su izquierda y derecha que no se mueve como un movimiento de automóvil.

05:44.660 --> 05:46.090
Se parece más a un error.

05:46.490 --> 05:47.820
Así que vamos a arreglar eso.

05:47.930 --> 05:54.560
es el parámetro en la función de Mac que podemos aumentar para que la acción se devuelva con más certeza.

05:54.560 --> 05:59.690
Y como habrás adivinado, la manera de arreglar eso es aumentar la temperatura porque recuerda

05:59.690 --> 06:00.730
que la temperatura

06:00.830 --> 06:05.630
Entonces, tiene sentido que si aumentamos la temperatura bien podríamos terminar teniendo un automóvil más seguro

06:05.630 --> 06:09.750
de sí mismo porque la IA estará más segura de qué acción debería jugar.

06:10.220 --> 06:15.350
Y eso es recordar porque la acción se jugará con una mayor probabilidad.

06:15.350 --> 06:20.780
El único problema con este aumento de la temperatura es que recuerde que la IA explora

06:20.780 --> 06:26.380
menos las otras acciones porque al aumentar la temperatura de las otras acciones tendremos bajas probabilidades.

06:26.380 --> 06:31.760
este momento eso no parece ser un problema porque el automóvil parece no tener problemas para alcanzar sus objetivos.

06:31.760 --> 06:32.310
Pero en

06:32.420 --> 06:38.840
El aeropuerto está en el centro de la ciudad para que podamos aumentar la temperatura por completo si queremos esto que hasta ahora parece

06:38.840 --> 06:41.140
un insecto que se parece a un automóvil.

06:41.390 --> 06:42.620
Entonces, hagamos esto.

06:42.620 --> 06:45.530
Voy a cerrar esto ahora.

06:45.530 --> 06:46.370
Aquí vamos.

06:46.370 --> 06:48.310
Reinicia el kernel nuevamente.

06:49.430 --> 06:50.590
Y presione sí

06:50.830 --> 06:52.810
Y ahora vamos a aumentar la temperatura.

06:53.200 --> 06:54.090
Entonces, hagamos esto.

06:54.100 --> 07:02.170
Regresaré a mi archivo y luego reemplazaré siete por 100. Aquí vamos.

07:02.340 --> 07:03.410
Entonces ahorramos

07:03.720 --> 07:07.890
Y ahora tenemos un auto sin conductor seguro de sí mismo.

07:07.890 --> 07:11.990
Entonces podríamos obtener mejores resultados y podríamos obtener algo que se parezca más a un automóvil.

07:12.270 --> 07:15.780
Tomemos un mapa y luego volvamos a eso.

07:16.610 --> 07:18.900
Está bien lo que pasó.

07:18.920 --> 07:19.730
DE ACUERDO.

07:19.830 --> 07:21.340
Hizo algún tipo de agotamiento.

07:21.350 --> 07:22.190
No estoy seguro por qué.

07:22.310 --> 07:25.980
Pero de todos modos ahora tenemos algo que se parece más a un automóvil.

07:26.060 --> 07:28.240
Puedes ver que va más derecho.

07:28.240 --> 07:31.190
No está haciendo estos movimientos rápidos de izquierda y derecha.

07:31.190 --> 07:36.410
Esto se debe a que ahora el automóvil está más seguro de qué dirección tomar y cada vez que

07:36.410 --> 07:40.720
lo sabe quiere tomar la mejor dirección para ir al aeropuerto y luego al centro.

07:41.000 --> 07:44.490
Así que claramente ahora podemos decir que pasamos el nivel uno.

07:44.510 --> 07:47.840
El automóvil está haciendo estos viajes de ida y vuelta entre el aeropuerto y el centro de la ciudad.

07:47.990 --> 07:52.610
Así que vamos a guardar eso, es que voy a mostrarte cómo salvar el cerebro.

07:52.610 --> 07:59.520
Solo tenemos que hacer clic en este botón de guardar y si miramos lo que sucede aquí.

07:59.520 --> 08:04.640
Bueno, tenemos la curva de la que estábamos al principio, podemos observar algunos errores que cometió.

08:04.740 --> 08:06.990
Entonces, ahí es donde la recompensa es negativa.

08:07.170 --> 08:14.280
Pero luego aprendió de sus errores y la recompensa aumentó poco a poco hasta que alcanzar una recompensa positiva

08:14.280 --> 08:19.100
constante equivale a abrir uno, pero esa es la recompensa máxima que establecemos.

08:19.200 --> 08:21.640
Y eso es porque terminó explorando.

08:21.870 --> 08:23.490
Esa es la fase de expiración.

08:23.670 --> 08:26.200
Y luego solo sabía lo que tenía que hacer.

08:26.230 --> 08:32.230
Ahí es donde estaba haciendo estos redondos Rountree entre el aeropuerto y el centro de la ciudad sin ningún error.

08:32.640 --> 08:33.450
Entonces ahí vamos

08:33.450 --> 08:34.470
Pasamos el nivel uno.

08:34.470 --> 08:35.850
Felicitaciones.

08:35.850 --> 08:38.170
Ahora vamos a poner las cosas más difíciles.

08:38.190 --> 08:40.120
Llevemos las cosas al siguiente nivel.

08:40.140 --> 08:45.810
Probemos pasar el nivel al que te recuerdo que hacemos estos viajes de ida y vuelta en un camino específico.

08:45.830 --> 08:47.060
Vamos a dibujar nosotros mismos.

08:47.120 --> 08:49.170
Así que vamos a ver eso en el siguiente trabajo.

08:49.200 --> 08:50.780
Y hasta entonces yo
