WEBVTT

00:00.270 --> 00:02.250
Hola y bienvenidos a la tienda.

00:02.430 --> 00:05.810
Estoy súper emocionado porque estamos a punto de hacer que el A-3 vea el cerebro.

00:05.810 --> 00:07.430
Ese es el cerebro de nuestra IA.

00:07.590 --> 00:10.800
Y hablando de cerebros me gustaría resaltar algo.

00:10.870 --> 00:15.750
Recuerde que en el primer módulo creamos un cerebro simple con solo capas conectadas por completo.

00:15.840 --> 00:22.260
Luego, en el segundo módulo para Dhoom hicimos un cerebro que no solo tenía capas conectadas sino

00:22.350 --> 00:29.070
también ojos porque añadimos las capas convolucionales que daban al ojo porque podía observar las imágenes y comprender

00:29.070 --> 00:31.550
lo que sucedía en el interior.

00:31.830 --> 00:37.590
Y ahora vamos a decir eso incluso a un nivel alto porque vamos a hacer un cerebro que

00:37.590 --> 00:41.310
no solo tendrá ojos y conectará capas por completo sino también memoria.

00:41.430 --> 00:46.710
Porque como dije en el tutorial anterior vamos a agregar un registro de ese trabajo dentro

00:46.710 --> 00:53.490
de este gran cerebro y eso le dará una larga memoria a nuestro cerebro para que pueda entender las relaciones

00:53.580 --> 00:57.010
temporales de las propiedades temporales de las imágenes de entrada.

00:57.120 --> 01:02.400
Así que ahí vamos y un cerebro aún más poderoso. Puedo decirles que el Dymo que

01:02.640 --> 01:09.930
tratamos sobre Intiman en este momento es realmente muy poderoso y podemos ver cómo construir IA y profundizar más y el aprendizaje de

01:10.260 --> 01:14.820
Forsman se trata de acercarse cada vez más a cómo funciona el cerebro humano

01:14.820 --> 01:19.560
Sabes que comenzamos con las relaciones básicas del cerebro con las conexiones lineales.

01:19.560 --> 01:22.230
Luego agregamos ojos y agregamos la memoria.

01:22.230 --> 01:24.900
Quién sabe qué vamos a agregar en los modelos futuros.

01:24.990 --> 01:30.780
Sabes que en 2018 tal vez agregarán algo que hará que el cerebro parezca aún más como un

01:30.780 --> 01:31.330
cerebro humano.

01:31.680 --> 01:37.590
Pero ya con los ojos y la memoria del láser totalmente conectados, ya tenemos un cerebro realmente bueno

01:37.590 --> 01:38.280
y funcional.

01:38.790 --> 01:39.690
Hagamoslo.

01:39.750 --> 01:41.140
Hagamos este cerebro

01:41.310 --> 01:46.470
Así que, como de costumbre, haremos una clase para eso porque va a tener muchas

01:46.470 --> 01:48.780
propiedades con las convoluciones y la ciencia.

01:48.870 --> 01:53.770
Así que vamos a hacer que funcione para inicializar todo esto y crear todas estas conexiones.

01:54.090 --> 01:59.220
Y luego, por supuesto, tendremos la función Ford que, por supuesto, propagará la señal

01:59.220 --> 02:02.580
dentro del cerebro para que podamos obtener la salida.

02:02.580 --> 02:03.200
Todo bien.

02:03.240 --> 02:04.020
Estás listo.

02:04.140 --> 02:05.400
Hagámoslo.

02:05.400 --> 02:13.470
Entonces, la clase que presentamos en clase la llamamos crédito de actor porque, por supuesto, estoy hablando de cerebros

02:13.470 --> 02:13.700
aquí.

02:13.710 --> 02:19.440
Pero no olvidemos que estamos haciendo con el modelo que se basa en el principio de crítica activa con

02:19.650 --> 02:24.810
el actor y el crítico por separado, por lo que realmente hará una de las conexiones casi completas

02:24.810 --> 02:27.770
para el actor y una conexión significativa para el crítico.

02:27.810 --> 02:30.880
Verás qué tan bien haremos que será bastante simple.

02:30.900 --> 02:39.060
y esta clase de actores heredarán desde el final y ese Maggio para que podamos usar todas las herramientas de Pitre.

02:39.060 --> 02:40.780
Así que la crítica activa

02:40.860 --> 02:44.130
Así que hagamos esto para heredar desde el final en ese módulo.

02:44.190 --> 02:53.000
Bueno, tenemos que tomar primero la biblioteca de la antorcha y luego eso y luego y eso y Mudgal.

02:53.090 --> 02:54.100
Todo bien.

02:54.110 --> 02:55.600
De esa forma heredamos de eso.

02:56.990 --> 02:57.240
Todo bien.

02:57.260 --> 03:01.630
Así que ahí vamos con nuestra primera función, que por supuesto estará en su función.

03:01.640 --> 03:10.400
lo llamamos no entradas y la fase de acciones que es básicamente el espacio que contiene todas las acciones.

03:10.850 --> 03:17.970
Entonces comenzamos en su doble subrayado, entonces esta función tomará como argumento uno mismo con

03:18.050 --> 03:25.820
el objeto, luego la forma de entrada que son las dominaciones de nuestras imágenes de entrada y

03:26.000 --> 03:31.340
También sabemos que desde este espacio de acción podemos obtener una serie de acciones que son una serie de

03:31.700 --> 03:33.870
acciones posibles que realmente se realizarán muy pronto.

03:33.870 --> 03:38.290
Entonces es por eso que también necesitamos eso para los argumentos.

03:38.290 --> 03:39.390
Eso es todo lo que necesitamos.

03:39.650 --> 03:45.450
Y luego entremos en la función y creemos todas las variables propias de nuestro cerebro.

03:45.830 --> 03:51.740
desde el final de Maggio, tenemos que usar la superfunción de esta manera dentro de la cual ingresamos.

03:52.040 --> 03:59.450
Pero antes de hacerlo recordamos lo que tenemos que hacer para activar de alguna manera la herencia de que podemos utilizar todas

03:59.450 --> 04:00.180
las herramientas

04:00.440 --> 04:10.740
Actor crítico que es nuestra clase y luego subir con el objeto. Muy bien, en ese

04:10.740 --> 04:14.840
momento vamos otra vez con la función.

04:14.940 --> 04:15.560
Aquí vamos.

04:15.600 --> 04:20.100
Eso nos da todas las herramientas que todos necesitamos de la antorcha para construir nuestro cerebro.

04:20.400 --> 04:21.940
De acuerdo entonces.

04:22.170 --> 04:24.690
Bueno, es hora de hacer que los ojos.

04:24.780 --> 04:26.210
Esa es la convolución.

04:26.460 --> 04:31.770
Así que vamos a hacerlo muy rápido porque ya explicamos esto en detalles para la perdición.

04:31.800 --> 04:34.210
Porque recuerdo el día que tuve hielo.

04:34.260 --> 04:39.240
Así que es exactamente lo mismo, vamos a sacar algunas conclusiones y vamos a utilizar una arquitectura

04:39.510 --> 04:45.240
muy simple con 32 detectores de funciones de tamaño tres por tres pasos de dos y un relleno de uno.

04:45.450 --> 04:50.460
Esa es una arquitectura bastante clásica, pero eso será suficiente para que sepas que entiendo

04:50.690 --> 04:53.010
lo que está pasando en el descanso.

04:53.010 --> 04:54.090
DE ACUERDO.

04:54.480 --> 04:56.750
Muy bien, entonces hagamos esas convoluciones.

04:56.790 --> 05:03.900
Así que comenzamos con uno mismo porque las circunvoluciones serán variables de los objetos, de

05:03.900 --> 05:09.210
modo que si podemos llamarlo, vendrán cuatro convoluciones, y este puede hacerlo.

05:09.540 --> 05:11.040
Y ahí vamos.

05:11.040 --> 05:18.900
Tomamos el punto N y Maggio y luego llevamos el cono a la clase porque realmente convenant será

05:18.930 --> 05:20.670
un objeto de disgusto.

05:21.540 --> 05:25.870
Y luego dentro primero ponemos la forma de entrada de las imágenes.

05:25.920 --> 05:32.780
Así que eso es exactamente lo que tenemos aquí para que podamos copiar esto e ingresarlo como la primera entrada.

05:33.090 --> 05:38.600
Luego, el segundo argumento es el número de detectores de funciones que también son el número de núcleos.

05:38.640 --> 05:45.060
Así que vamos a tomar 32 como acabamos de decir la elección clásica, entonces tenemos que elegir el tamaño del

05:45.060 --> 05:50.130
núcleo que es el número de celdas que se deslizará sobre la imagen de entrada.

05:50.190 --> 05:55.170
Y recuerden que podemos tomar tres cuatro o cinco opciones y vamos

05:55.290 --> 05:58.460
a elegir tres y luego vamos a elegir.

05:58.550 --> 06:01.100
Trató de.

06:01.340 --> 06:11.350
Y un relleno de uno que vamos que es para la primera convolución que va desde la imagen de entrada a

06:11.350 --> 06:16.210
la primera capa convolucional se compone de 32 imágenes intrincadas.

06:16.360 --> 06:18.850
Entonces ahora estamos listos para hacer la segunda circunvolución.

06:18.850 --> 06:27.290
Así que en realidad va a ser casi lo mismo, así que estoy copiando esta línea y basándome en la siguiente

06:27.310 --> 06:33.490
pegada una vez más y pegándola una última vez porque vamos a tener cuatro circunvoluciones

06:33.490 --> 06:42.640
y casi nada para cambiar, así que ya podemos reemplazar Here comes uno llega a uno por tres y viene uno por cuatro.

06:42.670 --> 06:45.160
Esa serán nuestras cuatro circunvoluciones.

06:45.160 --> 06:49.330
Y ahora, por supuesto, tenemos que cambiar algunas cosas aquí, pero no mucho, porque vamos a hacer

06:49.370 --> 06:52.280
un seguimiento de dos para cada uno y un patrón de uno.

06:52.420 --> 06:58.620
Todos ellos tendrán 32 detectores de funciones que tienen 32 imágenes complejas enredadas.

06:58.780 --> 07:04.040
Pero luego recuerde que esto corresponde a la parte izquierda de la convolución.

07:04.180 --> 07:09.610
Entonces, en realidad, eso corresponde a lo que estaba en la parte derecha de la conclusión anterior, sabes que es

07:09.610 --> 07:10.370
como un dominó.

07:10.390 --> 07:11.440
Es realmente fácil.

07:11.560 --> 07:22.390
Y por lo tanto, aquí tenemos que poner 32 y aquí es donde vamos a ver muy fácilmente 32 y 32.

07:22.390 --> 07:27.790
Muy bien, para resumir, comenzamos con nuestras imágenes de entrada que no tienen ninguna.

07:27.810 --> 07:35.350
que obtenemos 32 imágenes intrincadas, cada una detectando una característica específica. Luego, de estas 32 imágenes complejas, aplicamos la

07:35.800 --> 07:43.120
segunda circunvolución para obtener 32 nuevas imágenes intrincadas y luego las mismas de estas 32 nuevas imágenes intrincadas.

07:43.420 --> 07:46.510
Simon Jones fue la primera convolución en la

07:46.510 --> 07:52.430
Aplicamos la tercera circunvolución para obtener 32 nuevas imágenes intrincadas de nuevo y luego, eventualmente de

07:52.450 --> 07:57.470
las tres a las imágenes complejas, aplicamos la cuarta circunvolución para obtener características.

07:57.490 --> 07:57.910
Todo bien.

07:57.910 --> 08:03.700
Y esto será suficiente con esto o tendré una supervisión que tomará la pelota muy bien.

08:03.700 --> 08:07.250
Está bien así que eso es todo para la convolución Así que eso es todo para los ojos.

08:07.420 --> 08:09.490
Y ahora cuidemos la memoria.

08:09.640 --> 08:15.520
Esta nueva característica de este cerebro estamos implementando en oposición a antes, no solo

08:15.680 --> 08:23.140
tendrá una supervisión sino que también tendrá una memoria super larga memoria porque veremos memoria a largo plazo,

08:23.170 --> 08:29.230
que es este tipo de registro o neuronal. red que le da a su modelo

08:29.230 --> 08:36.580
una especie de memoria larga para que pueda aprender algunas relaciones temporales largas del pasado, diciendo que vamos

08:36.580 --> 08:43.180
a crear nuevas variables a partir del tiempo consigo mismo y esta nueva variable la llamaremos

08:43.180 --> 08:47.260
simplemente porque esto corresponderá a la red LACMA dentro del cerebro.

08:47.290 --> 08:55.240
Así que SVM y antes de escribir el código para el LCN, asegurémonos de entender qué hará esta parte

08:55.240 --> 08:56.270
del cerebro LACMA.

08:56.530 --> 09:03.980
Entonces, como entendimos, este LCN se usa para conocer las propiedades temporales de las imágenes de entrada de entrada.

09:04.090 --> 09:09.730
Entonces, por ejemplo, si la pelota golpea a un LACMA codificará el equilibrio.

09:09.730 --> 09:11.410
Entonces eso es lo primero que debes entender.

09:11.410 --> 09:15.070
Codificará lo que está sucediendo en el juego.

09:15.070 --> 09:20.080
Luego, la siguiente cosa importante que debemos entender cuando implementamos ISTM es que tenemos

09:20.170 --> 09:26.680
que elegir en orden las dependencias temporales y aquí, dado que vamos a alimentar nuestra red neuronal con

09:26.680 --> 09:33.740
una secuencia de cuatro imágenes, eso significa que ya podemos Aprender algunas dependencias temporales de orden para eso son

09:33.740 --> 09:40.310
algunas dependencias temporales donde lo que sucede a 1:20 depende de lo que ocurra en el tiempo T.

09:40.360 --> 09:45.500
T menos 1 T menos 2 y T menos 3 para que podamos definitivamente hacer eso.

09:45.730 --> 09:51.040
Pero la buena noticia es que vamos a utilizar el análisis YEM y, por lo

09:51.160 --> 09:54.560
tanto, podremos aprender algunas relaciones temporales aún más complejas.

09:54.650 --> 10:00.430
Por ejemplo, podemos aprender algunas propiedades simples donde lo que sucede a la 1:20 dependerá de lo que ocurra en

10:00.430 --> 10:01.370
el tiempo T.

10:01.370 --> 10:05.510
T menos 20 minutos para hacer menos tres hasta T menos.

10:05.940 --> 10:13.360
Y esa es la parte larga de la memoria a largo plazo con este ensayo y podemos aprender

10:13.360 --> 10:15.490
algunas relaciones temporales muy complejas.

10:15.490 --> 10:18.080
Está bien, así que agreguemos nuestro LCN.

10:18.160 --> 10:25.030
Entonces para hacer esto vamos a usar el N en el módulo y luego vamos a agregar la clase como T. NORTE. célula que creará esto como un

10:25.600 --> 10:31.960
objeto que representará DST y parte de la nueva red porque ahora mismo, lo que también es

10:31.960 --> 10:38.570
importante entender es que estamos haciendo un CR y luego conocemos un registro convolucional de una nueva red

10:38.590 --> 10:45.520
y la parte de arland viene después del CNN parte y por lo tanto ahora mismo lo que necesitamos

10:45.610 --> 10:51.350
ingresar en esta celda LACMA es primero el tamaño de la salida después de la convolución.

10:51.400 --> 10:56.060
Entonces eso es 32 veces tres veces tres.

10:56.230 --> 11:02.670
Así que esto 32 veces tres veces tres es en realidad la salida después de las cuatro circunvoluciones aquí.

11:02.830 --> 11:07.600
Pero eso se convierte en la entrada del ARN, el LSD y ese trabajo.

11:07.870 --> 11:13.710
Y ahora, ¿por qué la salida de las cuatro circunvoluciones es la mitad del tamaño tres dos veces tres veces tres?

11:13.870 --> 11:16.030
Bueno, no te preocupes, no es tan directo.

11:16.060 --> 11:22.140
En realidad, no es una fórmula simple, pero hay una fórmula para calcular esta cantidad de neuronas de salida.

11:22.210 --> 11:26.490
Después de aplanar las imágenes agrupadas y enrevesadas de deconvolución.

11:26.710 --> 11:32.050
Pero si reunimos los términos de esta gran fórmula, obtendremos 32 veces tres veces tres.

11:32.200 --> 11:36.060
No quería dedicar demasiado tiempo a esto porque tenemos mucho que hacer más.

11:36.190 --> 11:39.470
Y además ya hicimos una función para calcular este número.

11:39.520 --> 11:43.710
Recuerda que fue por la perdición cuando hicimos funcionar las neuronas de este recuento.

11:43.870 --> 11:45.750
Entonces puedes reutilizarlo si quieres.

11:45.760 --> 11:51.610
No estás convencido, pero eso es lo que obtenemos después de reunir los términos de esta gran fórmula,

11:51.610 --> 11:53.490
como calcular el número de salidas.

11:53.530 --> 11:59.380
Así que eso es para el primer argumento y luego el segundo argumento será el número de neuronas

11:59.380 --> 12:00.370
de salida del.

12:00.610 --> 12:05.220
Y vamos a ir por 256 OK.

12:05.220 --> 12:12.180
crítico porque usted Sabemos que vamos a hacer realmente dos nuevas redes separadas una para el actor y otra para

12:12.540 --> 12:19.260
el crítico, pero serán la misma codificación de las imágenes y las relaciones temporales para estas dos redes neuronales.

12:19.620 --> 12:25.470
Entonces, ¿qué significa eso ahora que significa que ahora tenemos un vector que codifica cada evento

12:25.470 --> 12:31.410
del juego o, en otras palabras, tenemos un estado codificado y que es ahora que podemos hacer

12:31.410 --> 12:33.990
la separación entre el actor y el

12:33.990 --> 12:37.740
Entonces esta es la parte común que hacemos para estas dos nuevas redes.

12:37.740 --> 12:43.650
Este será el mismo comienzo para las dos nuevas redes, pero ahora las cosas van a cambiar para el actor

12:43.650 --> 12:49.710
y el arroyo porque vamos a hacer uno en la conexión completa para el actor y una conexión diferente a

12:49.710 --> 12:52.200
la casi completa para el personaje cómico. .

12:52.230 --> 12:56.320
Así que tomemos un descanso rápido y hagámoslo en el próximo poco.

12:56.400 --> 12:57.860
Hasta entonces, disfruta de la IA.