WEBVTT

00:00.490 --> 00:02.550
Hola y bienvenido a este tutorial.

00:02.560 --> 00:07.550
Muy bien, así que vamos a comenzar con el primer compañero de nuestra moral y la ave más importante

00:07.630 --> 00:08.410
que está confusa.

00:08.440 --> 00:09.020
Por qué.

00:09.180 --> 00:14.590
Y esto es en este archivo que implementaremos el cerebro del homo, usted conoce el cerebro en el

00:14.650 --> 00:20.290
corazón del Simmo 8: 3 que está en este archivo que hará que la red neuronal que contendrá, por

00:20.290 --> 00:25.030
supuesto, algunos convolucionales sabrá cuando eso funcione porque por supuesto todavía estamos haciendo un aprendizaje profundo

00:25.030 --> 00:25.570
de refuerzo.

00:25.690 --> 00:31.690
Así que pueden tener ojos y dentro de esta red neuronal integrarán todo lo que está relacionado

00:31.870 --> 00:34.600
con el Craigmile activo y hay una bonificación.

00:34.630 --> 00:39.550
Como te dije, estamos implementando una de las morales A-3 más poderosas y lo que lo hace tan

00:39.550 --> 00:45.910
poderoso es que contendrá un registro de una nueva red y más precisamente en la memoria a largo plazo de LCN para que

00:45.910 --> 00:48.660
podamos aprender las propiedades temporales de lo que pasando.

00:48.670 --> 00:54.710
Una vez más, eso es en realidad las propiedades temporales de la entrada para que las predicciones sean aún mejores.

00:55.270 --> 00:56.050
Entonces ahí vamos

00:56.050 --> 01:01.330
muy poderoso que combina básicamente todas las redes neuronales que vimos en el curso de profundización.

01:01.420 --> 01:02.590
Estamos implementando un modelo

01:02.680 --> 01:08.070
Esa es una red neuronal artificial, una red neuronal convolucional y una red nueva.

01:08.260 --> 01:13.240
Y en el corazón de todas estas redes está, por supuesto, el modelo A-380 que hará que la AI AI

01:13.240 --> 01:14.040
sea muy poderosa.

01:14.410 --> 01:18.300
Entonces, hagamos esto, ataquemos este modelo e implementemos.

01:18.430 --> 01:21.760
Así que vamos a comenzar haciendo dos funciones.

01:21.850 --> 01:26.410
vamos a tener pesos y solo queremos hacer estas dos funciones para que ya tenemos

01:26.410 --> 01:30.460
una herramienta para integrar muy fácilmente dentro del hogar para que la red neuronal.

01:30.460 --> 01:36.740
Solo hay algunas funciones que se ocuparán de cómo podemos inicializar los pesos porque sabes que vamos a tener algunas redes

01:36.750 --> 01:38.090
nuevas y, por lo tanto,

01:38.290 --> 01:41.600
Entonces estas dos funciones van a ser columnas normalizadas.

01:41.600 --> 01:48.730
Inicializador que es básicamente una función que no solo puede inicializar algunos pesos sino que establece una varianza específica

01:48.730 --> 01:50.370
de pesos de tensor.

01:50.380 --> 01:52.770
Así que eso es exactamente lo que estamos por implementar en este momento.

01:53.020 --> 01:57.700
Y luego implementaremos la segunda función que serán los pesos en esa función

01:57.700 --> 02:01.840
y que básicamente inicializará los pesos con tiempo suficiente para el aprendizaje.

02:01.840 --> 02:02.330
Todo bien.

02:02.350 --> 02:08.070
Y luego, una vez que hayamos terminado con estas dos funciones, comenzaremos a implementar la red neuronal.

02:08.330 --> 02:14.770
Así que hagámoslo, vamos a hacer estas dos funciones rápidamente, así que empiezo con

02:14.770 --> 02:24.420
una def aquí, luego voy a dar el nombre de esta función que está normalizada y estas columnas centrales subrayan el inicializador.

02:24.720 --> 02:25.550
Aquí vamos.

02:25.650 --> 02:28.780
Y esta función tomará solo dos entradas.

02:29.010 --> 02:35.790
Primero van a ser los pesos que queremos inicializar y la desviación estándar porque, como acabo de

02:35.790 --> 02:40.200
decir, queremos establecer una varianza específica para nuestro tensor de pesos.

02:40.230 --> 02:45.300
Y si quieres entender por qué tenemos que hacer esto es porque sabes cuando crearemos la red neuronal

02:45.620 --> 02:50.490
que será el actor y la crítica de acuerdo con el mañana y haremos dos capas separadas

02:50.490 --> 02:53.670
completamente conectadas una para el actor y uno para el crítico

02:53.880 --> 02:59.970
Y estas dos capas completamente conectadas tendrán pesos y estableceremos una desviación estándar para cada uno de

02:59.970 --> 03:01.810
estos dos grupos de pesos.

03:01.860 --> 03:05.650
Entonces, lo que haremos es establecer una pequeña desviación estándar para el actor.

03:05.700 --> 03:12.570
Será alrededor de 0. 01 y una gran desviación estándar para el crítico, que será alrededor de 1, creo.

03:12.750 --> 03:18.690
podamos establecer fácilmente la desviación estándar para los pesos que inicializaremos más tarde para el actor y el personaje.

03:18.690 --> 03:21.900
Es por eso que estamos haciendo esta función para que

03:21.930 --> 03:23.560
Es por eso que estamos haciendo esto.

03:23.560 --> 03:28.860
Entonces ahora vamos a establecer un valor predeterminado, pero esto cambiará después cuando inicialicemos

03:28.860 --> 03:29.500
los pesos.

03:29.520 --> 03:32.100
Así que vamos a usarlo para 1. 0.

03:32.240 --> 03:32.920
Todo bien.

03:33.000 --> 03:37.340
Y ahora estamos listos para definir qué hay dentro de esta función.

03:37.410 --> 03:41.960
Entonces, lo que primero se preparará es el resultado que vamos a llamar.

03:42.000 --> 03:46.310
Así que esto es lo que devolverá esta función.

03:46.380 --> 03:50.210
Y entonces, al principio, lo que vamos a hacer es eso.

03:50.330 --> 03:56.750
Entonces, como usted entendió, esta salida será un tensor de pesos que tendrá una desviación estándar específica.

03:56.850 --> 04:01.970
Pero antes de que nos ocupemos de establecer la desviación estándar, solo queremos inicializarla y luego estableceremos

04:02.010 --> 04:06.550
la desviación estándar aquí, que es el argumento que es la entrada de esta función.

04:06.870 --> 04:10.670
Así que, para inicializar los pesos del tensor, es posible que sepa cómo hacerlo.

04:10.680 --> 04:12.150
Ya lo hicimos

04:12.180 --> 04:20.250
la ronda y la función que inicializarán la respuesta incendiada con pesos aleatorios que siguen una distribución normal.

04:21.180 --> 04:27.540
Vamos a utilizar nuestra biblioteca de torche y desde esta biblioteca de torche tomaremos

04:27.540 --> 04:29.630
Entonces es por eso que se llama rant.

04:29.820 --> 04:31.100
Y en cuanto a lo normal.

04:31.230 --> 04:36.380
Entonces, lo que simplemente necesitamos ingresar es la cantidad de elementos que contendrá la distensión.

04:36.510 --> 04:41.510
Y esta cantidad de elementos es, por supuesto, la cantidad de pesos porque en realidad estamos inicializando

04:41.500 --> 04:43.140
un tensor para estos pesos aquí.

04:43.350 --> 04:53.410
Y para obtener esta cantidad de elementos simplemente podemos tomar nuestros pesos y agregar puntos para obtener el tamaño con paréntesis.

04:53.410 --> 05:00.280
mismo número de elementos de nuestros pesos y se inicializará con pesos aleatorios siguiendo una distribución normal.

05:00.280 --> 05:05.320
Y esto dará la cantidad de elementos y pesos para que cree el

05:05.320 --> 05:06.860
tensor de antorcha del

05:06.860 --> 05:07.330
Todo bien.

05:07.360 --> 05:13.390
Y ahora es el momento de establecer la desviación estándar que queremos tener, que es la desviación estándar aquí.

05:13.510 --> 05:16.960
Así que vamos a hacer ahora es una normalización simple.

05:16.960 --> 05:21.400
Tenemos un sentido torturado de pesas y ahora queremos normalizarlo.

05:21.600 --> 05:25.810
Entonces, para normalizarlo simplemente escribiremos el cálculo explícito.

05:25.840 --> 05:34.960
luego actualizarla multiplicándola por la desviación estándar que queremos dividir por la suma que acabo de mencionar.

05:34.960 --> 05:41.140
Entonces, lo que tenemos que hacer aquí es tomar nuestra salida y

05:41.140 --> 05:44.960
Y para obtener la suma vamos a usar la función de raíz cuadrada por soplete.

05:45.010 --> 05:48.700
Y así es cuando se toma aquí la antorcha que es q r t.

05:48.820 --> 05:50.710
Esa es la función de raíz cuadrada.

05:50.830 --> 05:55.980
Y dentro vamos a ingresar al cuadrado algunos de los pesos de un vector.

05:56.160 --> 05:58.000
Y entonces tomamos nuestros productos.

05:58.210 --> 06:06.040
Luego usamos la función de potencia a la que ingresamos porque queremos tomar el cuadrado de la

06:06.040 --> 06:08.950
suma y luego tomamos el sol.

06:09.000 --> 06:15.300
Y dentro vamos a especificar el índice del cono que contiene el peso.

06:15.310 --> 06:23.990
Quiere algunos y luego para obtener estos pesos por separado porque quiere sumarlos bien, generalmente expandimos

06:24.490 --> 06:29.440
en la escuela como una función de nuestra salida.

06:29.470 --> 06:29.820
Todo bien.

06:29.820 --> 06:37.280
Así que esto obtendrá los pesos que hasta ahora se inicializaron como un tipo de pesas Torchin que obtiene

06:37.340 --> 06:38.320
todos estos pesos.

06:38.330 --> 06:43.850
Tomamos la suma del cuadrado y luego tomamos la raíz cuadrada para aplicar la normalización.

06:44.030 --> 06:50.230
hecho de que tengamos esta desviación estándar en el numerador nos aseguraremos de que podamos escribirla aquí.

06:50.230 --> 06:50.900
Y el

06:51.960 --> 06:58.890
Las variantes hacia afuera serán iguales al cuadrado de la desviación estándar.

06:58.890 --> 07:05.940
Esta fórmula aquí se asegurará de que este tensor de pesos que inicializamos tenga una varianza que

07:06.030 --> 07:10.860
será igual al cuadrado de la desviación estándar que ponemos como argumentos.

07:11.190 --> 07:17.940
Y así es como podemos establecer una desviación estándar específica para el futuro real y crítico que se

07:17.940 --> 07:24.150
hará pronto y elegiremos una pequeña desviación estándar para el actor y una más grande para el

07:24.340 --> 07:27.780
crítico, y lo haremos muy fácilmente desde esta función.

07:27.780 --> 07:28.150
Todo bien.

07:28.170 --> 07:31.120
Y ahora tenemos solo una cosa por hacer a la izquierda.

07:31.200 --> 07:38.940
Por supuesto, devolver la salida que ahora está normalizada con esta desviación estándar específica.

07:38.940 --> 07:40.340
Muy bien, perfecto.

07:40.350 --> 07:42.680
Esa es la primera función que tuvimos que hacer.

07:42.870 --> 07:46.220
Esa es la primera herramienta que estaremos encantados de usar esta noche.

07:46.250 --> 07:47.290
Cerebro marino H-3

07:47.370 --> 07:49.250
Tenemos una función más para hacer ahora.

07:49.350 --> 07:51.130
Va a ser la función de peso.

07:51.360 --> 07:57.160
Y eso es solo una función que recordará inicializar los pesos para hacer que el aprendizaje sea óptimo.

07:57.570 --> 08:01.110
Así que hagámoslo en el próximo tutorial y hasta entonces.