WEBVTT

00:00.300 --> 00:02.930
Olá e bem vindo a este tutorial do Python.

00:02.940 --> 00:08.700
Tudo bem, basta construir a arquitetura de uma rede neural com a função de nossa classe de rede

00:09.030 --> 00:13.650
e então vamos fazer uma segunda função que será a função direta e essa

00:13.650 --> 00:15.810
é a função que ativará os neurônios.

00:15.840 --> 00:19.770
Essa é a função que irá realizar para a propagação.

00:19.830 --> 00:27.240
Então, vamos fazer isso, vamos fazer essa função, vamos chamar isso de frente como acabamos de dizer e

00:27.240 --> 00:29.550
essa função vai levar dois argumentos.

00:29.610 --> 00:35.070
sabe poder usar as variáveis ​​do objeto porque usaremos SE1 NFC.

00:35.070 --> 00:37.400
Primeiro, é como sempre, você

00:37.500 --> 00:43.440
Então, precisamos de si mesmo para poder usar essas variáveis ​​e então vamos precisar de um segundo argumento,

00:43.590 --> 00:50.100
que é nossa contribuição, e nós vamos chamá-lo de estado porque o estado é exatamente a entrada de nossas redes

00:50.100 --> 00:50.580
neurais.

00:50.580 --> 00:51.980
Você sabe que são os Estados.

00:51.990 --> 00:57.320
Existem outras entradas que entram na rede neural e, em seguida, como as saídas terão os valores q das três ações

00:57.330 --> 01:00.560
possíveis, vá para a esquerda, vá direto ou vá para a direita.

01:00.690 --> 01:06.210
principalmente retornará os valores do cubo para cada ação possível, dependendo da estado de entrada aqui.

01:06.210 --> 01:11.880
Mas não precisamos colocá-lo como um argumento aqui, porque é exatamente isso que queremos retornar a

01:11.880 --> 01:16.640
esta função para frente, não só vai ativar os neurônios, mas também e

01:16.650 --> 01:17.060
Tudo bem.

01:17.100 --> 01:19.000
Então, esses são os dois argumentos que precisamos.

01:19.140 --> 01:24.440
E agora vamos entrar na função e vamos especificar o que queríamos fazer.

01:24.740 --> 01:29.940
OK, então a primeira coisa que vamos fazer é ativar os neurônios escondidos e nós

01:29.940 --> 01:34.690
vamos chamar os neurônios escondidos pela variável x, então x representa os neurônios escondidos.

01:34.800 --> 01:36.750
E assim como ativá-los.

01:36.930 --> 01:39.990
Bem, claro, vamos levar nossos neurônios de entrada.

01:40.170 --> 01:45.360
Nós vamos usar nossa primeira conexão completa se você quiser obter os neurônios escondidos e então

01:45.360 --> 01:49.570
vamos aplicar a função de inativação sobre eles, que será a função rectificada.

01:49.860 --> 01:51.450
Então, como você vai fazer isso?

01:51.450 --> 01:54.680
Lembre-se de que importamos a tocha.

01:54.730 --> 02:01.450
E é esse módulo funcional que contém todas as funções para implementar a rede neural.

02:01.560 --> 02:02.960
E nós demos o atalho.

02:03.450 --> 02:08.130
vamos usar uma dessas funções a partir do módulo funcional e esta função é realmente funcionar.

02:08.130 --> 02:11.240
Então, na verdade, o que vamos fazer agora é que

02:11.430 --> 02:16.490
Então, o que é realmente relevante é a função de retificador que você viu nas palestras de intuição.

02:16.620 --> 02:19.040
Isso é devidamente dado à função de retificador.

02:19.170 --> 02:26.130
Mas, uma vez que esta função é tirada e naquele funcional que recebeu o atalho, precisamos

02:26.130 --> 02:31.860
digitar aqui os primeiros pensamentos e então é aí que podemos assumir essa função.

02:31.990 --> 02:36.610
E na verdade, se eu digitar, estamos aqui, nós vamos, temos a função real.

02:36.630 --> 02:41.980
Então, isso é direcionado por uma função que ativará os neurônios escondidos que são x.

02:42.030 --> 02:47.640
realmente, agora entendemos perfeitamente o que temos para inserir, os neurônios que queremos ativar.

02:47.640 --> 02:48.920
Então, nesta função

02:48.990 --> 02:54.300
São os neurônios escondidos e, assim, para obter esses neurônios escondidos, iremos levar nossa

02:54.520 --> 03:01.540
primeira conexão completa, a qual aplicaremos nos neurônios de entrada para passar dos neurônios de entrada aos neurônios.

03:01.800 --> 03:04.450
Então, vamos tomar nossa primeira conexão completa.

03:04.620 --> 03:08.070
Mas nossa primeira conexão completa é uma variável do nosso objeto.

03:08.130 --> 03:12.070
Portanto, precisamos digitar aqui primeiro.

03:12.120 --> 03:13.550
FC, um aqui vamos.

03:13.620 --> 03:16.660
Essa é a primeira conexão completa da nossa rede neural.

03:16.980 --> 03:22.890
E, dentro dessa conexão pessoal, vamos inserir nossos estados de entrada para passar dos neurônios de entrada

03:23.010 --> 03:24.210
para os neurônios escondidos.

03:24.480 --> 03:30.680
E então, desde que demos o nome ESTADO Bem, aqui temos dois estados de entrada e lá vamos.

03:30.720 --> 03:34.360
Agora temos neurônios escondidos ativados.

03:34.510 --> 03:35.000
Tudo bem.

03:35.040 --> 03:40.610
E agora que temos os neurônios escondidos, vamos retornar os neurônios de saída.

03:40.640 --> 03:46.240
Então, a próxima linha e, como você entende, os neurônios de saída correspondem às nossas ações.

03:46.370 --> 03:48.170
Mas estas não são as ações diretamente.

03:48.290 --> 03:55.760
Estes são os valores de q porque estamos construindo um modelo digital que combina um modelo mais profundo com o Q Learning e, portanto,

03:56.020 --> 04:02.090
usamos q aprendendo aqui para obter os valores de q para cada uma de nossas ações e, em seguida,

04:02.090 --> 04:09.560
usando Máx Max ou no nosso Max vamos obtenha a ação final, então aqui o Voivode que estou prestes a apresentar irá corresponder à

04:09.560 --> 04:13.560
nuatura APA e uma vez que os neurônios de saída são os valores-chave.

04:13.640 --> 04:15.590
Bem, eu vou chamar essa variável.

04:15.590 --> 04:24.630
Q Isso significa que nós vamos para valores de q e agora nós tomamos diretamente nossa conexão de comida, que é a variável.

04:24.810 --> 04:27.010
Para colocar uma variável de nosso objeto.

04:27.020 --> 04:33.830
levamos aqui autodidata F C para e, claro, aqui nós inserimos os neurônios do lado esquerdo desta conexão.

04:34.010 --> 04:34.860
Então, nós

04:34.910 --> 04:38.050
É isso que obtivemos da primeira linha que é x.

04:38.270 --> 04:40.770
Então, vamos lá.

04:40.790 --> 04:42.650
Agora recebemos nossos valores de Q.

04:42.680 --> 04:45.790
São os neurônios de saída da nossa rede neural.

04:46.100 --> 04:46.800
ESTÁ BEM.

04:47.060 --> 04:53.050
E, em seguida, a última linha de código, é claro, essa função direta é usada para retornar esses valores.

04:53.210 --> 05:02.900
simplesmente valores de Q e que retornará os valores-chave para cada ação possível, vá para a esquerda, continue direto ou vá para a direita.

05:02.900 --> 05:06.310
Então, só temos que adicionar um retorno e

05:06.370 --> 05:06.760
Tudo bem.

05:06.760 --> 05:08.370
Então, parabéns.

05:08.370 --> 05:13.720
Terminamos com nossa primeira classe e, na verdade, fomos feitos fazendo a arquitetura da rede neural.

05:13.720 --> 05:15.550
Lembre-se que este não está terminado.

05:15.550 --> 05:19.890
Você sempre pode melhorar a arquitetura da rede neural tentando diferentes.

05:20.020 --> 05:22.780
Então, sinta-se livre para isso, adicionando mais neurônios aqui.

05:22.780 --> 05:28.270
e 50 e, em seguida, você pode adicionar algumas camadas mais escondidas ao fazer algumas conexões úteis.

05:28.270 --> 05:34.860
Por exemplo, se você quiser adicionar 50 neurônios escondidos, basta substituir os 30 aqui e os 30 aqui por 50 50

05:34.990 --> 05:37.630
Bem, esse é realmente o trabalho de um artista.

05:37.660 --> 05:41.980
Não existe uma regra geral sobre qual seria a melhor arquitetura em cada situação.

05:42.040 --> 05:43.720
Então é por isso que temos que experimentar.

05:43.940 --> 05:50.140
Vamos tentar com isso, você verá que conseguiremos, eventualmente, um carro muito bom auto-dirigido.

05:50.170 --> 05:50.590
Tudo bem.

05:50.620 --> 05:55.960
E agora vamos fazer a próxima aula sobre replay da experiência e nós faremos isso nas

05:55.990 --> 05:57.450
próximas três a duas horas.

05:57.610 --> 05:59.080
Até então, desfrute da AI.