WEBVTT

00:00.450 --> 00:03.170
Olá e bem vindo a este tutorial do Python.

00:03.240 --> 00:09.180
Então, agora que estamos prontos para treinar a rede para minimizar a distância ao quadrado entre as saídas e

00:09.180 --> 00:13.820
o alvo graças ao que fizemos com o rastreamento de elegibilidade na seção anterior.

00:14.010 --> 00:19.560
Bem, basicamente, estávamos prontos para iniciar todo o treinamento, você sabe que obtendo nossa contribuição para o nosso alvo, nossas

00:19.560 --> 00:24.600
previsões, em seguida, calculando o último erro entre as previsões e o alvo e, em seguida, fazer a

00:24.600 --> 00:28.420
propagação para trás foi obter uma grade no centro dos pesos de dados.

00:28.470 --> 00:35.460
Então, estávamos prontos para fazer tudo isso, mas desde que queremos calcular a média móvel e 100 etapas que você

00:35.460 --> 00:38.040
conhece para acompanhar a média durante o treinamento.

00:38.160 --> 00:45.060
Bem, antes de fazermos todo esse treinamento, vamos fazer uma aula agora que obteremos essa

00:45.060 --> 00:47.360
média móvel de 100 etapas.

00:47.550 --> 00:49.450
Então, não há preocupações, vamos fazê-lo rapidamente.

00:49.500 --> 00:54.270
Nós faremos classe com três funções, o que faremos, tudo isso e o tutorial único para que possamos

00:54.270 --> 00:54.950
fazê-lo rapidamente.

00:54.960 --> 00:55.890
Nós já fizemos isso.

00:55.890 --> 01:00.680
E, além disso, queremos nos concentrar no treinamento agora porque é o mais importante.

01:00.840 --> 01:04.500
Então, vamos fazer essa classe agora neste único tutorial.

01:04.500 --> 01:10.710
Tudo bem, então vamos apresentar uma nova classe a qual vamos ligar e uma média móvel e depois

01:11.220 --> 01:13.290
vamos com a nossa primeira função.

01:13.290 --> 01:20.490
Então, é claro, a função inata que nunca muda nela e esta e essa função

01:20.490 --> 01:22.140
levará dois argumentos.

01:22.140 --> 01:30.450
O primeiro é o auto para o futuro e o futuro do objeto móvel que corresponderá ao tamanho da

01:30.540 --> 01:34.620
lista das palavras das quais vamos calcular a média.

01:34.620 --> 01:36.850
Então, isso será 100.

01:36.870 --> 01:39.800
Tudo bem, então temos argumentos para a função.

01:39.840 --> 01:42.120
Agora vamos entrar na função.

01:42.120 --> 01:47.460
Agora você sabe o que fazer, temos que inicializar as variáveis ​​específicas do objeto.

01:47.460 --> 01:48.250
E estes são.

01:48.330 --> 01:56.820
Bem primeiro, o primeiro será uma lista de palavras que será a lista contendo as 100 palavras das

01:56.910 --> 01:59.310
quais vamos calcular a média.

01:59.310 --> 02:05.450
Então, neste momento, estamos simplesmente iniciando esta lista com esta lista vazia aqui.

02:05.850 --> 02:13.020
todas as palavras e, em seguida, a segunda variável do nosso futuro objeto será, naturalmente, o tamanho e o

02:13.500 --> 02:19.440
tamanho será igual aos argumentos que entrarão ao criar os futuros objetos móveis em média.

02:19.440 --> 02:20.250
Então, liste

02:20.580 --> 02:22.140
Então, sightseer.

02:22.400 --> 02:29.850
E já estamos prontos para passar para a próxima função, que será a função add e que

02:29.850 --> 02:32.210
irá adicionar as recompensas cumulativas.

02:32.220 --> 02:35.530
Seja cuidadoso, não é a recompensa simples, é a recompensa cumulativa.

02:35.610 --> 02:40.660
E é porque você sabe que estamos fazendo rastreamento de elegibilidade e, portanto, aprendemos cada 10 etapas.

02:40.770 --> 02:44.480
E, portanto, aprender com recompensa cumulativa e não uma recompensa simples.

02:44.700 --> 02:52.830
Então, isso adiciona função que estamos prestes a fazer, adicionará a recompensa cumulativa a essa lista de recompensas.

02:52.830 --> 02:59.370
Então, Jeff, vamos chamar isso de anúncio, é claro, e esta função vai levar dois argumentos.

02:59.370 --> 03:05.070
O primeiro é auto porque vamos usar esta lista de palavras aqui, porque simplesmente vamos

03:05.070 --> 03:08.350
adicionar a recompensa cumulativa a esta lista de palavras.

03:08.490 --> 03:11.650
Então precisamos do eu para conseguir isso sozinho.

03:11.670 --> 03:18.070
E o segundo será a recompensa que representará a recompensa cumulativa.

03:18.570 --> 03:21.810
Tudo bem, então há dois argumentos da função.

03:21.810 --> 03:25.370
Agora vamos entrar na função e vamos definir o que tem a fazer.

03:25.710 --> 03:32.150
Ok, então, simplesmente, a primeira coisa que tem a fazer é sempre que nos acumulamos, queremos um novo.

03:32.190 --> 03:38.460
Você sabe quando nós progredimos nos passos da faca. Bem, o que temos a fazer é adicionar essas palavras

03:38.460 --> 03:39.270
cumulativas à lista.

03:39.270 --> 03:43.650
E é exatamente isso que vamos fazer, vamos escrever uma linha de código que irá

03:43.650 --> 03:49.240
adicionar esta nova recompensa cumulativa que estamos recebendo depois de progredir em dez passos para esta lista de palavras aqui.

03:49.320 --> 03:56.290
E para fazer isso, temos que separar duas condições porque, uma vez que ele estará trabalhando com lotes. Bem, queremos

03:56.340 --> 04:02.430
estar em algumas listas, mas em alguns outros casos, as palavras também podem ser como um elemento único

04:02.430 --> 04:09.840
e a sintaxe para adicionar um elemento a um A lista qual é a lista de palavras aqui não é a mesma

04:09.840 --> 04:13.330
se você está adicionando uma lista ou um único elemento.

04:13.350 --> 04:17.020
Então, precisamos fazer isso uma condição que irá separar esses dois casos.

04:17.190 --> 04:22.800
E vamos começar com o primeiro caso que é o caso quando o que estamos adicionando

04:22.800 --> 04:30.240
a esta lista de palavras é uma lista e, para isso, vamos adicionar é exemplo em parênteses colocamos dois argumentos, o primeiro

04:30.240 --> 04:32.880
é é que somos palavras que estamos adicionando.

04:33.180 --> 04:34.510
Então não estávamos.

04:34.680 --> 04:37.470
E o segundo é LIST.

04:37.620 --> 04:45.050
E, se a lista de palavras da instância significa se as recompensas estão em uma lista.

04:45.060 --> 04:56.280
adicionar essa lista porque, uma vez que esta é uma lista, podemos usar uma simples operação de adição porque podemos alguns tulis para obter as recompensas.

04:57.550 --> 05:05.110
E então, se as recompensas estiverem em uma lista, o que fazemos é muito simples de si

05:05.110 --> 05:09.220
mesmo, que levamos nossa lista de recompensas e vamos

05:09.220 --> 05:13.380
Aqui está uma lista porque isso será chamado para o verdadeiro significado, neste caso.

05:13.380 --> 05:21.160
E assim podemos simplesmente somar esta lista à nossa lista de palavras e, portanto, podemos simplesmente ter

05:21.160 --> 05:24.300
sua lista de recompensas mais recompensas iguais.

05:24.880 --> 05:30.620
E, ao fazê-lo, estamos apenas estendendo a lista por algumas dessas duas listas juntas.

05:31.090 --> 05:31.560
Tudo bem.

05:31.600 --> 05:33.860
E, em seguida, segunda condição.

05:33.860 --> 05:41.470
Então, podemos simplesmente adicionar outra, de modo que, se as recompensas não forem uma lista e, portanto, se for um único elemento,

05:42.130 --> 05:44.260
e o que acontece nesse caso.

05:44.470 --> 05:49.120
Bem, é o mesmo que queremos adicionar duas palavras à nossa lista de palavras.

05:49.420 --> 05:53.810
Mas não podemos usar a sintaxe porque as palavras não serão mais uma lista.

05:53.860 --> 05:55.320
Será um elemento único.

05:55.540 --> 06:00.130
E então, o que precisamos usar é outra sintaxe que é a função de anexar.

06:00.130 --> 06:04.020
Quando você deseja adicionar um único elemento a uma lista, você pode adicionar algo.

06:04.030 --> 06:05.890
Você precisa usar a função de anexar.

06:05.890 --> 06:07.860
E isso é exatamente o que vamos fazer agora.

06:07.890 --> 06:18.550
Vamos pegar a nossa lista de palavras do objeto e colar isso aqui e depois adicionar ponto e

06:18.550 --> 06:20.080
depois vamos primeiro.

06:20.560 --> 06:24.560
E, claro, entre parênteses colocamos os elementos que queremos acrescentar.

06:24.790 --> 06:29.420
E esta é, naturalmente, uma palavra b, mas as palavras nesse caso não serão uma lista.

06:29.500 --> 06:34.880
Será um único elemento, como uma única palavra cumulativa, não em uma lista.

06:34.910 --> 06:39.490
Tudo bem e então queremos fazer isso, mas agora temos que adicionar algo mais.

06:39.490 --> 06:45.310
É o que acontece quando esta lista de palavras obtém mais de 100 elementos.

06:45.580 --> 06:51.760
Bem, nesse caso, o que devemos fazer é excluir o primeiro elemento desta lista de todas as palavras

06:51.940 --> 06:56.440
para garantir que esta lista de palavras sempre contenha mais de 100 elementos.

06:56.440 --> 07:01.330
Então, exatamente como o que fizemos para o carro de condução sul ao fazer

07:01.330 --> 07:11.170
isso, e então, para ter certeza disso, nós vamos adicionar uma condição de tempo especificando que sempre que o comprimento de nossa lista de palavras que é número

07:11.530 --> 07:19.060
de elementos em nosso lista de palavras sempre que este número é maior do que o tamanho desse tamanho, que é

07:19.060 --> 07:23.900
o tamanho que dissemos aqui e que mais tarde será igual a 100.

07:24.070 --> 07:25.390
Quando criamos o objeto.

07:25.540 --> 07:30.250
Bem, assim que o número de elementos desta lista de palavras for maior do que 100.

07:30.370 --> 07:38.760
Bem, o que queremos fazer é excluir os primeiros elementos da nossa lista de palavras que podemos obter, levando o

07:38.860 --> 07:43.300
índice 0 que é o primeiro índice da nossa lista de.

07:43.570 --> 07:51.400
Este é o primeiro elemento da nossa lista de palavras e queremos excluí-la sempre que nossa lista de palavras

07:51.400 --> 07:53.590
contenha mais de 100 elementos.

07:53.590 --> 08:00.100
Então, com isso com este condicional aqui nós nos certificamos de que nossa lista de palavras nunca

08:00.100 --> 08:08.290
contém mais de 100 elementos e, portanto, agora, o que podemos fazer é fazer uma nova função para calcular a média

08:08.290 --> 08:12.490
de nossa lista de palavras que conterá na corrida cem elementos.

08:12.610 --> 08:17.400
E, portanto, calcularemos a média móvel de 100 passos cada vez.

08:18.090 --> 08:23.040
Então, vamos fazer com que esta seja a função que será muito fácil porque existe a função principal

08:23.220 --> 08:27.550
em Python, que é uma função de não-piloto para calcular a média de uma lista.

08:27.690 --> 08:32.820
E então, vamos apresentar a nossa última função aqui, a qual vamos chamar de média

08:32.820 --> 08:38.430
e esta função vai levar um argumento que vai ser a si mesmo, porque vamos usar, é

08:38.430 --> 08:44.360
claro, ainda nossa lista de palavras que é uma variável de nosso objeto para auto e para colorir.

08:44.660 --> 08:51.450
E agora vamos comparar a média e, portanto, diretamente, retornaremos a média, porque podemos obtê-la

08:51.780 --> 08:55.510
com a função média a qual, claro, estamos jogando.

08:55.860 --> 09:01.840
Bem, o que queremos calcular o significado dessa é a nossa lista do que eu acho que ainda copio isso.

09:01.980 --> 09:03.000
Sim, vamos lá.

09:03.210 --> 09:08.430
Então, simplesmente devolvemos o significado da nossa lista de palavras e a média.

09:08.520 --> 09:11.230
Como eu disse, é uma função não tailandesa.

09:11.490 --> 09:16.770
Então, aqui e Anglish, veja essa lista de palavras que significa.

09:16.770 --> 09:21.670
E então nós vamos, temos a nossa média de 100 passos perfeito.

09:21.720 --> 09:24.210
Então, fizemos essa aula de forma muito eficiente.

09:24.210 --> 09:29.060
Agora, obtemos instruções sobre como obter uma média móvel de 100 etapas.

09:29.280 --> 09:36.750
usar um objeto de média móvel ao fazer o treinamento bem, já criamos esse objeto de média móvel.

09:36.750 --> 09:38.640
E uma vez que vamos

09:38.730 --> 09:46.340
E então vamos chamar isso de A e simplesmente e vai ser um objeto e uma classe.

09:46.560 --> 09:55.010
E, como dissemos, queremos que o tamanho seja 100 porque queremos calcular a média móvel em 100 etapas.

09:55.200 --> 09:56.100
Tão perfeito.

09:56.100 --> 09:57.080
Aqui vamos nós.

09:57.120 --> 10:01.830
Agora estamos prontos para treinar nossa IA para finalmente ser inteligente.

10:01.860 --> 10:06.120
Já é hora de este ponto que nossa idade se torne inteligente.

10:06.210 --> 10:07.890
Então eu não posso esperar para treiná-lo.

10:07.920 --> 10:11.260
Vai ser bastante fácil porque é algo que estamos morto.

10:11.400 --> 10:12.660
Mas isso vai ser divertido.

10:12.750 --> 10:18.090
E, além disso, será hora de se divertir ainda mais, porque basicamente nossa idade

10:18.090 --> 10:23.500
ficarei totalmente pronta e construída e também inteligência e, portanto, vamos executar o código.

10:23.700 --> 10:30.540
E então vou jogar Doom e, eventualmente, assistiremos os vídeos de nossa AI AI tocando Doom

10:30.540 --> 10:33.420
e veremos se conseguiu alcançar o colete.

10:33.510 --> 10:34.520
Então eu não posso esperar.

10:34.560 --> 10:35.810
Vamos fazer esse treinamento.

10:35.820 --> 10:37.360
E até então eu.