WEBVTT

00:01.850 --> 00:07.340
Olá e bem-vindo de volta ao curso em deplorarmos hoje vamos terminar com a propagação traseira.

00:07.340 --> 00:11.520
Tudo bem, então, você conhece praticamente tudo o que precisamos saber sobre o

00:11.520 --> 00:17.990
que acontece no seu tudo que sabemos que existe um processo chamado propagação direta, onde a informação é inserida na

00:17.990 --> 00:24.620
camada de entrada e, em seguida, é propagada para a frente para obter nossos chapéus brancos nossos valores de saída e,

00:24.620 --> 00:29.240
em seguida, comparamos esses com os valores reais que temos em nosso conjunto de treinamento.

00:29.240 --> 00:36.110
E então calculamos os erros, então os erros são propagados novamente através da rede na

00:36.110 --> 00:41.570
direção oposta e isso nos permite treinar a rede ajustando os pesos.

00:41.660 --> 00:49.670
avançado conduzido por uma matemática muito interessante e sofisticada que nos permite ajustar os pesos.

00:49.670 --> 00:58.890
Portanto, a única coisa importante para lembrar aqui é que a propagação de volta é um algoritmo

00:59.030 --> 01:02.540
Todos eles, ao mesmo tempo, todos os pesos são ajustados simultaneamente.

01:02.540 --> 01:08.990
Então, se estivéssemos fazendo isso manualmente ou se chegarmos a um algoritmo de tipo muito diferente do que,

01:08.990 --> 01:14.150
mesmo se calculássemos o erro e depois estivéssemos tentando entender o efeito de cada um

01:14.150 --> 01:21.040
dos pesos no erro que teríamos de alguma forma ajuste cada um dos pesos independentemente de forma independente ou individual.

01:22.000 --> 01:29.170
A enorme vantagem do retrocesso e é uma coisa importante a lembrar é que durante

01:29.170 --> 01:35.910
o processo de propagação traseira, simplesmente por causa do modo como o algoritmo é estruturado.

01:36.850 --> 01:43.990
então você basicamente sabe qual parte do erro de cada um dos seus pesos na rede neural é responsável.

01:43.990 --> 01:47.400
Você pode ajustar todo o caminho ao mesmo tempo,

01:47.450 --> 01:54.220
Agora, esse é o principal princípio subjacente fundamental da propagação traseira.

01:54.220 --> 02:02.650
E foi por isso que ele pegou tão rapidamente na década de 1980 e este foi um grande avanço.

02:02.770 --> 02:08.890
E se você quiser saber mais sobre isso e como exatamente a matemática funciona em segundo plano, um

02:09.190 --> 02:14.800
bom artigo que já mencionamos é que as redes neurais e o aprendizado profundo são realmente

02:14.800 --> 02:16.640
um livro de Michael Nielsen.

02:16.720 --> 02:23.610
Você encontrará as matemáticas escritas e isso ajudará você a entender como exatamente isso é possível.

02:23.650 --> 02:30.550
se, do ponto de vista da intuição, a parte importante é lembrar que é isso que o atraso faz.

02:31.240 --> 02:33.310
Mas, por enquanto, para nossos propósitos,

02:33.310 --> 02:36.750
Ele ajusta todos os pesos ao mesmo tempo.

02:36.940 --> 02:43.300
E agora vamos simplesmente embrulhar tudo com um passo a passo do que acontece no

02:43.300 --> 02:45.370
treinamento de uma rede neural.

02:45.370 --> 02:51.000
Tudo bem, então, passo um, inicializamos aleatoriamente os pesos para números pequenos perto de zero, mas não zero.

02:51.010 --> 02:56.830
Nós realmente não nos concentramos na inicialização de pesos durante os tutoriais de intuição, mas então

02:56.830 --> 03:02.610
temos que começar em algum lugar e eles são inicializados com valores aleatórios perto de zero.

03:02.620 --> 03:09.730
através do processo de propagação por propagação, esses pesos são ajustados até o erro ser minimizado.

03:09.730 --> 03:11.690
E a partir daí,

03:11.970 --> 03:13.550
Portanto, a função de custo é minimizada.

03:13.820 --> 03:19.330
Então o passo dois insere a primeira observação de todos os seus conjuntos de dados para a primeira linha na

03:19.510 --> 03:21.440
entrada Lehre cada recurso é uma entrada.

03:21.440 --> 03:27.610
Então, basicamente, pegue os pentes e coloque-os nos nós de entrada separadamente para propagação da esquerda para a

03:27.610 --> 03:27.910
direita.

03:27.910 --> 03:32.620
nossa neurona de visão. A ativação é limitada pelos pesos em que os

03:32.620 --> 03:39.150
pesos determinam basicamente a importância de cada ativação de neurônios, então propagam a ativação até obter o resultado.

03:39.160 --> 03:43.100
Os neurônios são ativados de uma maneira que eles escolhem em

03:43.150 --> 03:43.850
Nesse caso.

03:43.990 --> 03:46.640
Então, basicamente, você se propaga da esquerda para a direita.

03:46.690 --> 03:50.110
Você vai todo o caminho até chegar e você obtém o seu chapéu.

03:50.320 --> 03:52.720
Em seguida, compare o resultado ao resultado real.

03:52.750 --> 03:58.140
Meça o erro gerado e, então, faça o retrocesso da direita para a esquerda, o ar é

03:58.150 --> 03:58.620
bipolar novamente.

03:58.630 --> 04:02.080
Atualize os pesos de acordo com o quanto eles são responsáveis ​​pelo erro.

04:02.260 --> 04:08.500
Mais uma vez, você pode calcular isso devido à forma como o algoritmo de perturbação de propagação

04:08.500 --> 04:13.750
posterior está estruturado, a taxa de aprendizado determina por quanto melhoramos a taxa de

04:13.990 --> 04:17.710
aprendizado como parâmetro que você pode controlar em sua rede neural.

04:17.710 --> 04:23.110
Passo 6 repita os passos 1 2 5 e atualize os pesos após cada observação.

04:23.320 --> 04:30.670
Isso é chamado de aprendizagem de reforço e, em nosso caso, foi descendência de gradiente estocástica ou repita os passos 1

04:30.670 --> 04:31.490
a 5.

04:31.510 --> 04:37.840
de gradiente completo ou um emblema verde Nissan ou uma mini descida gradiente lida e um passo sete, quando

04:37.870 --> 04:43.150
todo o trem passou por uma rede neural artificial que faz uma época refazer mais épocas.

04:43.150 --> 04:49.030
Mas dessa forma, é só depois de um lote de observações ou aprendendo por lotes, seja uma descida

04:49.040 --> 04:55.090
Então, basicamente, apenas continue fazendo isso e fazendo isso e fazendo isso e permitir que sua

04:55.120 --> 05:02.510
rede neural se treine melhor e melhor e melhor e ajuste-se constantemente enquanto você minimiza a função de custo.

05:02.740 --> 05:04.330
Então vamos lá.

05:04.420 --> 05:09.770
Essas são as etapas que você precisa tomar para construir suas redes neurais artificiais e treiná-las.

05:10.030 --> 05:16.060
E estes são os passos que você vai tomar até eu almoçar nos tutoriais práticos.

05:16.120 --> 05:19.520
Desejo-lhe a melhor sorte e espero vê-lo na próxima vez.

05:19.540 --> 05:21.280
Até então, aproveite a aprendizagem.