WEBVTT

00:00.450 --> 00:05.400
Olá e seja bem vindo a este caminho no Torro, agora vamos fazer a função de avanço

00:05.400 --> 00:11.040
que irá transmitir propagar o sinal através de todo o cérebro desde o início com as imagens de entrada até

00:11.130 --> 00:16.860
as saídas que conterão os valores-chave para o ator e o valor de valor que é valor tomado pela função

00:17.040 --> 00:17.950
para o crítico.

00:18.240 --> 00:23.820
Então, será bastante parecido com o que fizemos com o Dume, mas desta vez algo mudará.

00:23.880 --> 00:25.550
A alteração vai mudar isso.

00:25.560 --> 00:27.510
Agora temos uma ilustração no cérebro.

00:27.510 --> 00:32.470
Então, todos nós temos que fazer algo mais para propagar o sinal e ter cuidado com isso.

00:32.850 --> 00:38.280
E a outra coisa menos importante, mas ainda assim as mudanças em relação ao anterior

00:38.280 --> 00:44.220
é que não vamos usar uma função de ativação real, como você conhece a função de ativação

00:44.220 --> 00:48.880
não linear, mas vamos usar o loo que é realmente mais sofisticado função.

00:48.980 --> 00:51.390
Você verá que no passado estamos falando de mentação.

00:51.780 --> 00:55.970
Então, vamos fazer isso, vamos fazer essa função, começamos com uma morte.

00:56.040 --> 00:59.190
Na verdade, é a última função desta classe execrada.

00:59.280 --> 01:06.900
Então, vamos chamar isso de frente como Einstein e esta quarta função vai assumir o objeto, porque

01:06.900 --> 01:09.930
vamos usar os objetos e as entradas.

01:10.170 --> 01:13.520
Tão importante para entender o que serão esses insumos.

01:13.590 --> 01:19.170
Estas não serão apenas as imagens de entrada, essas entradas também conterão os nós ocultos e os

01:19.170 --> 01:20.980
nós das células do mesmo.

01:21.090 --> 01:25.120
Então é por isso que queria destacar que algumas coisas vão mudar agora.

01:25.180 --> 01:30.820
Basicamente, estamos considerando a função direta da Internet e os nós de celular da lista.

01:31.200 --> 01:38.900
E falar sobre eles agora o que vamos fazer é separar essas duas entradas desse argumento ao colocar a

01:38.900 --> 01:41.540
função de frente e como podemos separá-los.

01:41.700 --> 01:46.160
Bem, podemos lembrar um novo Voivode que será as imagens de insumos.

01:46.230 --> 01:55.620
Então, essas são imagens de entrada projetadas e as separamos com o derrube H x e C X, que é um templo dos

01:55.620 --> 01:59.090
estados ocultos e os Estados celulares no Coliseu.

01:59.370 --> 02:04.470
Então, H x outros estados e C X são os estados do Sul.

02:04.540 --> 02:09.580
Tudo bem e isso será igual à entrada que é esse argumento aqui.

02:09.580 --> 02:14.950
Então, agora nós fizemos essa separação e, portanto, podemos começar a propagar o sinal

02:15.220 --> 02:21.400
em todo o cérebro e para fazer isso, vamos conseguir camadas sucessivamente diferentes do primeiro para

02:21.700 --> 02:28.690
o último, usando nossas conexões que são as convoluções da conexão LACMA e A conexão linear aqui as

02:29.020 --> 02:30.300
conexões completas.

02:30.490 --> 02:31.400
Então vamos fazer isso.

02:31.450 --> 02:33.620
Agora, será o mesmo que antes.

02:33.750 --> 02:40.420
Nós vamos conseguir a nossa primeira camada, que vamos chamar X e obter esta primeira camada, precisamos propagar o

02:40.510 --> 02:46.240
sinal das entradas para esta primeira camada e, portanto, precisamos usar a primeira convolução porque é

02:46.240 --> 02:51.770
a primeira convolução que propaga o sinal das imagens de entrada para a primeira camada.

02:52.030 --> 02:58.450
Então, o que vamos fazer agora é copiar isto porque esta é a primeira convolução que tivemos aqui

02:58.450 --> 03:06.100
e aplicamos essa primeira convolução às nossas imagens de entrada que são agora as entradas certas e que obtemos que propaga

03:06.100 --> 03:09.560
o sinal das imagens de entrada para a primeira camada.

03:09.820 --> 03:16.390
Mas agora lembre-se de que precisamos usar uma função de ativação não linear para quebrar a linearidade para

03:16.390 --> 03:23.170
poder aprender as relações não-lineares dentro das imagens e, para isso, vamos usar como dissemos a função de

03:23.500 --> 03:28.050
ativação que estamos prestes a Veja agora mesmo e por contato preso.

03:28.180 --> 03:30.110
Mas antes disso vamos entender.

03:30.130 --> 03:36.430
Então, para obtê-lo, é como se tomássemos o módulo funcional que tem um atalho e,

03:36.490 --> 03:45.790
em seguida, um loop e, em seguida, colocamos tudo isso entre parênteses porque queremos ativar os neurônios de forma não linear.

03:45.880 --> 03:51.160
Esta primeira camada aqui que obtivemos aplicando a primeira convolução nas entradas.

03:51.160 --> 03:55.310
Então, vamos agora para a torunda PI Doug para entender o que é.

03:55.360 --> 03:56.110
Aqui está.

03:56.200 --> 04:00.320
Então, você pode acessá-lo na tocha presa ou cortada.

04:00.340 --> 04:06.940
E, em seguida, que H G e L e, em seguida, você precisa encontrar ativações não-lineares e, em seguida, as funções de ativação

04:06.940 --> 04:08.080
não-linear que você encontrará.

04:08.170 --> 04:14.040
Bem, realmente é o clássico quando sabemos que é apenas um máximo de zero e X você tem o gráfico em mente.

04:14.260 --> 04:17.160
Então você tem seis que é esse.

04:17.160 --> 04:19.350
Então, um pouco mais sofisticado.

04:19.570 --> 04:21.190
E então nós vamos, nós temos uma aparência.

04:21.550 --> 04:26.470
E como você pode ver o azul é um refazer mais um elemento adicional.

04:26.620 --> 04:29.280
Então, é como um realmente mais sofisticado.

04:29.340 --> 04:34.180
E assim é esse o que usamos para ativar não-linearmente os neurônios e as diferentes camadas.

04:34.180 --> 04:39.420
E, a propósito, esta nova função de ativação é chamada exponencial em sua unidade.

04:39.490 --> 04:40.250
Então vamos lá.

04:40.270 --> 04:44.230
Nós aplicamos o elu na primeira camada convolucional.

04:44.470 --> 04:46.300
E agora as coisas vão ser fáceis.

04:46.370 --> 04:52.270
X porque, basicamente, estamos apenas adicionando X agora x é o primeiro convolucional lá.

04:52.270 --> 04:59.440
Vamos prosseguir para a próxima propagação do sinal que é da primeira camada convolucional para a

04:59.470 --> 05:02.190
segunda camada convolucional que chamaremos de

05:02.290 --> 05:07.990
E, ao propagar o sinal da primeira camada convolucional para a próxima, X se tornará a

05:07.990 --> 05:09.190
próxima camada convolucional.

05:09.520 --> 05:15.130
E, para propagar o sinal da primeira camada convolucional para a segunda, não

05:15.220 --> 05:20.490
podemos simplesmente copiar isso e colá-lo aqui e substituir um por dois.

05:20.510 --> 05:27.340
E agora, é claro, a segunda convolução não é aplicada às imagens de entrada, mas a X é a

05:27.340 --> 05:29.530
primeira camada convolucional que está aqui.

05:29.830 --> 05:30.790
Tudo bem perfeito.

05:30.790 --> 05:32.800
Agora chegamos a nossa segunda convolução.

05:33.010 --> 05:38.230
E agora vamos propagar o sinal novamente do segundo convolucional lá para o terceiro.

05:38.230 --> 05:46.000
E, portanto, podemos copiar diretamente isso e colá-lo aqui e substituir dois por três.

05:46.000 --> 05:46.840
Aqui vamos nós.

05:46.990 --> 05:47.900
E o último.

05:47.920 --> 05:53.770
Agora, para propagar o sinal do terceiro convolutivo lá para o quarto e

05:53.770 --> 05:58.770
o último, podemos copiar isso novamente aqui e substituir três por quatro.

05:58.840 --> 05:59.790
Aqui vamos nós.

06:00.220 --> 06:01.870
Então vamos recapitular.

06:01.870 --> 06:03.310
Começamos com as nossas entradas.

06:03.460 --> 06:07.170
Aplicamos a primeira convolução para obter o primeiro convolutivo lá.

06:07.360 --> 06:12.130
Em seguida, aplicamos a segunda convolução na primeira camada de convolução para obter a segunda

06:12.130 --> 06:12.850
camada convolucional.

06:12.970 --> 06:17.830
Em seguida, aplicamos esta terceira convolução ao segundo convolucional lá para obter a terceira

06:17.830 --> 06:18.510
camada convolucional.

06:18.550 --> 06:24.650
E finalmente aplicamos a quarta convolução ao terceiro convolucional lá para obter o quarto convolucional

06:24.650 --> 06:25.180
lá.

06:25.510 --> 06:29.900
E é assim que o sinal se propaga pelos olhos do olho.

06:30.130 --> 06:35.620
Então, vamos lá, temos agora o sinal de saída após as quatro convoluções e agora

06:35.620 --> 06:40.790
sabemos o que fazer, precisamos expandir esse sinal de saída inteiro em um vetor unidimensional.

06:40.900 --> 06:42.640
Esse é o passo aplanante.

06:42.880 --> 06:45.440
Então, vamos atualizar x x novamente.

06:45.490 --> 06:49.010
Agora, isso se tornará este vetor unidimensional achatado.

06:49.230 --> 06:57.070
E para fazer isso, é o mesmo que precisamos tomar X, que é até agora a quarta camada convolucional X, mas

06:57.520 --> 07:05.660
depois usamos uma função de exibição e primeiro colocamos menos um para dizer que queremos vetor unidimensional e, em seguida, como um

07:05.660 --> 07:11.810
segundo argumento que precisamos para colocar o número de elementos no vetor e isso é lembrar três

07:11.880 --> 07:13.560
duas vezes três vezes três.

07:13.670 --> 07:20.270
E, portanto, podemos colocar aqui 32 vezes três vezes três.

07:20.270 --> 07:20.720
Aqui vamos nós.

07:20.720 --> 07:24.570
Agora, temos nosso vetor achatado e o passo de achatamento é feito.

07:24.680 --> 07:25.580
Perfeito.

07:25.580 --> 07:28.030
Agora vamos cuidar da parte LCN.

07:28.280 --> 07:33.030
Então, como você entendeu, o LSD toma como entrada o vetor achatado.

07:33.200 --> 07:37.190
Este vetor unidimensional de três duas vezes três vezes três elementos.

07:37.190 --> 07:40.310
Então, já está pronto e bem preparado para o icn.

07:40.320 --> 07:49.070
A equipe agora está pronta para levar este vetor Flaten como entradas e, portanto, podemos levar nossa LACMA e entradas como

07:49.190 --> 07:52.010
o primeiro argumento do argumento está pronto.

07:52.010 --> 07:55.960
FLATOW E vetor que é este raio x aqui que acabamos de expandir.

07:56.270 --> 08:00.810
Mas também e é aí que o problema entra em jogo.

08:00.890 --> 08:04.540
Precisamos colocar H x e z x.

08:04.550 --> 08:10.820
E podemos usar ha-Satanás ver X aqui porque fizemos essas separações dos argumentos de entrada

08:11.060 --> 08:12.980
originais da função de avanço.

08:12.980 --> 08:20.460
Então, LACMA X o vetor de saída das platinas após as quatro convoluções e todas as escondidas na nota da célula.

08:20.480 --> 08:21.390
Então vamos lá.

08:21.440 --> 08:27.530
Então, não devemos esquecer o eu porque o LSD é uma variável ou função, portanto, uma variável

08:27.530 --> 08:35.210
anexada ao próprio objeto e um CM e isso retornará às saídas um total de duas saídas, que serão os nós

08:35.210 --> 08:37.850
de saída e os sons de saída.

08:37.880 --> 08:42.250
Então, na verdade, é tópico e, portanto, podemos atualizar H.

08:42.260 --> 08:48.890
X y e z x os nós das células porque é exatamente essa a saída deste NCM aqui.

08:50.030 --> 08:50.500
Ótimo.

08:50.510 --> 08:52.750
Então, quase terminamos agora.

08:52.790 --> 08:58.850
Agora que temos as saídas da ilustração, precisamos obter o resultado útil porque, na verdade,

08:58.850 --> 09:05.570
apenas as notas ocultas são úteis e, portanto, vamos obtê-lo até então X novamente e X será

09:05.570 --> 09:12.490
agora igual ao atax o primeiro elemento da amostra de saída dos EUA e um X é igual.

09:12.680 --> 09:14.270
E estamos quase finalizados.

09:14.270 --> 09:18.590
Lembre-se de que temos dois cérebros um cérebro para o ator em uma sala para o crítico.

09:18.860 --> 09:24.380
E, portanto, temos que produzir sinais para retornar o sinal de saída do ator e o sinal de

09:24.380 --> 09:25.480
saída do crítico.

09:25.580 --> 09:30.730
E, portanto, agora o que vamos fazer é retornar esses dois sinais de saída e como podemos fazer isso.

09:30.830 --> 09:32.010
Bem, isso é muito fácil.

09:32.030 --> 09:38.690
Nós simplesmente precisamos levar nossas conexões lineares, mas separadamente, isso é uma conexão linear do crítico e que

09:38.770 --> 09:40.740
a conexão completa do ator.

09:41.180 --> 09:47.870
X que é uma saída útil da LACMA e isso será tudo o que será o sinal de saída.

09:47.870 --> 09:50.470
E aplicamos cada uma dessas conexões à saída

09:50.480 --> 09:50.990
Então vamos lá.

09:50.990 --> 09:51.840
Vamos fazer isso.

09:51.900 --> 09:59.660
Nós primeiro nos levamos a si mesmos ou a um objeto, então nós conseguimos a conexão linear do crítico que é

09:59.690 --> 10:08.090
crítico e este colinear que aplicamos a X o sinal de saída do CM e então o mesmo nós nos levamos de novo

10:08.090 --> 10:15.290
então e depois tomamos a conexão linear do ator que é ator e é colinear são o mesmo que aplicamos

10:15.290 --> 10:16.200
para x.

10:16.310 --> 10:19.580
Lá vamos, então é a principal coisa que precisamos.

10:19.710 --> 10:26.040
Mas então, também vamos retornar o topo do Ajax para um nó e ver o X para vender o nó, porque

10:26.040 --> 10:29.490
nós os usaremos mais tarde e o olhar retro do LCN.

10:29.520 --> 10:30.430
Tudo bem perfeito.

10:30.480 --> 10:32.960
Então, acabamos com o cérebro.

10:32.970 --> 10:38.040
Ou devo dizer o cérebro porque realmente fizemos dois cérebros um para o ator e um crítico.

10:38.250 --> 10:41.990
Então, parabéns por fazer o oitavo com os cérebros.

10:42.180 --> 10:47.940
Espero que não tenha sido muito irresistível combinar na CNN e em Anniston, mas pelo menos a boa notícia é

10:47.940 --> 10:51.190
que estamos realmente trabalhando com o modelo melhor e mais poderoso.

10:51.300 --> 10:53.010
Então vamos lá.

10:53.010 --> 10:55.950
Na verdade, estamos com esse primeiro modelo de família.

10:56.010 --> 10:56.810
Y.

10:56.880 --> 11:02.040
E assim, nos próximos dois anos, vamos cuidar do otimizador porque vamos fazer

11:02.190 --> 11:03.300
um otimizador separado.

11:03.300 --> 11:08.850
Não vamos cortar cada linha de código porque muito disso vem dos trabalhos de pesquisa

11:08.850 --> 11:10.520
e isso é muito específico.

11:10.530 --> 11:16.470
função de trem para criar qual será uma função enorme e que contém o algoritmo que nós Vejo.

11:16.470 --> 11:22.410
E se nós entramos nos detalhes profundos sobre o que está acontecendo com esse otimizador, isso pode

11:22.410 --> 11:26.890
ser um pouco demais para o que acontecerá depois porque ainda temos a

11:27.030 --> 11:29.240
Então confie em mim, você quer manter energia para isso.

11:29.310 --> 11:32.300
E, portanto, não passaremos muito tempo nisso.

11:32.490 --> 11:37.830
Mas ainda vou expandir o código e você entenderá toda a idéia por trás dessa otimização.

11:38.190 --> 11:44.740
Então fique feliz em fazer essa classe de atividade e eu vou ver você no próximo otimizador Statoil 290.

11:44.760 --> 11:46.140
Até então, aprecie I.