WEBVTT

00:00.630 --> 00:03.850
Olá e bem-vindo de volta ao curso sobre inteligência artificial.

00:03.990 --> 00:09.260
No tutorial de hoje, estamos iniciando a seção sobre aprendizado legal convolucional profundo.

00:09.420 --> 00:11.010
Então vamos dar uma olhada no que se trata.

00:11.010 --> 00:14.040
Anteriormente, falamos sobre aprendizado legal profundo.

00:14.040 --> 00:21.270
Então, tivemos um ambiente em que um agente e nós tivemos um vetor descrevendo esse ambiente que foi alimentado

00:21.270 --> 00:26.310
em uma rede neural e, no final, obtivemos os valores q como nossas saídas.

00:26.310 --> 00:29.970
E, claro, descobrimos como restringir a parte de aprendizagem.

00:29.970 --> 00:34.650
Descobrimos como as ações são decididas com base em esses valores que são uma parte de ação.

00:34.650 --> 00:42.380
E falamos sobre políticas de seleção de ação e coisas diferentes sobre o aprendizado profundo.

00:42.420 --> 00:51.240
Mas aqui o conceito-chave para tudo isso é como podemos obter isso do ambiente atual e

00:51.240 --> 00:54.450
dos estados para a rede neural.

00:54.480 --> 00:56.190
Bem, a transição está aqui.

00:56.220 --> 01:02.250
Os vetores de entrada para a entrada Lehre de nossa rede neural e é um vetor.

01:02.250 --> 01:06.570
Então, o que estamos a olhar é OK, então, estamos realmente avançando na curva.

01:06.600 --> 01:08.830
Esse não é o termo correto, não estamos olhando para nada.

01:08.940 --> 01:12.330
O agente basicamente possui essa informação.

01:12.330 --> 01:18.490
Então, o ambiente está analisando esta informação dizendo OK, você é o agente que você está atualmente neste

01:18.560 --> 01:26.160
estado é descrito pelo setor neste exemplo simplificado, é descrito por este vetor X-1 de 1 x 2 de 2 para que suas

01:26.160 --> 01:31.410
coordenadas sejam 1 2 e esse é todo o seu estado em um ambiente mais complexo.

01:31.410 --> 01:37.920
A afirmação e todas as outras coisas que o agente pode observar, mas o ponto aqui é que é possed

01:37.920 --> 01:39.040
como um vetor.

01:39.240 --> 01:45.750
E o que é que isso não acontece na vida real na vida real, exceto nos sistemas de GPS e outras

01:45.780 --> 01:46.470
coisas assim.

01:46.530 --> 01:51.830
Mas na vida real, o que usamos a maior parte do tempo, usamos nossos sentidos, usamos nossos olhos mesmo no GPS.

01:51.930 --> 01:53.670
Não está incorporado ao nosso cérebro.

01:53.670 --> 01:56.420
Não nos diz as coordenadas através do nosso cérebro.

01:56.430 --> 02:02.880
Então, nós ainda estamos usando nossos olhos para olhar para o GPS e entender o que está acontecendo lá.

02:02.910 --> 02:09.310
E isso é uma espécie de trapaça para a AI poder obter informações sobre o meio ambiente como um

02:09.310 --> 02:09.620
vetor.

02:09.620 --> 02:12.030
É muito simples, não é assim que funciona na vida real.

02:12.030 --> 02:17.040
Não é assim que nós, como seres humanos, operamos e, em última análise, queremos criar inteligência

02:17.340 --> 02:23.310
artificial que possa operar de forma semelhante aos humanos, que é como pode assumir os mesmos desafios que os humanos.

02:23.320 --> 02:28.740
E, assim, no mundo humano, não temos que não possamos ter essas coordenadas ou outros tipos de

02:28.740 --> 02:33.870
vetores que são passados ​​para nós que explicam o estado em que estamos nesse meio ambiente.

02:33.870 --> 02:37.350
Então, vamos ter que remover isso para torná-lo mais realista.

02:37.410 --> 02:42.180
E então, o que podemos substituí-lo pelo que vemos ou o que fazemos como humano para obter informações.

02:42.180 --> 02:46.860
Bem, na maioria das vezes, vemos, claro, todos os nossos sentidos, mas a maioria das

02:46.860 --> 02:51.300
informações que estamos recebendo sobre o mundo ao nosso redor vem através da nossa visão.

02:51.510 --> 02:59.340
E é por isso que vamos mudar essa pequena flecha que tínhamos em toda uma rede

02:59.340 --> 03:00.090
neural convolutiva.

03:00.090 --> 03:02.700
Então, isso é do nosso Onix.

03:02.700 --> 03:08.400
Numero dois, temos a convulsão de Larry e é por isso que é importante estar bastante à vontade com as redes neurais

03:08.460 --> 03:13.290
condicionais de evolução e como isso funciona é você, se você fez uma relação sexual ODP e você

03:13.350 --> 03:14.910
deveria se sentir confortável com isso.

03:14.930 --> 03:20.490
Ou você pode dar uma olhada no próximo número dois, temos alguns tutoriais de intuição muito bons lá.

03:20.670 --> 03:26.160
Então, aqui temos a operação convolucional que acontece, então, na verdade, estaremos olhando isso

03:26.160 --> 03:27.330
como uma imagem.

03:27.330 --> 03:31.350
Então, esta é uma imagem do ambiente Net.

03:31.350 --> 03:33.990
E então, o agente está realmente olhando para o meio ambiente.

03:33.990 --> 03:39.870
Então, neste caso, não é que ele é como olhar de dentro, ele é como se estivesse assim.

03:39.930 --> 03:44.710
Digamos que ele está jogando isso em um computador e ele pode ver esse ambiente e, portanto, ele

03:44.760 --> 03:48.480
pode ver como onde esse personagem que representa o agente é na verdade é.

03:48.480 --> 03:53.340
Você pode ver seu todo em viral ou o que um ser humano veria se for um labirinto real e o humano veria

03:53.340 --> 03:54.270
o labirinto de dentro.

03:54.270 --> 03:56.480
E assim o agente deve poder exatamente o mesmo.

03:56.700 --> 04:03.000
mais sobre essas diferentes partes de uma rede neural de convolução em anexo e, em seguida, oficiais achatados.

04:03.030 --> 04:10.140
Então, o que ele diz é feito passa por uma armadilha de agitação, você é um idiota que puxa uma perna,

04:10.140 --> 04:12.680
lá está aplanando novamente, você pode descobrir

04:12.690 --> 04:19.950
Então, temos entradas que entram na rede neural e esta é uma maneira mais realista porque o agente

04:19.950 --> 04:29.010
tem que usar seus sites e / ou processar imagens que o ambiente está fornecendo ao agente, assim como um ser humano

04:29.400 --> 04:31.590
seria o processamento de imagens.

04:31.590 --> 04:37.410
E a beleza disso não é apenas que é mais realista e é mais como uma tonalidade.

04:37.410 --> 04:43.280
A idade é, na verdade, mais como um ser humano, mas nos permite processar ambientes muito mais complexos.

04:43.380 --> 04:49.050
a inteligência artificial a qualquer ambiente que, como seres humanos, tenha uma visão de e é.

04:49.050 --> 04:55.980
Por exemplo, é assim que podemos jogar Doom ou outros jogos como esse, em vez de apenas obter

04:56.080 --> 05:02.230
um vetor de informação que, como alguém, teria criado para nós nesse meio ambiente, podemos conectar

05:02.430 --> 05:08.280
Como um ser humano quando você está jogando este jogo, você pode ver exatamente essa imagem e é

05:08.760 --> 05:12.450
exatamente isso que a rede neural artificial ou o agente veriam agora.

05:12.540 --> 05:17.580
Então, nesta parte do curso, quando você for investigar os Tournelles práticos, o agente verá realmente

05:17.580 --> 05:22.890
essa imagem exata, verá os pixels, ele obterá essa imagem exata, cheia dos pixels dessa pessoa,

05:22.890 --> 05:28.410
com isso nós fomos Com este rosto com esta porcentagem com tudo exatamente o que vemos aqui,

05:28.410 --> 05:30.710
é exatamente o que o agente verá.

05:30.870 --> 05:37.470
Então, terá que dissecar isso através de puxar engorda e depois entrará em uma rede neural.

05:37.650 --> 05:42.150
E é inútil dizer que as redes neurais realmente são muito mais complexas do que isso, então vamos substituí-lo

05:42.150 --> 05:42.780
por algo assim.

05:42.780 --> 05:44.480
Isso não é muito mais complexo.

05:44.520 --> 05:49.350
Isso parece um pouco mais complexo, mas, na realidade, as redes neurais estão trabalhando e

05:49.380 --> 05:54.140
criando, se você for bastante interessante e vai ser muito mais complexo do que isso.

05:54.150 --> 05:59.910
Mas, como você pode ver aqui, mesmo que você tenha apenas cinco insumos e duas coisas se tornem muito mais

05:59.970 --> 06:04.380
complexas e aqui você pode ver que temos muitas outras ações que o agente pode tomar.

06:04.380 --> 06:10.850
Então, no jogo da doom, vire à esquerda e à direita, olhe para baixo, procure o recarregamento do disco de Ron.

06:10.890 --> 06:16.290
Ou você sabe que todas as ações diferentes que são possíveis em primeira pessoa gostam de fazer.

06:16.290 --> 06:19.430
E, além disso, não precisa ser o que puder.

06:19.430 --> 06:23.190
Você pode tocar nesse agente para outro tipo de jogo.

06:23.190 --> 06:29.940
Essa é a beleza disso, e então percebe que agora pode operar qualquer tipo de ambiente ao qual

06:29.940 --> 06:34.260
você o anexa porque, enquanto existe uma representação visual do ambiente desse

06:34.680 --> 06:39.940
ambiente, já possui toda a infraestrutura, toda a estrutura está pronta para processar aquele.

06:39.960 --> 06:43.980
Então, é disso que se trata a aprendizagem CUCLE convolucional profunda.

06:43.980 --> 06:51.120
Então, estamos levando isso até o próximo passo, estamos adicionando convoluções em Lares, ou convolucional, em nosso

06:51.120 --> 06:58.980
cérebro de agentes agora e estamos tornando isso ainda mais complexo e, portanto, podemos nos entediar com a capacidade

06:58.980 --> 07:01.260
de resolver ainda mais complexo desafios.

07:01.410 --> 07:06.720
Então, espero que você esteja muito entusiasmado com isso vai estar em uma seção épica e vamos criar

07:06.720 --> 07:10.460
algumas coisas incríveis e não posso esperar para te ver nesse próximo tutorial.

07:10.480 --> 07:12.130
E até então, desfrute da AI.