WEBVTT

00:00.360 --> 00:04.740
Olá e bem-vindo ao nível final do desafio automóvel auto-dirigido.

00:04.740 --> 00:11.310
Então, desta vez, meu objetivo será vencer o carro auto-dirigido não o nível quatro porque eu

00:11.310 --> 00:18.330
quero desafiá-lo em melhorar as curvas melhorando a IA ou talvez melhorando a estratégia para que você

00:18.330 --> 00:20.010
possa vencer esse desafio sozinho.

00:20.250 --> 00:28.240
Então eu vou fazer uma estrada altamente complexa que ainda vai do aeroporto para o centro da cidade, mas talvez seja

00:28.260 --> 00:31.050
muito complicado para o carro encontrar o caminho.

00:31.320 --> 00:36.190
Então esse será o meu desafio para que possamos nos divertir com a tarefa desafiadora.

00:36.540 --> 00:41.000
Então, vamos fazer isso, vamos abordar esse nível.

00:41.190 --> 00:47.520
Então, vamos selecionar tudo, então vamos carregar o cérebro e lá vamos nós.

00:47.520 --> 00:51.930
Agora, com as viagens de ida e volta entre o aeroporto e o centro da cidade.

00:51.930 --> 00:57.220
Então vai demorar algum tempo, então eu vou colocar alguma música e aqui vamos com a estrada.

01:32.480 --> 01:33.400
E nós vamos lá.

01:33.400 --> 01:34.480
Aqui está a estrada.

01:34.550 --> 01:38.170
E como você pode ver o carro parece ter muitos problemas.

01:38.210 --> 01:39.940
Então é exatamente isso que eu queria.

01:40.160 --> 01:45.590
Você sabe fazer essas pequenas viagens na mesma parte da estrada.

01:45.710 --> 01:46.700
Isso é um problema.

01:46.700 --> 01:50.570
Não encontra o caminho agora para o centro da cidade.

01:50.570 --> 01:52.340
Então, como podemos corrigir isso.

01:52.370 --> 01:58.070
Podemos precisar mudar a estratégia ou precisamos mudar os parâmetros das redes neurais

01:58.130 --> 02:01.980
que mudaram a sinopse no cérebro do carro.

02:02.030 --> 02:10.940
Precisamos fazer algo com as palavras que você conhece, talvez obtenha uma palavra pior quando não está encontrando o objetivo, como

02:10.940 --> 02:12.730
é o caso agora.

02:12.750 --> 02:22.250
não sei que para você descobrir como você pode ver as recompensas não é muito grave quando não está encontrando o objetivo.

02:22.250 --> 02:23.340
Então, eu

02:23.410 --> 02:26.370
Você sabe que não está se aproximando do objetivo.

02:26.420 --> 02:29.100
A recompensa é apenas menos 0. 2.

02:29.250 --> 02:31.910
Essa não é uma grave recompensa ruim.

02:31.970 --> 02:39.300
Você poderia tentar diminuir a recompensa ainda mais como definir uma recompensa igual a menos 0. 5.

02:39.530 --> 02:40.590
Talvez isso funcione.

02:40.700 --> 02:43.730
E apenas atirando algumas sugestões para ajudá-lo.

02:43.780 --> 02:47.080
Então, essa é uma mudança que você pode fazer com a palavra estratégia.

02:47.330 --> 02:53.750
E, claro, pode fazer algumas outras mudanças com sua nova rede.

02:53.890 --> 03:00.580
Então, você sabe que nesta seção criamos a arquitetura da nova rede que escolhemos para ter 30

03:00.580 --> 03:02.950
neurônios escondidos em uma camada oculta.

03:03.190 --> 03:10.030
Talvez você possa tentar mudar a arquitetura tentando algumas camadas mais ou alguns neurônios mais escondidos que

03:10.030 --> 03:11.070
eu não conheço.

03:11.140 --> 03:13.700
Essa é outra sugestão de melhoria.

03:13.750 --> 03:20.290
E então você também pode tentar mudar algo em um algoritmo de aprendizado profundo ou algo que

03:20.290 --> 03:24.100
você pode seguir no curso e descobrir os outros algoritmos.

03:24.100 --> 03:28.870
Talvez haja outro que gerencie lidar com essa situação.

03:28.870 --> 03:30.140
Então boa sorte.

03:30.160 --> 03:35.170
Estou ansioso para ver suas soluções tentar desenhar a mesma estrada que é perfeita.

03:35.170 --> 03:38.350
Esse é realmente um enigma bastante emocionante.

03:38.350 --> 03:44.520
E se você quiser que eu lhe dê uma dica ou se você quiser que eu explique rapidamente qual é o problema.

03:44.740 --> 03:47.100
Bem, você pode ver isso aqui.

03:47.140 --> 03:52.450
Quando ele atinge esse ponto, ele está voltando e é porque quando está chegando a esse ponto está

03:52.450 --> 03:55.800
ficando muito longe do objetivo que agora é o centro da cidade.

03:55.820 --> 04:02.410
Você sabe quando está chegando a esse ponto se vai mais longe. Bem, ele vai mais longe do objetivo.

04:02.410 --> 04:04.630
Então é por isso que está voltando aqui.

04:04.960 --> 04:12.400
E então você tem que mudar algo no código de algo na estratégia para talvez puni-lo menos quando está

04:12.550 --> 04:14.660
ficando mais longe do objetivo.

04:14.680 --> 04:16.100
Talvez essa seja a solução.

04:16.180 --> 04:18.040
Estou apenas atirando algumas sugestões.

04:18.160 --> 04:22.540
Eu não quero lhe dar uma solução muito rápida, mas isso seria um bom exercício.

04:22.660 --> 04:27.880
geralmente é um problema que pode ser combatido pelos engenheiros quando eles estão fazendo um carro auto-dirigido.

04:27.880 --> 04:28.420
E isso

04:28.660 --> 04:30.870
Mas, de qualquer forma, acho que é um enigma muito legal.

04:30.940 --> 04:37.690
Então espero que você se divirta e antes de resolver esta lição de casa talvez você possa fazer outra lição

04:37.720 --> 04:42.050
de casa muito eficiente que seria simplesmente tentar implementar tudo isso de novo.

04:42.250 --> 04:47.140
Você sabe que acaba de implementar exatamente o mesmo que será uma prática excelente, porque

04:47.140 --> 04:53.080
até agora você apenas ouvi minhas explicações, mas há uma enorme diferença entre ouvir algo e tentar fazer

04:53.080 --> 04:54.120
a coisa sozinho.

04:54.280 --> 04:56.690
Oh, você viu o que aconteceu?

04:56.830 --> 04:57.960
Acabou de encontrar o caminho.

04:58.060 --> 04:59.090
Isso é incrível.

04:59.380 --> 05:01.780
É divertido como ele saiu disso.

05:01.810 --> 05:06.540
Mas tenho certeza de que há uma estratégia melhor para sair dele de forma mais eficiente.

05:06.840 --> 05:08.220
E agora parece ser muito bom.

05:08.230 --> 05:11.670
Talvez eu esteja falando muito rápido, talvez ele vá resolver isso.

05:11.680 --> 05:11.980
Não.

05:11.980 --> 05:12.630
Aqui vamos nós.

05:12.760 --> 05:14.170
Está ficando preso aqui novamente.

05:14.200 --> 05:16.210
Isso é muito desafiador para o carro certo.

05:16.510 --> 05:18.630
Mas tenho certeza de que isso pode ser resolvido.

05:18.780 --> 05:19.870
Essa é sua vez.

05:19.870 --> 05:23.750
Então, boa sorte e por favor me avise sobre suas soluções.

05:24.000 --> 05:25.540
E então eu.
