WEBVTT

00:00.450 --> 00:03.210
Hola y bienvenidos al curso de inteligencia artificial.

00:03.240 --> 00:08.220
En la sección de hoy abordamos el tema de un profundo aprendizaje de Q.

00:08.250 --> 00:11.200
Entonces veamos cómo vamos a atacar esto en esta sección.

00:11.220 --> 00:17.280
Aprenderemos una intuición de aprendizaje profundo del lado del aprendizaje de las cosas, de modo que profundicemos en el aprendizaje profundo separado, la

00:17.750 --> 00:20.840
intuición subyacente en dos partes para el aprendizaje y la actuación.

00:20.850 --> 00:22.620
Y vamos a tener que dar detalles sobre eso.

00:22.620 --> 00:28.290
Primero que todo, comprenda cómo las redes neuronales realmente aprenden y cómo actualizan sus pesos en función

00:28.290 --> 00:34.350
de lo que les estamos alimentando y cómo funciona todo el concepto de aprendizaje o cómo vamos a tomar

00:34.350 --> 00:40.140
conceptos de diferencia temporal o rediscuss y aprendizaje simple. y aplicarlos en el aprendizaje profundo y luego vamos

00:40.530 --> 00:46.550
a hablar sobre cómo el algoritmo de aprendizaje profundo realmente decide qué acción tomar en qué estados vamos

00:46.560 --> 00:52.530
a hablar sobre la experiencia de la repetición una adición muy importante además del aprendizaje profundo que en

00:53.100 --> 00:57.420
realidad permite profundizar aprenderá a trabajar correctamente y verá por qué es importante

00:57.420 --> 00:58.100
en ese tutorial.

00:58.350 --> 01:02.350
Y luego vamos a hablar sobre las políticas de selección de acción.

01:02.470 --> 01:11.190
Vamos a hablar sobre cómo los agentes que ganan la profundidad pueden combinar la exploración con la explotación.

01:11.190 --> 01:15.960
pueden usar ese enfoque, pero también deben explorarlo para que no se estanquen en un máximo local.

01:15.960 --> 01:18.900
Entonces, una vez que encuentran algo que sea un buen enfoque,

01:18.900 --> 01:24.660
Y una cosa más que quería mencionar sobre la sección es que es muy beneficiosa

01:24.660 --> 01:28.050
si observas una x número de redes neuronales artificiales.

01:28.050 --> 01:33.570
Entonces, si vas y exploras todos esos temas, tenemos algunos tutoriales de intuición muy potentes preparados

01:33.570 --> 01:34.500
para ti allí.

01:34.650 --> 01:38.130
Si no lo ha hecho, por supuesto, si no ha realizado el curso de aprendizaje profundo, si lo

01:38.130 --> 01:41.400
ha hecho, por supuesto que planea y ya sabe todas estas cosas y puede continuar con S. es muy recomendable, ya que le ayudará a comprender exactamente cómo funcionan

01:41.460 --> 01:46.950
las redes neuronales y por qué son tan poderosas por qué las estamos aprovechando. este profundo algoritmo de aprendizaje genial.

01:46.950 --> 01:52.020
Pero si desea obtener ese conocimiento adicional sobre las redes neuronales antes de continuar con esta parte del curso,

01:52.020 --> 01:58.230
Y una vez que actualices tus conocimientos o obtengas ese conocimiento sobre redes

01:58.320 --> 02:03.450
neuronales de ese anexo y regreses aquí, procederemos particularmente si te

02:03.450 --> 02:08.900
sientes cómodo con las redes neuronales, entonces, vamos directo a ello.

02:08.940 --> 02:10.160
Comencemos hablando de intuición profunda de aprendizaje.

02:10.170 --> 02:13.040
Y espero ver en el primer tutorial.

02:13.320 --> 02:15.450
Hasta entonces disfruta de a.

02:15.450 --> 02:16.840
&nbsp;
