WEBVTT

00:00.450 --> 00:03.210
Ciao e bentornati al corso sull'intelligenza artificiale.

00:03.240 --> 00:08.220
Nella sezione di oggi affrontiamo il tema di un profondo apprendimento di Q.

00:08.250 --> 00:11.200
Quindi vediamo come attaccheremo questo in questa sezione.

00:11.220 --> 00:17.280
Impareremo un'intuizione dell'apprendimento profondo dal lato dell'apprendimento delle cose, così andremo in un apprendimento profondo separato, l'intuizione dietro

00:17.750 --> 00:20.840
di essa in due parti per imparare e recitare.

00:20.850 --> 00:22.620
E avremo dettagli su questo.

00:22.620 --> 00:28.290
Quindi, prima di tutto, capisci come le reti neuronali effettivamente imparano e come aggiornano i loro

00:28.290 --> 00:34.350
pesi in base a cosa li stiamo alimentando e come funziona l'intero concetto di apprendimento o come

00:34.350 --> 00:40.140
prenderemo i concetti di differenza temporale o ridiscussione e apprendimento semplice e li applichiamo all'apprendimento profondo

00:40.530 --> 00:46.550
e poi parleremo di come l'algoritmo di deep learning in realtà decide quale azione intraprendere in quali

00:46.560 --> 00:52.530
stati di cui parleremo sull'esperienza, riproduciamo un'aggiunta molto importante in aggiunta all'apprendimento profondo che effettivamente consente di

00:53.100 --> 00:57.420
approfondire imparerai a lavorare correttamente e vedrai perché è importante da quel

00:57.420 --> 00:58.100
tutorial.

00:58.350 --> 01:02.350
E poi parleremo delle politiche di selezione delle azioni.

01:02.470 --> 01:11.190
Parliamo di come i profondi agenti di guadagno sono in grado di combinare esplorazione e sfruttamento.

01:11.190 --> 01:15.960
tale approccio, ma devono anche esplorare in modo da non rimanere bloccati al massimo.

01:15.960 --> 01:18.900
Quindi, una volta trovato un buon approccio, possono utilizzare

01:18.900 --> 01:24.660
E un'altra cosa che volevo menzionare riguardo alla sezione è che è molto utile se

01:24.660 --> 01:28.050
si guarda un numero x di reti neurali artificiali.

01:28.050 --> 01:33.570
Quindi se andate ed esplorate tutti questi argomenti abbiamo preparato dei tutorial di intuizione molto potenti

01:33.570 --> 01:34.500
preparati per voi.

01:34.650 --> 01:38.130
Se non l'hai fatto, naturalmente, se non hai fatto il corso di deep learning se

01:38.130 --> 01:41.400
lo hai fatto, naturalmente, e sai già tutte queste cose e puoi procedere con S. corso, questo è altamente consigliabile perché ti aiuterà a capire esattamente

01:41.460 --> 01:46.950
come funzionano le reti neurali e perché sono così potenti perché li stiamo sfruttando questo profondo algoritmo di apprendimento.

01:46.950 --> 01:52.020
Ma se vuoi ottenere quella conoscenza aggiuntiva sulle reti neurali prima di procedere con questa parte del

01:52.020 --> 01:58.230
E una volta che aggiorni la tua conoscenza o acquisisci quella conoscenza sulle reti

01:58.320 --> 02:03.450
neurali da quell'allegato e torni qui e procederemo in particolare se ti

02:03.450 --> 02:08.900
senti abbastanza a tuo agio nelle reti neurali, allora entriamo subito in esso.

02:08.940 --> 02:10.160
Cominciamo a parlare dell'intuizione dell'apprendimento profondo.

02:10.170 --> 02:13.040
E non vedo l'ora di vedere il primo tutorial.

02:13.320 --> 02:15.450
Fino ad allora goditi a.

02:15.450 --> 02:16.840
&nbsp;