WEBVTT

00:01.110 --> 00:04.770
Ciao bentornati al corso sull'intelligenza artificiale.

00:04.770 --> 00:09.420
Oggi discuteremo il piano di attacco per la sezione che stiamo parlando di kill learning.

00:09.450 --> 00:15.000
E abbiamo un bel po 'di tutorial quindi penso che sia una

00:15.000 --> 00:20.580
buona idea per noi passarli rapidamente per capire cosa aspettarsi nei prossimi video.

00:20.580 --> 00:21.650
Quindi eccoci qui.

00:22.140 --> 00:22.560
Tutto ok.

00:22.560 --> 00:25.230
Cosa impareremo in questa sezione.

00:25.230 --> 00:31.650
modo si relaziona con le cose che osserviamo nella vita reale in realtà cose che facciamo noi stessi .

00:31.690 --> 00:37.890
Per prima cosa parleremo di cosa sia effettivamente l'apprendimento di rinforzo e quale sia la filosofia dietro l'apprendimento

00:37.890 --> 00:44.540
di rinforzo e in che modo l'apprendimento di rinforzo possa realmente essere visto nella vita reale e in che

00:44.790 --> 00:51.630
Non parlano dell'equazione di Bellmen, concetto molto fondamentale alla base di tutto o di molte cose che stanno accadendo

00:51.630 --> 00:56.580
e per l'apprendimento di rinforzo, specialmente nello spazio di apprendimento di CULE e

00:56.940 --> 01:01.700
di cosa discuteremo in questa sezione del corso e in le seguenti sezioni.

01:01.800 --> 01:09.280
Poi parleremo del piano e del piano che, con l'intelligenza artificiale del ferro grezzo, ci

01:09.300 --> 01:15.990
avvicineremo per navigare all'interno degli ambienti, vedremo come questo si avvicina molto velocemente

01:15.990 --> 01:17.270
ma piuttosto interessante.

01:17.720 --> 01:22.890
Lì parleremo del mercato dei processi decisionali e del tuo concetto introdurremo un concetto

01:22.890 --> 01:31.620
molto nuovo che aggiungerà lentamente un livello di sofisticazione alla nostra equazione di Belman al nostro intero apprendimento di rinforzo ai nostri concetti

01:31.800 --> 01:37.070
di apprendimento di CULE e questo è il modo in cui questa sezione è

01:37.290 --> 01:43.080
strutturata che introduciamo l'equazione di Bollmann in una forma molto semplicistica e poi lentamente attraverso

01:43.260 --> 01:48.550
le esercitazioni aggiungiamo livelli di sofisticazione ad essa per arrivare alla versione finale.

01:48.690 --> 01:53.880
Questa è la nostra destinazione designata in termini di Hillary, ma ci arriveremo lentamente.

01:54.000 --> 01:58.830
Per permetterci di avere abbastanza tempo per elaborare tutte queste informazioni e lasciarmelo sistemare.

01:58.890 --> 02:05.400
che abbiamo discusso o quello che avremo o discusso per poi parlare delle politiche contro i piani.

02:05.400 --> 02:11.220
E il marchio dei prosies dissidenti è un ulteriore livello di sofisticazione in cima a quello

02:11.220 --> 02:13.830
Un altro interessante Tauriel sono tutti interessanti.

02:13.830 --> 02:19.590
Solo un altro breve tutorial su come la politica è diversa dai piani e

02:19.590 --> 02:25.980
quali sono le differenze e questi sono termini che probabilmente ascolterete o leggerete in letteratura

02:25.980 --> 02:29.980
se vi state approfondendo per ottenere ulteriori informazioni sull'apprendimento rinforzato.

02:29.980 --> 02:34.590
Tutti parlano di aggiungere una pena di vita ai nostri ambienti.

02:34.770 --> 02:41.850
E questo è un altro modo per aggiungere complessità negli ambienti in cui i

02:41.850 --> 02:43.340
nostri agenti opereranno.

02:43.370 --> 02:48.780
Stanno tutti parlando dell'intuizione che c'è dietro continuare a imparare così fino a quel tutorial che stiamo

02:48.780 --> 02:50.690
per parlare di valori di stati.

02:50.790 --> 02:57.300
E poi finalmente passeremo a parlare di valori o azioni o valori dei cubi

02:57.300 --> 02:59.880
e quindi introdurremo la differenza temporale.

02:59.910 --> 03:06.690
Questo è un tutorial in cui tutto ciò che abbiamo imparato si riunirà per spiegare in

03:06.690 --> 03:13.930
che modo esattamente gli agenti o l'intelligenza artificiale imparano come aggiorna i suoi valori attraverso tutto il

03:14.090 --> 03:16.420
processo iterativo che sta attraversando.

03:16.830 --> 03:23.100
aiuterà ancora di più a cogliere quella conoscenza che stiamo per uscire nella sezione.

03:23.100 --> 03:29.550
E alla fine vedremo una zating visibile dell'apprendimento, quindi prenderemo tutto ciò che apprendiamo

03:29.730 --> 03:35.870
e lo guarderemo davanti ai nostri occhi e osserveremo un'intelligenza artificiale che in realtà

03:35.880 --> 03:42.600
esegue l'apprendimento della CULE e fare in pratica tutte le cose che discuteremo a livello

03:42.810 --> 03:44.530
intuitivo e che ci

03:44.550 --> 03:47.460
Quindi spero che tu sia molto entusiasta di questi prossimi tutorial.

03:47.460 --> 03:48.800
Lo sono sicuramente.

03:48.810 --> 03:55.380
E ci sono alcune diapositive molto interessanti in arrivo e, cosa più importante, i concetti stessi

03:55.380 --> 03:59.540
sono molto interessanti e sono sicuro che ti divertirai parecchio.

03:59.760 --> 04:01.410
E non vedo l'ora di vederti la prossima volta.

04:01.410 --> 04:03.080
Fino ad allora goditi l'intelligenza artificiale.