WEBVTT

00:00.500 --> 00:03.410
Hallo en welkom terug bij de cursus over kunstmatige intelligentie.

00:03.410 --> 00:07.670
In de tutorial van vandaag zetten we onze eerste stap in de wereld van H3C.

00:07.820 --> 00:10.950
En als eerste stap gaan we uitzoeken waar deze afkorting voor staat.

00:11.300 --> 00:15.680
Dus H3C staat voor een Synchronoss Advantage actor-criticus-algoritme.

00:16.250 --> 00:22.700
Dit is een algoritme dat in 2016 door een groep onderzoekers bij Google a deep mind is ontwikkeld.

00:22.850 --> 00:28.280
En het is tot nu toe het meest geavanceerde algoritme voor kunstmatige intelligentie.

00:28.520 --> 00:33.980
Nu heeft het meerdere notificaties en daar zullen we meer over vertellen in de cursus, vooral in de

00:34.250 --> 00:34.930
praktische tutorials.

00:35.060 --> 00:41.240
Maar niettemin blaast dit algoritme al het andere, inclusief diepe, convolutionele Q-leernetwerken uit

00:41.240 --> 00:44.180
het water, volledig uit het water.

00:44.190 --> 00:45.560
En het is sneller.

00:45.740 --> 00:49.730
Het kost minder tijd voor training en levert betere resultaten op.

00:50.210 --> 00:55.520
Dus in dit deel van de cursus zal worden verwezen naar en we hebben

00:55.520 --> 01:02.090
al verwezen, maar we zullen nog meer verwijzen naar een paper of het paper dat werd gepubliceerd dat

01:02.090 --> 01:09.320
voor het eerst H3C introduceerde, heet Asynchronous Methods of Deep Reinforcement Learning door Vladimir Minear en anderen van Google Deep Mine.

01:09.330 --> 01:14.540
Zo geweldig om je dit papier nu te laten zien, zodat je er een inleiding in hebt.

01:14.540 --> 01:15.050
Dus.

01:15.830 --> 01:17.720
Dus hier is dit papier.

01:17.720 --> 01:24.950
Ik wilde het je laten zien, zodat je er een idee van kunt krijgen, maak er al een beetje kennis mee.

01:25.190 --> 01:33.200
En natuurlijk wordt het ten zeerste aanbevolen om de krant door te lezen en te begrijpen waar ze het precies

01:33.200 --> 01:34.100
over hebben.

01:34.100 --> 01:41.450
En je zult zien dat Adlen je tijdens de praktische tutorials door bepaalde delen van

01:41.450 --> 01:50.210
het papier zal leiden, door bepaalde paragrafen of secties die relevant zijn voor wat er op dat moment

01:50.210 --> 01:51.440
wordt geprogrammeerd.

01:51.800 --> 01:57.740
En waar ik hier op wilde wijzen, is dat, zoals je kunt zien, hier veel onderzoek naar is gedaan, maar er

01:57.740 --> 01:59.210
zijn ook veel verwijzingen.

01:59.210 --> 02:05.660
Maar een deel daarvan dat ik erg leuk vind, is dat ze aan het einde, helemaal aan het einde, de verschillende

02:06.230 --> 02:07.970
algoritmen vergelijken, de resultaten vergelijken.

02:07.970 --> 02:09.670
En dat is wat ik hier wilde aangeven.

02:10.010 --> 02:11.150
Laten we daarom een beetje inzoomen.

02:11.480 --> 02:17.390
Dus hier, zoals je daar kunt zien, zelfs in Google, denken ze diep na over hun training of evalueren ze hun

02:17.390 --> 02:20.450
algoritmen op games, net zoals we doen in de SCHAUS.

02:20.450 --> 02:27.650
Dus precies hetzelfde principe omdat games een gesimuleerde omgeving zijn of een kleine omgeving, een besloten omgeving met

02:27.650 --> 02:28.760
bepaalde regels.

02:28.760 --> 02:33.230
En ze willen begrijpen hoe goed deze kunstmatige intelligentie het doet in die games.

02:33.410 --> 02:41.140
En hier hebben we precies al die spellen waarvan je er veel kunt vinden op open A. L. Jim en de games waarmee we hebben gewerkt.

02:41.150 --> 02:44.190
In deze sectie werken we bijvoorbeeld met Breakout.

02:44.210 --> 02:46.780
Dus het is hier ook een dat je kunt zien voor Breakout.

02:46.790 --> 02:50.240
Ze zijn vetgedrukt.

02:50.480 --> 02:51.710
Ze hebben het beste algoritme uitgelicht.

02:51.710 --> 02:53.840
Dus, DeQuan, dat is het algoritme waarmee we hebben gewerkt en nog wat andere algoritmen.

02:53.840 --> 02:58.400
En dan heb je hier een drie H3C met Alan LSM lange korte termijn geheugen.

02:58.400 --> 03:03.470
Dus dat is degene die in dit deel van de cursus zal worden geïmplementeerd,

03:03.470 --> 03:08.220
of het H3C is met een analistenteam, wat het nog sterker maakt.

03:08.220 --> 03:10.130
Zoals je kunt zien, is breakout het beste resultaat dat wordt bereikt door H3C, Warfalla STEM.

03:10.250 --> 03:15.590
Dus dat is de score zeven zes zes komma acht vergeleken met de anderen.

03:15.590 --> 03:19.490
En dat zie je ook bij de meesten.

03:19.700 --> 03:23.990
Dus als je nu een grotere afbeelding bekijkt,

03:23.990 --> 03:30.620
kun je zien dat de meeste vetgedrukte eigenlijk in deze laatste kolom staan.

03:30.620 --> 03:31.650
Dus ja, inderdaad, er zijn een aantal games waar andere algoritmen beter presteren.

03:31.880 --> 03:35.930
Maar zoals je kunt zien, presteert DeQuan eigenlijk in geen van de games beter.

03:36.230 --> 03:42.230
Maar je kunt zien dat er andere algoritmen zijn.

03:42.560 --> 03:44.660
Andere algoritmen presteren soms beter, maar A3 Célestin presteert in de meeste gevallen het beste.

03:45.200 --> 03:51.740
Dus je kunt zien dat dit Bohl is.

03:51.740 --> 03:52.970
Dit is vet, deze, deze, deze enzovoort.

03:52.970 --> 03:57.500
U kunt dus zien dat H3C LSM een echt krachtig algoritme is.

03:57.510 --> 04:01.790
Het loopt inderdaad voorop op het gebied van kunstmatige intelligentie en dat is precies wat er zal worden geïmplementeerd.

04:01.790 --> 04:08.190
Dus heel spannend gedeelte voor de boeg.

04:08.480 --> 04:09.890
Moedig u ten

04:10.010 --> 04:17.060
zeerste aan om dit document door te nemen en een idee te krijgen van waar we het over gaan hebben.

04:17.060 --> 04:17.540
En dan

04:18.350 --> 04:23.890
in dit gedeelte en gedurende de dag, vooral de praktische kant van de dingen, de praktische kant van Stroh's, gaan we dit in detail doornemen.

04:23.890 --> 04:26.870
We gaan hier echt met hun pseudocode werken, die beschikbaar is.

04:27.110 --> 04:32.510
En dat gaan we doen, dus ik zou je laten zien hoe je dat

04:32.510 --> 04:36.500
kunt implementeren en hoe we daarmee aan de slag gaan.

04:36.500 --> 04:36.680
En wat dat betreft, ik hoop dat je van deze krant zult genieten en ik kijk ernaar uit je de volgende keer te zien.

04:37.190 --> 04:42.520
En tot die tijd, geniet van AI.