WEBVTT

00:00.890 --> 00:05.660
Hallo en welkom terug bij de cursus over kunstmatige intelligentie van vandaag, we hebben het eindelijk

00:05.660 --> 00:06.350
over Kyul-leren.

00:06.950 --> 00:13.060
Oké, dus we hebben deze vergelijking al, de Belmont-vergelijking, waar we veel componenten aan hebben toegevoegd.

00:13.070 --> 00:19.310
We hebben hier de beloning, die niet alleen aan het einde kan zijn, maar bij elke stap.

00:19.880 --> 00:21.680
We hebben de kortingsfactor.

00:21.830 --> 00:28.220
We hebben de waarschijnlijkheid omdat we nu naar Markov-beslissingsprocessen kijken en hier hebben we de kans om

00:28.220 --> 00:34.370
in een andere staat te belanden, ongeacht welke actie we ondernemen of gegeven de actie die

00:34.370 --> 00:38.360
we ondernemen, er kunnen meerdere waarin we terecht kunnen komen.

00:38.360 --> 00:43.070
En dan hebben we de waarde van de volgende toestanden, want hij was een soort recursieve functie

00:43.070 --> 00:43.370
enzovoort.

00:43.610 --> 00:46.360
Maar waarschijnlijk heb je nog één vraag.

00:46.680 --> 00:51.200
De vraag is waar in dit alles is de brief?

00:51.200 --> 00:53.060
V Waarom heet het allemaal?

00:53.060 --> 00:54.230
V Leren?

00:54.230 --> 00:55.340
Dus waar is de.

00:55.340 --> 00:58.470
V En dat is de vraag die we vandaag gaan beantwoorden.

00:58.820 --> 01:05.600
Tot nu toe hebben we te maken gehad met waarden, de waarde van het zijn in een bepaalde staat, en

01:05.600 --> 01:09.510
nu gaan we kijken hoe Q daar ook in past.

01:09.950 --> 01:11.780
Dus hier hebben we twee voorbeelden.

01:12.110 --> 01:14.240
Aan de linkerkant is wat we tot nu toe hebben gedaan.

01:14.450 --> 01:17.750
Onze agent is aan het analyseren, oké, ik ben hier.

01:18.140 --> 01:19.730
Dit is een Markov-beslissingsproces.

01:19.730 --> 01:21.380
Dus het maakt niet uit hoe ik hier ben gekomen.

01:21.680 --> 01:26.060
De rest van de omgeving trekt zich niets aan van de stappen die ik heb genomen om hier te komen.

01:26.300 --> 01:33.080
Vanaf nu moet ik de optimale beslissing nemen waar ik heen ga, hier, hier, hier, gebaseerd op de huidige staat en alle

01:33.080 --> 01:36.890
toekomstige staten die hier vandaan komen, maar niet uit het verleden.

01:37.340 --> 01:39.590
En dus kan hij zien dat er drie opties zijn.

01:39.590 --> 01:41.750
Er is een staat één staat tot staat drie.

01:42.110 --> 01:48.860
En op basis van zijn ervaring heeft hij de waarden in deze toestanden berekend en nu gaat hij de

01:48.860 --> 01:49.790
Bellman-vergelijking gebruiken.

01:49.790 --> 01:52.040
Dus zelfs dat is echter een stochastisch proces.

01:52.040 --> 01:56.030
Dus hij weet dat hij hierheen zal gaan, maar er is een kans dat hij naar links of rechts gaat enzovoort.

01:56.060 --> 01:58.460
Dus op basis van deze waarden is het goed om een beslissing te nemen.

01:58.850 --> 02:00.110
Dat is wat we tot nu toe hebben gedaan.

02:00.110 --> 02:03.110
En dat is hier volkomen de legitieme benadering.

02:03.470 --> 02:05.600
Maar nu gaan we het een beetje aanpassen.

02:05.600 --> 02:10.190
We nemen exact hetzelfde concept, hetzelfde exacte probleem.

02:10.340 --> 02:15.980
Maar hier, in plaats van te kijken naar de waarden van elke staat waarin hij terecht

02:15.980 --> 02:21.340
kan komen, gaan we kijken naar de waarden of de waarde van elke actie.

02:21.350 --> 02:25.580
Dus we gaan de letter V niet meer gebruiken, want vs voor de waarde van de

02:25.580 --> 02:29.690
staat gaan we een Q gebruiken en je hebt misschien een vraag waarom de letter.

02:29.690 --> 02:30.230
V Nou.

02:30.620 --> 02:32.240
V Sommige mensen speculeren dat.

02:32.240 --> 02:33.680
V Zal ik dit lezen.

02:33.680 --> 02:36.260
Ik denk dat iemand dat op Quora heeft genoemd.

02:36.260 --> 02:41.660
Q is vanwege de kwaliteit, maar tegelijkertijd kon ik daar geen andere verwijzingen naar vinden.

02:41.660 --> 02:42.770
Dus het kan zijn dat het daar niet aan ligt.

02:42.770 --> 02:45.470
Misschien omdat dat de brief is die destijds werd gebruikt.

02:45.770 --> 02:50.230
En nu werd het super populair omdat het daarom allemaal Q Learning heet.

02:50.690 --> 02:52.460
Dus geen exacte reden waarom het heet.

02:52.460 --> 02:56.780
V Maar desalniettemin helpt het ons in ieder geval om onderscheid te maken tussen Viene.

02:56.780 --> 02:57.290
V dus.

02:57.770 --> 03:03.860
Q Hier vertegenwoordigt in plaats van de waarde van de staat die het vertegenwoordigt, laten we gaan van kwaliteit, het vertegenwoordigt

03:03.860 --> 03:06.190
de kwaliteit van de actie die het vertegenwoordigt.

03:06.200 --> 03:07.670
Oké, dus ik heb vier acties.

03:08.180 --> 03:10.760
Wat zijn de verschillende kwaliteiten van deze acties.

03:10.760 --> 03:14.150
Wat is de of de waarde van de actie of de kwaliteit van de actie.

03:14.180 --> 03:15.680
Welke actie is lucratiever.

03:15.680 --> 03:19.610
Dus ik heb een statistiek nodig die me vertelt, oké, hoe kwantificeer ik deze actie?

03:19.610 --> 03:20.750
En dan kan ik ze vergelijken.

03:20.750 --> 03:22.430
En dat is precies wat Q is.

03:23.120 --> 03:28.760
En dus heeft hij hier vier mogelijke acties, zoals altijd, omhoog, rechts, links of omlaag.

03:29.060 --> 03:35.120
En op basis van de actie zal er een formule zijn die ons de kwantificeerbare waarde van die actie vertelt,

03:35.120 --> 03:38.180
die we de Q de Q-waarde van die actie noemen.

03:38.510 --> 03:41.600
Dus laten we eens kijken hoe we deze formule gaan afleiden.

03:41.600 --> 03:44.420
V Hoe verhoudt het zich daar eigenlijk mee?

03:44.420 --> 03:51.230
Omdat, zoals je je kunt voorstellen, omdat acties tot toestanden leiden, er een soort verband moet zijn tussen de twee die we hebben.

03:51.230 --> 03:56.000
We hebben al bepaald hoe we dit moeten berekenen en we waren er behoorlijk goed in.

03:56.000 --> 04:01.760
We weten hoe we de Bellman-vergelijking moeten gebruiken in zeer verschillende omgevingen met veel verschillende complicaties.

04:02.120 --> 04:05.990
Laten we die kennis gebruiken om te begrijpen hoe we nu kunnen berekenen.

04:05.990 --> 04:11.510
V Om dezelfde voorspellingen te doen, want zoals je je kunt voorstellen, verandert de omgeving niet, afhankelijk

04:11.510 --> 04:16.100
van de benadering die we gebruiken, de omgeving zal hoe dan ook hetzelfde zijn.

04:16.460 --> 04:22.070
Dus daarom zouden deze benadering en deze benadering altijd hetzelfde resultaat moeten geven en daarom is dat nog een reden waarom deze

04:22.310 --> 04:24.260
twee aan elkaar gekoppeld zouden moeten worden.

04:24.980 --> 04:25.820
Dus laten we eens kijken.

04:26.180 --> 04:31.430
Dus hier is onze benadering, waar we gewoon gaan kijken naar de waarde van een bepaalde staat, deze staat of een

04:31.430 --> 04:31.970
andere staat.

04:32.270 --> 04:36.830
En hier gaan we, we gebruiken hier alleen de letter s, want dat is de huidige staat.

04:36.830 --> 04:40.520
En daarom zal de terminologie in beide vergelijkingen hetzelfde zijn.

04:40.520 --> 04:42.710
En hier gebruiken we QSA.

04:42.710 --> 04:45.470
Q Is de van de staat s en de actie.

04:45.470 --> 04:51.680
A omdat actie aan de gang is, maar in welke staat die actie moet worden uitgevoerd, voeren we die actie uit in de staat.

04:51.680 --> 04:56.360
S OK, dus nu gaan we de bouwvergelijking voor de eerste benadering uitschrijven.

04:56.360 --> 05:00.320
Zoals je hier kunt zien, hebben we V van S, dus de waarde van.

05:00.490 --> 05:08.430
Elke gegeven status is het maximum van de beloning die je maximaal krijgt op basis van de acties die je hebt drie.

05:08.620 --> 05:10.180
In dit geval heb je eigenlijk vier acties.

05:10.510 --> 05:15.250
Dus het maximale uit alle mogelijke acties en die van dit onderdeel, die vele malen zeer besproken zijn.

05:15.260 --> 05:22.090
Dit is dus onze beloning die we krijgen door die actie in die staat uit te voeren, plus een verdisconteerde factor vermenigvuldigd

05:22.090 --> 05:28.150
met de verwachte waarde van de nieuwe staat dat we in een verwachte waarde zullen zijn omdat het een

05:28.150 --> 05:29.370
stochastisch proces is.

05:29.380 --> 05:32.950
We weten niet precies zeker dat we hier gaan eindigen.

05:32.950 --> 05:35.660
We kunnen met een bepaalde waarschijnlijkheid links of rechts eindigen.

05:35.920 --> 05:37.450
Daarom staan deze kansen hier.

05:38.110 --> 05:38.440
Oke.

05:38.440 --> 05:40.030
Dus dat is onze waarde.

05:40.190 --> 05:43.300
En laten we nu naar Q kijken. Dus Q wordt gedefinieerd.

05:43.480 --> 05:45.030
We gaan dit gebruiken om te definiëren.

05:45.040 --> 05:50.290
Q Dus laten we zeggen dat de agent van deze locatie, vanuit deze staat de actie naar boven uitvoert.

05:50.740 --> 05:54.130
Waar zal de Q-waarde gelijk aan zijn?

05:54.430 --> 05:59.140
Laten we eerst eens kijken wat hij in ruil krijgt voor het uitvoeren van deze actie.

05:59.290 --> 06:01.910
Het eerste dat je krijgt is een beloning, toch.

06:01.990 --> 06:03.820
Dat kent er geen twijfel over.

06:04.090 --> 06:06.220
Er zal een soort van zijn, of het kan nul zijn.

06:06.220 --> 06:12.560
Maar we weten dat de manier waarop dit versterkende leerproces werkt, is dat er soms een beloning is voor

06:12.560 --> 06:15.850
het uitvoeren van bepaalde acties vanuit een bepaalde staat.

06:15.860 --> 06:19.450
Dus we gaan dat hier toevoegen en dan gaan we toevoegen wat gaan we toevoegen?

06:19.750 --> 06:21.030
Nou, laten we er eens over nadenken.

06:21.040 --> 06:24.420
Wat is het volgende dat er gebeurt nadat hij er doorheen is gegaan?

06:24.730 --> 06:29.380
Het volgende dat gebeurt, is dat de agent zich nu in een bepaalde toestand bevindt.

06:29.920 --> 06:35.680
Je zou hier kunnen eindigen met een kans van 80 procent of een kans, maar eigenlijk zou je hier of hier

06:35.680 --> 06:36.400
kunnen eindigen.

06:36.700 --> 06:43.510
Maar waar hij nu ook terechtkomt, we hebben al een gekwantificeerde maatstaf voor de staat waarin hij zich bevindt.

06:44.080 --> 06:47.020
En dat is eigenlijk de waarde van die staat.

06:47.020 --> 06:52.090
Maar omdat hij in veel verschillende staten en in drie van de mogelijke verschillende staten kan komen, moeten we kijken

06:52.090 --> 06:55.280
naar de verwachte waarde van de staat waarin hij zich bevindt.

06:56.050 --> 06:57.690
En dus gaan we dat toevoegen.

06:57.700 --> 07:03.010
We gaan natuurlijk de kortingsfactor toevoegen, zoals we eerder hadden, want dat is ergens in de

07:03.010 --> 07:03.640
toekomst.

07:04.030 --> 07:11.080
En dan gaan we de som optellen van alle mogelijke toestanden, van alle mogelijke toestanden die hij zou kunnen krijgen door deze

07:11.080 --> 07:13.720
actie te ondernemen in tijden van waarschijnlijkheid.

07:14.110 --> 07:19.900
Dus wat we hier zeggen is dat, oké, dus door een actie uit te voeren, krijg je een beloning plus, wat

07:19.900 --> 07:21.190
een gekwantificeerde statistiek is.

07:21.550 --> 07:23.710
Bovendien kom je in een staat terecht.

07:23.710 --> 07:24.490
We weten niet welke.

07:24.880 --> 07:25.710
Het kan hier zijn.

07:25.720 --> 07:26.170
Het kan hier zijn.

07:26.170 --> 07:26.710
Het kan hier zijn.

07:26.950 --> 07:31.760
Maar hier is de verwachte waarde van de staat waarin je terechtkomt.

07:32.110 --> 07:35.680
En nu gaan we vermenigvuldigen met de verdisconteringsfactor, want dat is één stap verder.

07:36.280 --> 07:40.680
Dus dat is onze cue-waarde hiervoor voor prestatie-actie.

07:41.170 --> 07:49.120
En wat je hier meteen opvalt, is dat Q De Q-waarde is eigenlijk precies identiek aan wat hier tussen

07:49.120 --> 07:52.600
deze haakjes staat en waarom is dat?

07:52.630 --> 07:59.890
Nou, als je er hier over nadenkt, we nemen het maximum van het resultaat zal het maximum krijgen over alle

07:59.890 --> 08:00.930
mogelijke acties.

08:00.930 --> 08:04.990
We hebben dus vier acties die we maximaal ondernemen voor alle mogelijke acties van het resultaat dat

08:04.990 --> 08:07.750
we krijgen door elk van die acties uit te voeren.

08:08.170 --> 08:11.080
En in Q definiëren we interessant.

08:11.080 --> 08:13.490
Wat krijgen we als we een bepaalde actie ondernemen?

08:13.900 --> 08:21.460
Dus als je erover nadenkt, is het logisch dat de waarde van een toestand, dus bijvoorbeeld deze

08:21.520 --> 08:25.510
toestand, het maximum is van alle mogelijke Q-waarden.

08:25.670 --> 08:25.930
Rechts.

08:25.950 --> 08:31.420
Dus hier in de Verenigde Staten, door in de staat te zijn, heeft de agent één sleutelwaarde, twee sleutelwaarde,

08:31.420 --> 08:32.800
drie sleutelwaarde voor Q-waarde.

08:32.820 --> 08:34.700
Hij heeft dus vier mogelijke Q-waarden.

08:34.990 --> 08:41.050
Welnu, de waarde van de staat, het is logisch dat de waarde van de staat het maximum is van al die

08:41.050 --> 08:44.350
vier Q-waarden, en dat is precies wat we hier kunnen zien.

08:44.360 --> 08:48.010
Dat is een goede bevestiging van deze nieuwe formule die we hebben afgeleid.

08:48.010 --> 08:52.780
Als dat niet het geval was, als dat niet overeenkwam, dan zouden we vragen hebben als,

08:53.170 --> 08:53.890
waarom dan?

08:53.890 --> 08:54.810
Waarom maakt het niet uit?

08:55.060 --> 08:56.890
Waarom komt het niet overeen?

08:56.890 --> 08:57.310
Als.

08:57.550 --> 09:07.360
Q-waarde is een gekwantificeerde metriek voor het uitvoeren van een actie en V hangt af van de vier is zoals is het maximum van de

09:07.750 --> 09:12.220
mogelijke resultaten van de vier acties die hij kan uitvoeren?

09:12.310 --> 09:18.940
Dat is logisch en dat bevestigt de formule die we net hebben bereikt en nu gaan we

09:18.940 --> 09:20.960
het nog interessanter maken.

09:20.980 --> 09:26.020
We gaan de V volledig verwijderen, want je kunt zien dat V een recursieve functie is van V, dus en

09:26.020 --> 09:29.700
dan heb je V en de V en de V en dan V enzovoort.

09:29.710 --> 09:36.650
Dus je kunt deze V uitdrukken door al het volgende vs de meest optimale vs die hier naar voren zal komen als we in Q zijn als

09:36.760 --> 09:43.210
een functie recursieve functie van V of als een functie van de volgende V, en dan zouden we moeten sluit deze V aan en

09:43.210 --> 09:45.130
dan gaan we terug naar de V.

09:45.140 --> 09:51.190
Dus wat gaan we doen, we nemen deze V en we gaan hem vervangen

09:51.190 --> 09:53.110
door een Q, oké.

09:53.120 --> 09:54.100
Dus laten we daar eens naar kijken.

09:55.030 --> 10:00.550
We gaan deze video van de volgende staat opnemen en we gaan dit hier in die

10:00.550 --> 10:05.500
formule stoppen en zoals je nu kunt zien, zodat dit deel niet verandert.

10:05.500 --> 10:06.940
Dit verandert waarschijnlijk niet.

10:07.090 --> 10:16.580
Maar zoals we net hebben besproken, is V van S het maximum bij alle acties van Q van S en A hier.

10:16.870 --> 10:19.090
Dus dat gaan we hier vervangen.

10:19.100 --> 10:23.650
Dus we gaan het maximum zeggen, natuurlijk is de nieuwe actie, de actie die we gaan

10:23.650 --> 10:26.270
ondernemen, want hier hebben we de video van Prime.

10:26.650 --> 10:30.610
Dus hier hebben we nu het maximum over alle eh een priemgetal.

10:30.670 --> 10:34.270
Dus de acties die we gaan ondernemen vanuit deze staat of

10:34.270 --> 10:39.820
waar dan ook, in welke andere staat we ook belanden, maar de actie die we vanaf daar

10:39.820 --> 10:49.360
gaan ondernemen en een maximum over al die en het maximum is van alle de Q-waarden die voor ons beschikbaar zijn in die nieuwe staat als priemgetal, komma, een

10:49.480 --> 10:50.100
priemgetal.

10:50.110 --> 10:51.190
En dat is de actie.

10:51.220 --> 10:51.890
Dus dat is het.

10:52.090 --> 10:54.260
Dus er komt daar nog een voor Q-waarden.

10:54.490 --> 10:56.230
Dus nu, zoals je kunt zien, laten we dat nog eens doornemen.

10:56.920 --> 11:02.680
Dus als we deze term hebben afgeleid, zouden we het gewoon via logica en intuïtie bespreken, zodat we kunnen zien dat

11:02.680 --> 11:09.130
VNS eigenlijk V van S is en nieuwsgierig en A zijn gekoppeld. De van S is de stelregel voor alle acties van het Congres

11:09.130 --> 11:11.060
en eh, je kunt zie hier.

11:11.080 --> 11:16.300
Dus dit, dit deel is identiek aan dit deel en dan gaan we daar gebruik van maken

11:16.300 --> 11:21.430
en we gaan dit bit vervangen door VNS vanaf hier, maar niet dit exacte formaat.

11:21.440 --> 11:25.490
We nemen dit interne deel en we gaan het vervangen door Q of A. en een..

11:25.960 --> 11:31.370
Dus we moeten dat hier aansluiten en dit deel wordt Q of als priemgetal.

11:31.750 --> 11:36.420
Dus maximum van Q door Crosswell A problemen van Q als priemgetal Een priemgetal.

11:36.910 --> 11:39.480
En nu hebben we onze formule.

11:39.670 --> 11:43.360
Dus nu hebben we een recursieve formule voor de Q-waarde.

11:43.390 --> 11:48.660
Dus nu kan de agent denken, wat is de waarde van de actie, wat is de kwaliteit van deze actie, was

11:48.660 --> 11:50.050
de Q-waarde van deze actie?

11:50.350 --> 11:53.770
Nou, het hangt af van de beloning die ik krijg in de onmiddellijke stap daarna.

11:54.010 --> 12:01.990
Bovendien hangt het af van de verdisconteerde factor maal het maximum van alle mogelijke Q-acties in die staat.

12:02.260 --> 12:04.030
Maar ik weet niet of ik daar ga komen.

12:04.030 --> 12:08.830
Dus ik moet ook naar die staat en die staat kijken, en daarom hebben we hier deze verwachte

12:08.830 --> 12:09.270
waarde.

12:09.280 --> 12:11.920
Dus we hebben de enige kans maal een maximum.

12:11.960 --> 12:13.100
Dat is onze verwachte waarde.

12:13.360 --> 12:15.310
Dus zeer vergelijkbare formule, zoals je kunt zien.

12:15.520 --> 12:17.980
Maar deze keer drukken we dingen uit via de Q-waarden.

12:18.310 --> 12:26.890
En daarom heet dit hele algoritme Q Learning, want daar wordt naar gekeken.

12:26.890 --> 12:28.450
Dit is wat de agenten daadwerkelijk gebruiken.

12:28.450 --> 12:30.970
Ze kijken niet naar de staten om te kijken naar hun mogelijke acties.

12:31.180 --> 12:35.680
En op basis van de acties op de Q-waarden van acties, zullen ze beslissen welke actie ze moeten ondernemen.

12:35.680 --> 12:39.010
Dus ze kijken alleen naar de maximale Q-waarde in deze gegeven toestand.

12:39.170 --> 12:40.240
Hij heeft vier acties.

12:40.270 --> 12:42.490
Wat is de beste actie om te ondernemen?

12:42.490 --> 12:47.230
Dus je kunt het vergelijken, een soort vergelijking van de verschillende toestanden waarin het dan

12:47.230 --> 12:53.470
kan terechtkomen, gaat de mogelijke acties die het momenteel heeft, vergelijken door de optimale te vinden, gaat die actie ondernemen en

12:53.830 --> 12:57.190
dan gaat het dat herhalen proces, herhaal dat proces enzovoort.

12:57.460 --> 13:03.910
Dus nu kun je zien hoe dit allemaal samenkomt, hoe de beloning, de verdisconteringsfactor, de stochastische

13:04.270 --> 13:10.290
Markov-beslissingsprocessen en de waarden en de belangrijkste waarden allemaal samenkomen om ons deze ene superkrachtige

13:10.570 --> 13:18.310
Bellmon-vergelijking voor Q-waarden te geven, die we nu kunnen toepassen en onze agenten laten leren hoe ze het milieu

13:18.310 --> 13:19.540
kunnen verslaan.

13:20.230 --> 13:23.290
En dat is dus een intuïtieve verklaring van wat er aan de hand is.

13:23.290 --> 13:28.450
Ik weet dat we de formules hebben doorgenomen, maar het is nodig omdat dit onze formule

13:28.450 --> 13:36.730
is die we dit hele hoofdstuk hebben doorgenomen en ik denk dat het een goede overgang is van V naar Q en het illustreert hoe er

13:36.730 --> 13:38.230
verbanden tussen elkaar zijn.

13:38.620 --> 13:46.840
En als je een wat meer rigoureuze benadering wilt, een wiskundige benadering en zoals je de wiskunde erachter wilt zien en wat

13:46.840 --> 13:52.630
meer wilt leren over Q-waarden en hoe ze werken, dan hebben we wat extra informatie

13:52.630 --> 13:53.680
voor je.

13:54.100 --> 14:02.590
Dit artikel wordt Markov-beslissingsprocessen, concepten en algoritmen genoemd door Martin von Utrillo 2009.

14:02.860 --> 14:05.050
Dus je hebt de link hier, zoals altijd.

14:05.350 --> 14:12.380
En hier kun je wat meer in detail lezen om alle details achter Q-waarden te begrijpen, enzovoort.

14:12.380 --> 14:17.320
En nu we al deze dingen met betrekking tot de Bellman-vergelijking hebben besproken, zijn we

14:17.320 --> 14:23.890
nu klaar om naar iets ingewikkelders te kijken, zoals dit artikel, zodat we, als we hier wat aanvullende informatie

14:23.890 --> 14:27.610
over willen hebben, een soort van een dieper inzicht krijgen.

14:27.610 --> 14:33.850
Maar zelfs als u de krant nog niet leest, moet u een goede praktische kennis hebben van wat

14:33.850 --> 14:39.730
Q Learning inhoudt en hoe agenten de acties bedenken die ze in een bepaalde omgeving moeten

14:39.730 --> 14:40.290
ondernemen.

14:40.780 --> 14:43.810
Dus ik hoop dat je genoten hebt van vandaag, Statoil, en ik kijk uit naar je volgende keer.

14:43.840 --> 14:45.370
Tot dan, geniet ervan.