WEBVTT

00:01.040 --> 00:04.020
Hallo und herzlich willkommen zum Kurs über künstliche Intelligenz.

00:04.040 --> 00:07.040
Heute reden wir endlich über das Lernen von Kule.

00:07.070 --> 00:13.120
In Ordnung, also haben wir diese Gleichung bereits mit der Bellmen-Gleichung erhalten, zu der wir viele Komponenten hinzugefügt haben.

00:13.130 --> 00:19.910
Wir haben hier die Belohnung, die nicht ganz am Ende liegen kann, sondern bei jedem Schritt.

00:19.940 --> 00:21.920
Wir haben den Abzinsungsfaktor.

00:21.950 --> 00:26.880
Wir haben die Wahrscheinlichkeit, dass wir uns nun auf das Kennzeichen eines Entscheidungsprozesses konzentrieren.

00:26.900 --> 00:32.780
Und hier haben wir die Möglichkeit, in einem anderen Staat zu enden, unabhängig davon, welche Maßnahmen wir ergreifen oder

00:33.350 --> 00:35.210
welche Maßnahmen wir tatsächlich gegeben haben.

00:35.210 --> 00:40.670
Es kann mehrere Zustände geben, in denen wir enden können, und dann haben wir den Wert der

00:40.670 --> 00:46.790
nächsten Zustände erhalten, weil er so etwas wie eine rekursive Funktion usw. ist, aber Sie haben wahrscheinlich immer noch eine Frage.

00:46.820 --> 00:53.560
Die Frage ist, wo in all dem kein Buchstabe Q steht. Warum heißt das alles q.

00:53.750 --> 00:54.270
Lernen.

00:54.350 --> 00:55.790
Wo ist das Stichwort?

00:55.910 --> 00:58.940
Und diese Frage werden wir heute beantworten.

00:58.940 --> 01:06.620
Bisher haben wir uns mit Werten befasst, dem Wert, in einem bestimmten Zustand zu sein, und nun werden wir uns

01:06.620 --> 01:09.820
ansehen, wie Q auch in all das passt.

01:10.070 --> 01:16.360
Hier haben wir zwei Beispiele auf der linken Seite, was wir bisher tun würden, als unser Agent analysiert hat.

01:16.400 --> 01:18.170
Ok, ich bin hier drüben.

01:18.230 --> 01:21.640
Dies ist ein Zeichen des Entscheidungsprozesses, also spielt es keine Rolle, wie ich hierher gekommen bin.

01:21.770 --> 01:28.250
Der Rest der Umgebung kümmert sich nicht um die Schritte, die ich von jetzt an brauchte, um hierher zu kommen.

01:28.460 --> 01:32.050
Ich muss die optimale Entscheidung treffen, wohin ich hier oder hier gehen soll.

01:32.060 --> 01:37.280
Basierend auf dem aktuellen Zustand und allen zukünftigen Zuständen, die von hier stammen, aber nicht aus der Vergangenheit.

01:37.490 --> 01:42.010
Und so kann er sehen, dass es drei Optionen gibt, es gibt einen Bundesstaat, der drei Staaten gibt.

01:42.260 --> 01:48.920
Basierend auf seiner Erfahrung hat er die Werte in diesen Zuständen berechnet und verwendet nun

01:48.920 --> 01:49.880
die Bellmen-Gleichung.

01:49.880 --> 01:54.260
Obwohl dies ein klassischer Proceso ist, weiß er zwar, dass er hierher kommt, aber es besteht die Möglichkeit, dass

01:54.260 --> 01:56.120
er nach rechts geht und so weiter.

01:56.110 --> 02:02.450
Basierend auf diesen Werten werden wir eine Entscheidung treffen. Das ist das, was wir bisher tun und das ist

02:02.450 --> 02:03.470
absolut legitim.

02:03.560 --> 02:05.640
Aber jetzt werden wir ein bisschen modifiziert.

02:05.660 --> 02:12.860
Wir werden für dasselbe Konzept genau dasselbe Problem verwenden, aber hier, anstatt auf die Werte der

02:12.950 --> 02:21.440
einzelnen Zustände zu schauen, in denen er landen kann, werden wir die Werte oder den Wert jeder Aktion betrachten.

02:21.440 --> 02:25.640
Wir werden also nicht mehr den Buchstaben V verwenden, denn für den Wert des

02:25.640 --> 02:30.740
Staates werden wir ein Q verwenden, und Sie haben vielleicht eine Frage, warum der Buchstabe Q gut ist.

02:30.740 --> 02:32.300
Einige Leute spekulieren darüber.

02:32.300 --> 02:33.760
F Werde ich das lesen?

02:33.770 --> 02:35.420
Ich denke an Quora.

02:35.420 --> 02:41.480
Jemand erwähnte, Q sei aus Qualitätsgründen, aber gleichzeitig konnte ich keine weiteren Hinweise darauf finden. Vielleicht auch

02:41.480 --> 02:45.520
nicht, weil dies der Brief war, der damals verwendet wurde

02:45.920 --> 02:50.750
und jetzt sehr beliebt wurde, weil er es ist alle deshalb als Schlüssellernen bezeichnet.

02:50.780 --> 02:52.520
Es wurde also kein genauer Grund gefunden.

02:52.530 --> 02:58.830
Q Aber es hilft uns immerhin, zwischen V und Q zu unterscheiden. Also hier Q.

02:58.850 --> 03:03.340
Es gab Geschenke und nicht den Wert des Staates, den die Qualität darstellt.

03:03.410 --> 03:06.260
Sie steht für die Qualität der Aktion, die repräsentiert.

03:06.260 --> 03:07.980
OK, ich habe vier Aktionen.

03:08.300 --> 03:10.860
Was sind die verschiedenen Qualitäten dieser Aktion?

03:10.860 --> 03:16.340
Was ist der Wert der Aktion oder die Qualität der Aktion? Welche Aktion ist lukrativer? Ich brauche

03:16.340 --> 03:21.380
eine Metrik, die mir in Ordnung sagt, wie ich diese Aktion quantifiziere und sie dann vergleichen

03:21.380 --> 03:23.200
kann. Genau das ist Q.

03:23.470 --> 03:26.240
Und so hat er vier mögliche Aktionen.

03:26.360 --> 03:29.240
Gehen Sie wie immer nach rechts oder unten.

03:29.240 --> 03:35.480
Und basierend auf der Aktion wird es eine Formel geben, die uns den quantifizierbaren Wert dieser Aktion sagt,

03:35.480 --> 03:38.410
die wir den Q q-Wert dieser Aktion nennen.

03:38.630 --> 03:41.700
Schauen wir uns also an, wie wir diese Formel ableiten.

03:41.710 --> 03:44.510
F Wie ist es tatsächlich mit diesen verbunden?

03:44.510 --> 03:51.290
Wie Sie sich vorstellen können, weil Aktionen zu Zuständen führen, muss eine Verbindung zwischen den beiden

03:51.290 --> 03:51.850
bestehen.

03:51.870 --> 03:56.060
Richtig, wir haben bereits festgelegt, wie das berechnet werden soll, und wir sind ziemlich gut darin.

03:56.060 --> 04:02.030
Wir wissen, wie man die Belman-Gleichung in sehr unterschiedlichen Umgebungen mit vielen verschiedenen Komplikationen verwendet.

04:02.270 --> 04:06.080
Lassen Sie uns dieses Wissen nutzen, um zu verstehen, wie wir jetzt berechnen können.

04:06.080 --> 04:12.170
F Um die gleichen Vorhersagen zu treffen, ändern sich die Umgebungen, wie Sie sich

04:12.500 --> 04:16.530
vorstellen können, nicht, je nachdem, welchen Ansatz wir verwenden.

04:16.550 --> 04:22.130
Daher sollten dieser Ansatz und dieser Ansatz immer das gleiche Ergebnis liefern, weshalb diese beiden

04:22.460 --> 04:24.690
Gründe ein weiterer Grund sind.

04:25.100 --> 04:26.290
Schauen wir uns das mal an.

04:26.300 --> 04:31.280
Hier also unsere Sichtweise, bei der wir nur den Wert eines bestimmten Zustands dieses Zustands oder eines anderen

04:31.280 --> 04:32.260
Zustands betrachten können.

04:32.420 --> 04:37.190
Und hier gehen wir darauf ein, dass wir hier nur die Führung nutzen, denn das ist der aktuelle Zustand.

04:37.190 --> 04:43.730
Daher ist die Terminologie in beiden Gleichungen gleich und hier verwenden wir q als Q Ist der

04:43.790 --> 04:45.520
Staat und die Handlung.

04:45.540 --> 04:51.970
Eine weil Aktion ist aber in welchem Zustand wir diese Aktion ausführen, führen wir diese Aktion im Staat aus.

04:53.000 --> 04:57.230
OK, also werden wir jetzt die Belman-Gleichung für den ersten Ansatz ausreiten, wie

04:57.230 --> 05:06.620
Sie hier sehen, wir haben die Anzahl der Werte oder der Wert eines bestimmten Zustands ist das Maximum der Belohnung, für die Sie eine maximale Wette erhalten auf die

05:07.070 --> 05:08.660
Aktionen haben Sie drei.

05:08.690 --> 05:14.210
In diesem Fall haben Sie tatsächlich vier Aktionen, die sich aus allen möglichen Aktionen dieses Teils,

05:14.210 --> 05:20.090
die wir schon oft gehört haben, maximieren, so dass dies unsere Belohnung ist, wenn wir diese Aktion

05:20.090 --> 05:26.850
in diesem staatlichen Rabatt durchführen, multipliziert mit dem erwarteten Wert des neuen Zustands, dass wir einen erwarteten Wert haben werden,

05:26.850 --> 05:29.420
weil es ein stochastischer Prozess ist.

05:29.420 --> 05:34.460
Wir wissen nicht genau, ob wir hier enden, vielleicht auf der linken Seite

05:34.460 --> 05:36.050
oder der richtigen Wahrscheinlichkeit.

05:36.050 --> 05:38.230
Deshalb stecken diese Wahrscheinlichkeiten in dir.

05:38.240 --> 05:40.290
Also gut, das ist unser Wert.

05:40.350 --> 05:41.150
Und jetzt schauen wir uns mal an.

05:41.150 --> 05:43.530
Q Also wird Q definiert.

05:43.580 --> 05:49.550
Wir werden dies verwenden, um Q zu definieren. Nehmen wir also an, der Agent von diesem Standort aus diesem Status führt

05:49.550 --> 05:50.640
die Aktion aus.

05:50.840 --> 05:54.350
Wozu wird der q-Wert aufgerufen?

05:54.500 --> 05:59.320
Zunächst einmal wollen wir mal sehen, was er als Gegenleistung für diese Aktion bekommt.

05:59.420 --> 06:02.160
Das Erste, was Sie bekommen, ist eine richtige Belohnung.

06:02.360 --> 06:04.180
Weiß keinen Zweifel darüber.

06:04.250 --> 06:09.920
Es wird eine Art Regel geben oder könnte Null sein, aber wir wissen, dass

06:09.920 --> 06:15.770
dieser Verstärkungslernprozess als Ganzes funktioniert, indem einige Städte bestimmte Aktionen aus einem oder zwei Staaten ausführen.

06:15.840 --> 06:17.140
Ich werde das hier hinzufügen.

06:17.480 --> 06:19.680
Und dann werden wir hinzufügen, was wir hinzufügen werden.

06:19.850 --> 06:21.090
Nun, lass uns darüber nachdenken.

06:21.110 --> 06:24.640
Was passiert als nächstes, nachdem er dorthin gegangen ist?

06:24.860 --> 06:32.030
Das nächste, was passiert, ist, dass sich der Agent jetzt in einem bestimmten Zustand befindet und er mit einer Wahrscheinlichkeit von 80 Prozent

06:32.330 --> 06:34.640
oder einer gewissen Wahrscheinlichkeit hier landen könnte.

06:34.730 --> 06:36.670
Aber hier oben genau hier.

06:36.800 --> 06:43.940
Aber wo er jetzt landet, haben wir bereits eine quantifizierte Metrik für den Zustand, in dem er sich befindet.

06:44.210 --> 06:47.100
Und das ist eigentlich der Wert dieses Staates.

06:47.180 --> 06:52.340
Aber weil er in vielen verschiedenen Staaten und drei möglichen Staaten aufkam, müssen wir den erwarteten

06:52.370 --> 06:55.730
Wert des Staates, in dem er sich befindet, betrachten.

06:56.210 --> 06:58.610
Und so werden wir das hinzufügen.

06:58.610 --> 07:04.020
Natürlich ist der Rabattfaktor, den wir zuvor hatten, weil dies irgendwo in der Zukunft liegt.

07:04.190 --> 07:11.210
Und dann werden wir einige von allen möglichen Zuständen über alle möglichen Zustände hinweg hinzufügen, die er durch

07:11.210 --> 07:12.910
diese Aktion beenden könnte.

07:12.910 --> 07:14.240
Bedingungen der Wahrscheinlichkeit.

07:14.240 --> 07:20.150
Was wir hier also sagen, ist OK. Wenn Sie also eine Aktion ausführen, erhalten Sie eine Belohnung plus,

07:20.150 --> 07:22.700
eine quantifizierte Metrik, die Sie erhalten werden.

07:22.730 --> 07:25.820
Du landest in einem Zustand, in dem wir nicht wissen, welcher es hier sein könnte.

07:25.850 --> 07:26.950
Könnte hier sein, könnte es hier sein.

07:27.050 --> 07:32.240
Aber hier ist der erwartete Wert des Staates, in dem Sie landen werden.

07:32.270 --> 07:36.290
Und jetzt multiplizieren wir uns mit dem Abzinsungsfaktor, denn das ist ein Schritt weg.

07:36.380 --> 07:44.180
Das ist also unser Q-Wert für diesen Performance-Bereich. Was Sie hier sofort bemerken werden, ist

07:44.180 --> 07:44.730
das.

07:44.760 --> 07:51.470
Q Der Q-Wert ist eigentlich genau identisch mit dem, was sich hier in diesen Klammern befindet.

07:51.950 --> 07:52.660
Und warum ist das.

07:52.670 --> 07:59.930
Wenn Sie hier darüber nachdenken, nehmen wir das Maximum der Ergebnisse und erhalten das Maximum für alle möglichen Aktionen. Wir

07:59.930 --> 08:04.910
haben also Maßnahmen ergriffen, um das Maximum für alle möglichen Aktionen des Ergebnisses

08:04.910 --> 08:10.500
zu erreichen, die wir erzielen, wenn wir jede dieser Aktionen ausführen und Enqueue definieren wir.

08:10.610 --> 08:11.160
Interessant.

08:11.160 --> 08:14.000
Was bekommen wir durch eine bestimmte Aktion?

08:14.000 --> 08:19.340
Wenn Sie darüber nachdenken, macht es Sinn, den Wert eines Staates zu bestimmen.

08:19.370 --> 08:25.720
Zum Beispiel ist dieser Zustand das Maximum aller möglichen Q-Werte.

08:25.790 --> 08:32.360
In den Bundesstaaten hat der Agent einen Schlüsselwert, um den 3Q-Wert für den q-Wert

08:32.360 --> 08:32.870
beizubehalten.

08:32.870 --> 08:37.760
Also ja positiv für mögliche Q-Werte, während der Wert des Aufenthalts sinnvoll ist,

08:37.760 --> 08:42.460
dass der Wert des Status das Maximum aller dieser vier Schlüsselwerte ist.

08:42.490 --> 08:44.420
Genau das können wir hier sehen.

08:44.420 --> 08:48.060
Das ist eine gute Bestätigung für diese neue Formel, die wir ableiten.

08:48.080 --> 08:53.080
Wenn das nicht der Fall wäre, wenn das nicht passt, dann hätten wir Fragen.

08:53.270 --> 08:55.150
Warum passt es nicht zusammen?

08:55.160 --> 08:57.510
Warum passt es nicht zusammen, wenn.

08:57.690 --> 09:05.810
Der Q-Wert ist eine quantifizierte Messgröße für die Durchführung einer Aktion und V hängt von der Etage ab.

09:05.930 --> 09:12.970
Ist wie das Maximum der möglichen Ergebnisse der vier Aktionen, die er ausführen kann, ist es sinnvoll.

09:12.980 --> 09:21.050
Und das bestätigt die Formel, die wir gerade abgeleitet haben, und wir werden sie jetzt noch interessanter machen.

09:21.080 --> 09:26.620
Wir werden die Wii vollständig loswerden, weil Sie sehen, dass Wii eine rekursive Funktion ist.

09:26.810 --> 09:29.750
So und dann hast du mich und dann B und dann B und dann B und so weiter.

09:29.760 --> 09:35.480
So können Sie diese Sichtweise durch die folgenden Vee's ausdrücken. Die optimalsten werden hier

09:36.150 --> 09:36.830
auftauchen.

09:36.840 --> 09:43.210
Wir erwarten, dass Q als Funk eine rekursive Funktion des ODER als Funktion des nächsten V ist und dann müsstest du dieses V einstecken

09:43.250 --> 09:45.200
und dann kehren wir zum B zurück.

09:45.200 --> 09:51.110
Was wir also tun werden, ist, dass wir dieses V tatsächlich nehmen werden und wir werden es durch

09:51.230 --> 09:54.280
Q Right ersetzen, also schauen wir uns das an.

09:54.930 --> 10:01.410
Wir werden dieses V des nächsten Zustands nehmen und das hier in diese Formel einfügen.

10:01.570 --> 10:07.180
Und wie Sie jetzt sehen können, ändert sich diese Wahrscheinlichkeit nicht.

10:07.180 --> 10:16.950
Aber wie wir gerade besprochen haben, ist das von s das Maximum aller Aktionen von q von S und einem Recht hier.

10:16.990 --> 10:19.180
Das ist es, was wir hier ersetzen werden.

10:19.180 --> 10:24.310
Wir werden also sagen, maximal ist natürlich die neue Aktion die Aktion, die wir durchführen werden, denn

10:24.310 --> 10:26.760
hier haben wir die Wii als Primzahl.

10:26.770 --> 10:30.700
Also hier haben wir jetzt die maximale Konsole zu einer Primzahl.

10:30.700 --> 10:34.510
Die Aktionen, die wir aus diesem Zustand heraus ergreifen werden,

10:34.510 --> 10:41.200
sind also von dem, wo auch immer der andere Staat landet, aber die Aktion, die wir von dort aus unternehmen

10:41.260 --> 10:50.170
werden, und Maxima über alle diese Bereiche hinweg, und das Maximum ist der Wert aller Würfelwerte das sind uns in diesem neuen Staat als Prima eine Primzahl.

10:50.170 --> 10:51.280
Und das ist Aktion.

10:51.280 --> 10:52.140
Also das ist das.

10:52.210 --> 10:53.500
Also werden es noch vier sein.

10:53.500 --> 10:54.530
Q-Werte dort.

10:54.610 --> 10:56.700
Nun, wie Sie sehen können, gehen wir noch einmal durch.

10:57.040 --> 11:02.740
Also, aus was wir dieses Wort ableiten, wäre einfach nur durch Logik und Intuition bedingt, so dass wir erkennen

11:02.740 --> 11:07.400
können, dass VNS tatsächlich Sicht von AS sind und von und A verbunden sind.

11:07.400 --> 11:12.400
Das von S ist das Maximum über alle Aktionen von Cuba S und Sie können hier genau sehen, so dass dieser Teil

11:12.400 --> 11:13.820
mit diesem Teil identisch ist.

11:14.290 --> 11:20.740
Und dann werden wir das nutzen und wir werden dieses Bit durch VNS von hier aus ersetzen, aber nicht diesen

11:20.740 --> 11:25.730
exakten Trichter. Wir werden diesen internen Teil verwenden und ihn mit Kill the Unschuldigen ersetzen.

11:26.080 --> 11:32.920
Wir werden das hier einstecken und dieser Teil wird q von s Prim ein Maximum des Würfels sein, von

11:33.430 --> 11:36.810
Crucell a Priam's von Q As Prime eine Primzahl.

11:37.060 --> 11:39.790
Und jetzt haben wir unsere Formel.

11:39.790 --> 11:46.880
Jetzt haben wir eine rekursive Formel für den q-Wert, so dass der Agent jetzt überlegen kann, welchen Wert der Abschnitt hat.

11:46.890 --> 11:50.310
Welche Qualität dieses Abschnitts war der neue Wert dieser Aktion.

11:50.470 --> 11:56.570
Nun, es hängt von der Belohnung ab, die ich im nächsten Schritt erhalte, und es hängt

11:56.590 --> 12:02.410
von dem abgezinsten Faktor und dem Maximum aller möglichen Q-Aktionen in diesem Zustand ab.

12:02.410 --> 12:06.760
Aber ich weiß nicht, ob ich ihre Seite dazu bringen muss, auch diesen Zustand in diesem

12:06.760 --> 12:12.770
Zustand zu betrachten, und deshalb haben wir hier diesen erwarteten Wert, also haben wir eine gewisse Wahrscheinlichkeit mal das Maximum, das erwartet

12:12.860 --> 12:13.300
wird.

12:13.450 --> 12:18.010
Eine sehr ähnliche Formel, wie Sie sehen können, aber diesmal drücken wir die Dinge

12:18.490 --> 12:27.310
durch die q-Werte aus. Deshalb wird dieser ganze Algorithmus als Kill-Lernen bezeichnet. Dies ist, was betrachtet wird. Dies ist, was die Agenten tatsächlich verwenden, die sie nicht sehen

12:27.310 --> 12:32.020
In den Staaten sehen Sie sich die möglichen Aktionen an und entscheiden dann anhand der

12:32.020 --> 12:35.760
Aktionen des q-Wertes der Aktionen, welche Maßnahmen sie ergreifen sollen.

12:35.760 --> 12:40.330
Sie betrachten also nur den maximalen Q-Wert in diesem Zustand, in dem es vier Aktionen gibt.

12:40.330 --> 12:45.340
Was ist die beste Maßnahme, die zu vergleichen ist, um die verschiedenen Zustände zu vergleichen, in denen

12:45.350 --> 12:51.820
es möglich ist, zu vergleichen, besteht darin, die möglichen Maßnahmen zu vergleichen, die es derzeit hat, indem es herausfindet, dass die optimalen

12:51.820 --> 12:56.830
Maßnahmen getroffen werden, die dann ausgeführt werden Wiederholen Sie diesen Prozess, wiederholen Sie diesen Prozess und so

12:56.860 --> 12:57.440
weiter.

12:57.580 --> 13:03.940
So können Sie nun sehen, wie all dies zusammenkommt, wie die Belohnung der diskontierenden Fakten

13:04.360 --> 13:10.330
oder der stochastischen Marktentscheidungsprozesse und der Werte und der q-Werte zusammenkommen, um diese

13:10.690 --> 13:18.400
eine übermächtige Belman-Gleichung für q-Werte zu finden, die wir nun anwenden können und lassen Sie unsere Agenten lernen,

13:18.400 --> 13:20.410
die Umwelt zu besiegen.

13:20.410 --> 13:23.380
Und das ist eine intuitive Erklärung für das, was los ist.

13:23.380 --> 13:28.510
Ich weiß, dass wir die Formeln durchgearbeitet haben, aber es ist notwendig, denn dies ist

13:28.510 --> 13:34.730
wie unsere Formel, die wir dieses ganze Kapitel durchlaufen haben, und ich denke, es ist ein guter Übergang vom To.

13:34.780 --> 13:43.450
F Und es zeigt, dass es Verbindungen zwischen Yishun gibt. Und wenn Sie einen etwas strengeren mathematischen Ansatz erhalten

13:43.450 --> 13:49.410
möchten und die Mathematik dahinter sehen und etwas mehr über q-Werte und

13:49.420 --> 13:51.600
deren Funktionsweise erfahren möchten.

13:51.640 --> 13:54.090
Dann haben wir noch etwas für Sie.

13:54.130 --> 14:02.980
Dieses Papier nennt sich Markov Decision Process Konzepte und Algorithmen von Martin von Autor Low 2009.

14:02.980 --> 14:09.610
Also schneiden Sie den Link wie immer ab und hier können Sie ein wenig detaillierter nachlesen,

14:09.820 --> 14:15.220
um alle wichtigen Details hinter den Hugh-Werten usw. zu verstehen. Jetzt haben

14:15.220 --> 14:21.660
wir all diese Dinge besprochen, die sich auf die Belman-Gleichung beziehen etwas komplexeres wie dieses Papier

14:21.790 --> 14:27.670
betrachten, wenn wir dazu zusätzliche Informationen erhalten möchten, um ein tieferes Verständnis zu erlangen.

14:27.670 --> 14:34.390
Aber auch wenn Sie keine Zeitung oder kein Radio lesen, sollten Sie ein gutes Wissen darüber haben, worum es beim

14:34.390 --> 14:40.850
Lernen geht und wie die Agenten mit den Handlungen beginnen, die sie in einer bestimmten Umgebung ergreifen müssen.

14:40.870 --> 14:43.980
Ich hoffe, Ihnen gefällt Statoil heute und ich freue mich auf Ihre nächsten.

14:43.990 --> 14:45.360
Bis dahin genießen.

14:45.390 --> 14:45.620
ICH.