WEBVTT

00:00.360 --> 00:06.360
Hallo und herzlich willkommen zum lustigen Tutorial dieses ersten selbstfahrenden Moduls. Es wird episch.

00:06.360 --> 00:11.850
Wir werden unser Umfeld auf die Probe stellen und auf vier verschiedenen Ebenen testen.

00:11.850 --> 00:16.620
Das heißt, wir werden ein Spiel spielen, das vier Schwierigkeitsstufen hat und das Ziel muss

00:16.620 --> 00:18.280
diese vier Stufen bestehen.

00:18.420 --> 00:20.640
Wir werden also diese vier Ebenen sein.

00:20.640 --> 00:27.480
First Level One Die erste Ebene besteht darin, den Flughafen zu erreichen und dann einige Rundfahrten zwischen dem Flughafen

00:27.480 --> 00:29.160
und der Innenstadt durchzuführen.

00:29.340 --> 00:35.430
Sobald wir also sehen, dass das Auto diese Rundfahrten durchführt. Nun passieren wir Level 1, dann wird Level 2

00:35.450 --> 00:37.490
Level 2 diese Rundfahrten noch durchführen.

00:37.560 --> 00:43.290
Aber auf der spezifischen Straße, die wir selbst zeichnen, wird es eine einfache Straße, da es Stufe 2

00:43.290 --> 00:43.840
ist.

00:43.980 --> 00:49.030
Und natürlich muss das Auto auf dieser Straße selbst fahren.

00:49.170 --> 00:53.420
Es wird also eine Straße sein, die vom Flughafen in die Innenstadt und dann in die andere Richtung führt.

00:53.420 --> 00:57.010
Deshalb muss das Auto diese Rundfahrten machen, indem es auf dieser Straße sitzt.

00:57.210 --> 01:00.980
Wenn ja, werden wir Level 2 und Level 3 bestehen.

01:01.030 --> 01:07.410
Level 3 besteht darin, einige Hindernisse auf die Karte zu ziehen, um zu sehen, ob es dem Auto gelingt, die Hindernisse zu umgehen und

01:07.410 --> 01:08.850
trotzdem sein Ziel zu erreichen.

01:08.910 --> 01:12.730
Es gibt also keine Sorgen, die einige schwierige Hindernisse mit sich bringen, die das Auto vermeiden muss.

01:12.930 --> 01:20.010
Und wir werden sehen, ob es gelungen ist, den Flughafen und die Innenstadt zu erreichen, und schließlich ist es das

01:20.010 --> 01:25.380
schwierigste Niveau für das Auto, eine sehr schwierige Straße in die Innenstadt zu ziehen.

01:25.440 --> 01:28.060
Ich weiß nicht, dass Sie wissen, dass es eine Straße wie ein Zickzack sein wird.

01:28.200 --> 01:31.720
Ich bin kein brillanter Architekt, aber ich werde versuchen, einen anspruchsvollen Weg zu finden.

01:31.950 --> 01:37.830
Hoffen wir, dass wir mindestens die erste Stufe bestehen, die großartig wäre, dann hoffen wir, dass wir auch die Stufen zwei

01:37.920 --> 01:39.190
und drei bestehen können.

01:39.420 --> 01:42.180
Und wenn wir Level 4 bestanden hätten, wäre das wunderbar.

01:42.180 --> 01:44.540
Also lass uns das machen, lass uns die Herausforderung annehmen.

01:44.610 --> 01:49.840
Tatsächlich wird das selbstfahrende Auto die Herausforderung annehmen, aber wir sind die Köpfe dahinter.

01:49.860 --> 01:52.110
Sagen wir also, wie das funktioniert.

01:52.110 --> 01:57.280
Also gut, das Erste, was ich tun werde, ist, Sie kurz an die Karte zu erinnern.

01:57.330 --> 01:59.060
Das ist also die Karte.

01:59.190 --> 02:03.810
Zuerst wollen wir uns die Karte anschauen, auf die wir uns das selbstfahrende Auto anschauen, ohne dass

02:04.020 --> 02:09.540
die KI dazu kommt. Es wird nur ein Auto mit den zufälligen Aktionen sein, die Sie zu Beginn dieses Modells gesehen haben.

02:09.600 --> 02:10.970
Wie können wir uns das anschauen?

02:11.040 --> 02:15.330
Nun, wir müssen die KI und die Aktivität deaktivieren.

02:15.570 --> 02:19.590
Wir müssen einfach eine Temperatur gleich Null setzen.

02:19.620 --> 02:22.380
Denken Sie daran, dass der Parameter hier die Temperatur ist.

02:22.560 --> 02:24.240
Und jetzt sind es gleich sieben.

02:24.300 --> 02:25.830
Das ist eine niedrige Temperatur.

02:25.830 --> 02:27.280
Wir werden das später erhöhen.

02:27.510 --> 02:32.700
Aber wenn wir nicht wollen, dass das Auto ein Gehirn hat, das heißt, wenn wir die KI nicht

02:32.700 --> 02:36.210
aktivieren wollen, müssen wir einfach die Temperatur auf Null gleich Null setzen.

02:36.210 --> 02:39.980
Und das gleiche gilt natürlich auch für die Kälte.

02:39.990 --> 02:40.460
Da gehen wir.

02:40.470 --> 02:45.580
Und dann dürfen wir nicht vergessen zu sagen, weil sonst die Änderung nicht mit einbezogen wird.

02:45.800 --> 02:47.120
Ich denke jetzt haben wir keine.

02:47.130 --> 02:49.210
Ich sehe, ich habe es aktiviert.

02:49.260 --> 02:53.180
Schauen wir uns die Karte an, um uns eine kurze Auffrischung zu verschaffen.

02:53.220 --> 02:55.370
Eine kurze Erinnerung, wie es aussieht.

02:55.530 --> 03:01.070
Also werde ich alles auswählen und die Eingabetaste drücken.

03:01.090 --> 03:01.630
Gut.

03:01.630 --> 03:03.840
Und da ist unsere Karte und da ist unser Auto.

03:03.880 --> 03:09.540
Wenn Sie also sehen, dass das Auto völlig zufällige Aktionen hat, wissen

03:09.540 --> 03:16.480
Sie, dass Sie links abbiegen, um direkt nach rechts zu fahren, und daher nicht den Flughafen

03:16.870 --> 03:17.500
erreichen.

03:17.550 --> 03:18.410
Nun tat es einfach.

03:18.470 --> 03:20.230
Das ist völlig zufällig.

03:20.230 --> 03:26.680
Sie sehen es gerade jetzt am Flughafen und erreicht nicht das andere Ziel, das sich in der Innenstadt unten rechts

03:26.680 --> 03:28.220
auf der Karte befindet.

03:28.480 --> 03:34.030
Wir waren also genau wie hier, aber wir können jetzt klar erkennen, dass die Aktionen völlig zufällig sind.

03:34.030 --> 03:40.270
Es geht nirgendwohin und es gibt definitiv keine künstliche Intelligenz, aber keine Sorgen.

03:40.270 --> 03:42.080
Wir werden es jetzt aktivieren.

03:42.370 --> 03:49.480
Ich werde die Map schließen und dann den Kernel-Neustart von DeCarlo neu starten.

03:49.760 --> 03:52.390
Sie klicken hier auf diese Schaltfläche und dann auf Ja.

03:52.820 --> 04:00.730
Und jetzt ist es Zeit für die Show, dass wir diesen Zug endlich ins Auto setzen und die KI

04:00.730 --> 04:01.350
aktivieren.

04:01.700 --> 04:04.090
Ich bin total gespannt, was passieren wird.

04:04.180 --> 04:10.730
Wir werden jetzt die Luft aktivieren und dazu müssen wir die Temperatur erhöhen, um die Temperatur zu

04:10.730 --> 04:17.300
ändern, die durch Null ersetzt wird. Lassen Sie uns mit sieben beginnen, wie wir es vorher getan haben.

04:17.450 --> 04:19.660
Geben wir also hier sieben an.

04:19.670 --> 04:21.510
Okay, vergessen wir nicht zu sagen.

04:21.590 --> 04:26.870
Und jetzt kommen wir zurück zu unserer Map und jetzt können wir das noch einmal ausführen, weil wir den Kernel

04:26.870 --> 04:27.790
neu gestartet haben.

04:27.890 --> 04:29.470
Sagen wir es also.

04:29.990 --> 04:31.790
Und da haben wir das Auto.

04:31.790 --> 04:33.600
Und was macht es?

04:33.890 --> 04:41.180
Nun, es versucht, seinen Weg zu finden, um herauszufinden, was es zu tun hat, und es geht darum,

04:41.180 --> 04:47.900
den Flughafen zu erreichen. Dort gehen wir zuerst wunderbar weiter und jetzt ist es das nächste Ziel,

04:48.140 --> 04:50.540
in die Innenstadt zu gelangen.

04:50.810 --> 04:56.750
Und jetzt ist es der Versuch, den Flughafen wieder zum Flughafen zu finden und dort gibt es wieder Wonderfalls,

04:56.750 --> 04:57.450
die funktionieren.

04:57.470 --> 05:03.200
Es hat nicht lange gedauert, bis man erkundet hat, aus welchen Fehlern man weiß, dass der Fehler hier

05:03.200 --> 05:04.380
von vorne kommt.

05:04.520 --> 05:08.770
Dort bestrafen wir das Auto, indem wir ihm eine leicht negative Belohnung geben.

05:08.780 --> 05:10.270
Sie wissen, dass es minus 0 ist. 2

05:10.550 --> 05:16.760
So lernte es aus diesem Fehler und durch das Lernen aus diesem Fehler gelang es ihm, die positiven Belohnungen zu erzielen,

05:17.000 --> 05:18.980
indem es dem Ziel näher kam.

05:19.310 --> 05:21.940
Und jetzt hat es endlich verstanden, was es zu tun hat.

05:21.980 --> 05:28.530
Es ist auf jeden Fall den Flughafen und dann die Innenstadt zu erreichen und dann diese Rundfahrten zu machen.

05:28.550 --> 05:29.970
Das ist perfekt.

05:29.990 --> 05:36.090
Wir haben ein selbstfahrendes Auto, aber ich kann nicht anders als zu bemerken, dass es wie ein Insekt aussieht.

05:36.170 --> 05:38.510
Das Auto scheint sich nicht wirklich sicher zu sein.

05:38.510 --> 05:40.610
Nein, es hat keine sehr zuversichtliche Bewegung.

05:40.610 --> 05:44.570
Es ist wie bei Ihrem linken und rechten, das sich nicht wie eine Autobewegung bewegt.

05:44.660 --> 05:46.090
Es sieht eher nach einem Fehler aus.

05:46.490 --> 05:47.820
Also werden wir das beheben.

05:47.930 --> 05:54.560
Wie Sie vielleicht schon gedacht haben, ist die Temperatur zu erhöhen, denn die Temperatur ist der

05:54.560 --> 05:59.690
Parameter in der Soft-Mac-Funktion, den wir erhöhen können, damit die Aktion sicherer

05:59.690 --> 06:00.730
zurückgegeben wird.

06:00.830 --> 06:05.630
Das macht also Sinn, dass wir, wenn wir die Temperatur erhöhen, am Ende ein sichereres

06:05.630 --> 06:09.750
Auto bekommen, weil die KI sicherer ist, welche Aktion sie ausführen soll.

06:10.220 --> 06:15.350
Denken Sie daran, dass die Aktion mit einer höheren Wahrscheinlichkeit gespielt wird.

06:15.350 --> 06:20.780
Das einzige Problem bei dieser Temperaturerhöhung ist, dass die KI weniger die anderen

06:20.780 --> 06:26.380
Aktionen untersucht, weil die Temperatur der anderen Aktionen erhöht wird, da die Wahrscheinlichkeit geringer ist.

06:26.380 --> 06:31.760
Im Moment scheint das aber kein Problem zu sein, denn das Auto scheint kein Problem zu haben, um seine Ziele

06:31.760 --> 06:32.310
zu erreichen.

06:32.420 --> 06:38.840
Der Flughafen in die Innenstadt, also können wir die Temperatur total erhöhen, wenn wir dieses Ding haben wollen, das aussieht, als

06:38.840 --> 06:41.140
ob ein Insekt wie ein Auto aussieht.

06:41.390 --> 06:42.620
Also lass uns das tun.

06:42.620 --> 06:45.530
Ich werde das jetzt schließen.

06:45.530 --> 06:46.370
Da gehen wir.

06:46.370 --> 06:48.310
Starten Sie den Kernel erneut.

06:49.430 --> 06:50.590
Und drücken Sie Ja.

06:50.830 --> 06:52.810
Und jetzt erhöhen wir die Temperatur.

06:53.200 --> 06:54.090
Also lass uns das tun.

06:54.100 --> 07:02.170
Ich gehe zurück zu meiner Akte und ersetze sie dann durch sieben. Dann gehen wir.

07:02.340 --> 07:03.410
Dann sparen wir.

07:03.720 --> 07:07.890
Und jetzt haben wir ein selbstfahrendes Auto.

07:07.890 --> 07:11.990
Wir können also bessere Ergebnisse erzielen und etwas erhalten, das eher wie ein Auto aussieht.

07:12.270 --> 07:15.780
Lass uns eine Karte nehmen und dann noch einmal dazu.

07:16.610 --> 07:18.900
Alles klar was passiert ist.

07:18.920 --> 07:19.730
OK.

07:19.830 --> 07:21.340
Es war eine Art Burnout.

07:21.350 --> 07:22.190
Nicht sicher warum.

07:22.310 --> 07:25.980
Aber jetzt haben wir etwas, das eher wie ein Auto aussieht.

07:26.060 --> 07:28.240
Sie können sehen, dass es geradeaus geht.

07:28.240 --> 07:31.190
Diese schnellen linken und rechten Bewegungen werden nicht ausgeführt.

07:31.190 --> 07:36.410
Das liegt daran, dass das Auto jetzt sicherer ist, in welche Richtung es gehen soll, und jedes Mal, wenn

07:36.410 --> 07:40.720
Sie wissen, dass es die beste Richtung zum Flughafen und dann zur Innenstadt nehmen möchte.

07:41.000 --> 07:44.490
Wir können also klar sagen, dass wir die erste Stufe bestanden haben.

07:44.510 --> 07:47.840
Das Auto macht diese Rundfahrten zwischen dem Flughafen und der Innenstadt.

07:47.990 --> 07:52.610
Wir werden also das retten, das ich Ihnen zeigen werde, wie Sie das Gehirn retten können.

07:52.610 --> 07:59.520
Wir müssen nur auf diese Speichern-Schaltfläche klicken und sehen, was hier passiert.

07:59.520 --> 08:04.640
Nun, wir haben die Kurve der wir waren am Anfang wir können einige Fehler beobachten, die es gemacht hat.

08:04.740 --> 08:06.990
Also ist die Belohnung negativ.

08:07.170 --> 08:14.280
Dann lernte es aus seinen Fehlern und die Belohnung stieg allmählich an, bis eine konstante

08:14.280 --> 08:19.100
positive Belohnung erreicht wurde, die einer offenen Belohnung gleichkam.

08:19.200 --> 08:21.640
Und das ist so, weil es am Ende erforscht wurde.

08:21.870 --> 08:23.490
Das ist die Auslaufphase.

08:23.670 --> 08:26.200
Und dann wusste es einfach, was es tun musste.

08:26.230 --> 08:32.230
Dort hat es diese Runde rund um Rountree zwischen dem Flughafen und der Innenstadt ohne Fehler gemacht.

08:32.640 --> 08:33.450
Also los geht's.

08:33.450 --> 08:34.470
Wir haben Level 1 bestanden.

08:34.470 --> 08:35.850
Herzliche Glückwünsche.

08:35.850 --> 08:38.170
Jetzt lassen Sie uns die Dinge herausfordern.

08:38.190 --> 08:40.120
Nehmen wir die Dinge auf die nächste Ebene.

08:40.140 --> 08:45.810
Lassen Sie uns versuchen, ein Niveau zu passieren, an das ich Sie erinnern möchte, dass wir diese Rundfahrten auf einer bestimmten Straße unternehmen.

08:45.830 --> 08:47.060
Wir werden uns zeichnen.

08:47.120 --> 08:49.170
Also, lass uns das im nächsten eine Mühe machen.

08:49.200 --> 08:50.780
Und bis dahin ich
