WEBVTT

00:00.510 --> 00:02.990
Hallo und willkommen zu diesem Python-Tutorial.

00:03.240 --> 00:08.400
Nun gut, jetzt machen wir die Vorwärtsfunktion, die die Ausgangssignale unseres Gehirns an den Körper der

00:08.400 --> 00:13.550
KI weiterleitet, so dass er die richtige Aktion spielt, um die Weste zu erreichen.

00:13.770 --> 00:20.100
Aber es gibt noch keine Reaktion, weil es noch keine Schulung gibt, die wir noch

00:20.100 --> 00:25.920
nicht trainiert haben. Aber genau das werden wir tun, um tiefes Faltungscurin zu

00:25.920 --> 00:29.720
implementieren, das ich übrigens in Kaltary umbenennen will.

00:29.940 --> 00:35.340
Aber jetzt müssen wir das Signal von der Ausgabeschicht des Gehirns an den Körper weiterleiten.

00:35.370 --> 00:40.170
Und genau das tun wir mit dieser Vorwärtsfunktion, der letzten Funktion unseres

00:40.170 --> 00:40.670
Körpers.

00:41.420 --> 00:42.860
Also lass uns das tun.

00:42.860 --> 00:50.140
Wir fangen mit Teff an und nach Ihrer Meinung, welche Argumente wird es bringen.

00:50.330 --> 00:55.030
Nun, es wird erst Kraft und dann ist da noch eine Kraft.

00:55.220 --> 00:56.740
Nun ja, das gibt es.

00:56.870 --> 00:58.140
Und was wird es sein?

00:58.310 --> 01:04.700
Nun, natürlich möchten wir das Ausgangssignal des Gehirns an den Körper weiterleiten und daher ist

01:04.700 --> 01:07.470
das Eingangssignal das Ausgangssignal des Gehirns.

01:07.850 --> 01:10.480
Und so müssen wir nun diesen äußeren Signalen einen Namen geben.

01:10.610 --> 01:14.390
Ich füge hier also das Argument hinzu.

01:14.460 --> 01:21.200
Also gut, das entspricht den Ausgangssignalen des Gehirns, nachdem sich die Eingangsbilder durch das gesamte Gehirn hindurch ausgebreitet haben,

01:21.200 --> 01:26.540
um später den Ausgang zu erreichen, wobei X durch die Vorwärtsfunktion des Gehirns zurückgegeben

01:26.540 --> 01:27.170
wird.

01:27.380 --> 01:32.480
Nun wird dieses Ausgangssignal des Gehirns mit dieser neuen Vorwärtsfunktion, die wir in der

01:32.480 --> 01:35.410
nächsten Klasse machen, an den Körper weitergeleitet.

01:35.460 --> 01:41.760
Also, machen wir das. Lassen Sie uns hier und jetzt etwas Farbe hinzufügen. Wenn Sie es verstanden haben, werden wir die nächste

01:41.870 --> 01:43.940
Methode verwenden, um die Aktion abzuspielen.

01:43.940 --> 01:49.820
Das bedeutet, dass der Körper unserer KI nach dem Empfang der Ausgangssignale des Gehirns die Aktionen mit

01:49.820 --> 01:51.440
der nächsten Technik spielt.

01:51.440 --> 01:56.510
Grundsätzlich müssen wir also jetzt genau das tun, was wir für das Auto gemacht haben.

01:56.600 --> 01:59.390
Wir werden unsere Verteilung der Wahrscheinlichkeiten erhalten.

01:59.540 --> 02:05.960
Das ist der erste Schritt und dann werden wir eine Aktion anhand dieser Wahrscheinlichkeitsverteilung testen.

02:05.960 --> 02:11.510
Im Grunde können wir also unsere selbstfahrende Fahrzeugdatei und das Einfügen von Paste

02:11.510 --> 02:14.570
für das Select-Funktion-Funktionieren des selbstfahrenden Fahrzeugs abrufen.

02:14.810 --> 02:15.700
Aber lass es uns nochmal tun.

02:15.710 --> 02:19.710
Es wird eine gute Praxis sein und Sie können versuchen, es vor mir zu tippen.

02:20.150 --> 02:23.870
OK, zuerst müssen wir unsere Wahrscheinlichkeiten erhalten.

02:23.870 --> 02:29.930
Ich erinnere daran, dass dies eine Verteilung der Wahrscheinlichkeiten für jeden der q-Werte ist, die vom Eingabebild

02:29.960 --> 02:31.790
und von jeder Aktion abhängen.

02:31.790 --> 02:38.120
Wir haben also einen Schlüsselwert für jede der sechs oder sieben möglichen Aktionen, und daher erhalten wir eine Verteilung von

02:38.120 --> 02:43.600
sieben Wahrscheinlichkeiten und dann von 7, weil ich denke, dass es sieben statt sechs Aktionen gibt.

02:43.670 --> 02:50.010
Neben dem Bewegen für Links-Rechts oder Schießen können wir auch ausführen, dass sieben mögliche Aktionen

02:50.420 --> 02:57.260
möglich sind. Daher erhalten wir eine Verteilung von sieben Wahrscheinlichkeiten, eine für jeden mit jeder Aktion verbundenen q-Wert.

02:57.260 --> 02:58.930
Also ist Propst gleich.

02:59.040 --> 03:00.670
Und jetzt erinnere dich daran, was wir tun mussten.

03:00.860 --> 03:06.650
Grundsätzlich müssen wir die gesaugte Max-Funktion des Funktionsmoduls verwenden.

03:06.680 --> 03:13.010
Das ist sehr einfach, wir nehmen zuerst unser Funktionsmodul, dann das und dann unsere nächste

03:13.130 --> 03:13.700
Funktion.

03:13.700 --> 03:14.480
Hier ist es.

03:14.570 --> 03:22.430
Wir drücken die Eingabetaste und jetzt setzen wir die Argumente der nächsten Funktion, an die ich erinnere, die Elemente, für die

03:22.430 --> 03:25.290
Sie eine Verteilung von Wahrscheinlichkeiten erstellen möchten.

03:25.550 --> 03:30.560
Und das sind natürlich die q-Werte, die die Ausgänge des neuronalen Netzwerks sind.

03:30.680 --> 03:35.830
Das ist die Ausgabe des neuronalen Netzwerks, für das Sie eine Verteilung der Wahrscheinlichkeiten erstellen möchten.

03:35.990 --> 03:41.270
Erinnern wir uns nun daran, dass wir diese Verteilung der Wahrscheinlichkeiten erstellen möchten, um die verschiedenen

03:41.270 --> 03:45.760
Aktionen erkunden zu können, anstatt direkt diejenige auszuwählen, die den maximalen Q-Wert hat.

03:46.010 --> 03:51.020
Wenn wir direkt diejenige auswählen, die den maximalen Q-Wert hat, werden die anderen Aktionen nicht viel untersucht und

03:51.350 --> 03:52.650
wir könnten etwas übersehen.

03:52.880 --> 03:58.760
Aber mit dieser ausgereiften nächsten Methode können wir etwas mehr erforschen und finden daher möglicherweise versteckte Lösungen in

03:58.760 --> 04:01.520
den Mustern, die möglicherweise viel besser sind.

04:01.850 --> 04:08.060
Also empfehle ich wieder Sachen Nax und dann müssen wir ab jetzt die Werte eingeben, die

04:08.060 --> 04:09.560
hier ausgegeben werden.

04:09.560 --> 04:13.860
Die Ausgaben unseres Gehirns geben so aus, dass wir gehen.

04:13.970 --> 04:21.710
Aber dann haben wir diesen Temperaturparameter, den wir verwenden können, um die Erkundung anzupassen.

04:21.710 --> 04:28.130
Bedenken Sie, dass je höher die Temperatur eingestellt wird, desto weniger wird die Erforschung der anderen Aktionen durchgeführt, da

04:28.130 --> 04:33.260
die beste Aktion mit einer höheren Wahrscheinlichkeit ausgewählt wird, im Gegensatz zu den anderen

04:33.260 --> 04:35.910
Aktionen, die mit niedrigeren Wahrscheinlichkeiten ausgewählt werden.

04:35.930 --> 04:42.620
Das ist genau wie bei einem Auto und deshalb müssen wir die Ausgabe hier mit

04:43.010 --> 04:51.800
unserem Temperaturparameter multiplizieren, damit wir jetzt perfekt werden. Jetzt erhalten wir eine kleine Warnung, weil wir noch keine Preps verwendet haben,

04:51.810 --> 04:53.220
aber jetzt verwenden.

04:53.260 --> 04:55.540
Und das bringt uns zum nächsten, was wir tun müssen.

04:55.540 --> 04:57.750
Wie werden wir diese Wahrscheinlichkeiten nutzen?

04:57.910 --> 05:04.390
Nun, wir werden die abschließende Aktion aus dieser Verteilung der Wahrscheinlichkeiten abtasten. Daher

05:04.990 --> 05:10.960
müssen wir die Aktion nun anhand der Multinomialfunktion anhand dieser Verteilung der

05:10.960 --> 05:12.080
Wahrscheinlichkeiten abfragen.

05:12.370 --> 05:15.030
Jetzt sind wir bereit, unser Handeln zu erreichen.

05:15.190 --> 05:20.500
Also erstelle ich hier einen neuen Voivode, da dies zu Aktionen werden wird, die der Körper unserer

05:20.500 --> 05:21.490
KI spielen wird.

05:21.520 --> 05:30.330
Und so nehmen wir nun unsere Verteilung von Wahrscheinlichkeits-Probs, denen wir Punkte hinzufügen, und dann die

05:30.880 --> 05:31.480
Multi-Normal-Methode.

05:32.220 --> 05:38.030
Alles klar und jetzt bekommen wir unsere letzten Aktionen, die wir dort zusammengestellt haben.

05:38.430 --> 05:39.570
Okay, perfekt.

05:39.570 --> 05:42.300
Nun waren wir bereit, das zurückzugeben, was wir wollen.

05:42.360 --> 05:44.450
Das ist die Aktion, die gespielt werden muss.

05:44.670 --> 05:48.720
Und das sind natürlich Handlungen und jetzt sollte die Warnung verschwinden.

05:48.840 --> 05:50.440
Wir nutzen alles was wir wollen.

05:50.460 --> 05:51.270
Da gehen wir.

05:51.270 --> 05:52.020
Perfekt.

05:52.210 --> 05:53.950
Nun ist die Vorwärtsfunktion bereit.

05:54.080 --> 05:55.740
Und herzlichen Glückwunsch.

05:55.800 --> 05:57.300
Der Körper ist auch bereit.

05:57.540 --> 05:59.070
Jetzt haben wir unser Gehirn.

05:59.190 --> 06:05.760
Wir haben unseren Körper und deshalb sind wir bereit, sie zusammenzubauen, um die zukünftige KI zu unserer zukünftigen KI zu machen. Ich werde

06:05.760 --> 06:08.900
aus nichts anderem als einem Gehirn und einem Körper bestehen.

06:08.970 --> 06:14.160
Und so ist es das, was über Intelligenz und einen Körper verfügt, um die Aktionen auszuführen, die

06:14.160 --> 06:16.610
dank ihrer Intelligenz die richtigen Aktionen sind.

06:16.620 --> 06:22.060
Aber denken Sie daran, bevor wir seine Intelligenz trainieren müssen, und das tun wir zum Teil auch, um

06:22.070 --> 06:25.180
das Auge mit dem konvolutionellen coolen Lernen zu trainieren.

06:25.200 --> 06:25.500
Gut.

06:25.500 --> 06:28.470
Also machen wir die KI in den nächsten Mühen.

06:28.490 --> 06:31.810
Ich denke, es wird wieder eine Klasse von zwei Funktionen sein.

06:31.950 --> 06:34.510
Und so erfordert dieses zwei oder drei Tutorials.

06:34.680 --> 06:35.660
Ich kann es kaum erwarten.

06:35.670 --> 06:36.780
Das wird spannend.

06:36.780 --> 06:37.930
Und bis dahin ich