WEBVTT

00:00.300 --> 00:02.930
Hallo und willkommen zu diesem Python-Tutorial.

00:02.940 --> 00:08.700
In Ordnung, also bauen wir einfach die Architektur eines neuronalen Netzwerks mit der Funktion unserer Netzwerkklasse auf

00:09.030 --> 00:13.650
und dann werden wir eine zweite Funktion erstellen, die die Vorwärtsfunktion sein wird

00:13.650 --> 00:15.810
und die Neuronen aktivieren wird.

00:15.840 --> 00:19.770
Dies ist die Funktion, die für die Ausbreitung ausgeführt wird.

00:19.830 --> 00:27.240
Also machen wir das. Lass uns diese Funktion machen, lass es uns vorwärts nennen, wie wir gerade gesagt haben, und

00:27.240 --> 00:29.550
diese Funktion wird zwei Argumente annehmen.

00:29.610 --> 00:35.070
Erstens ist es wie üblich, dass Sie wissen, dass Sie die Variablen des Objekts verwenden können, da

00:35.070 --> 00:37.400
wir dazu SE1 NFC verwenden werden.

00:37.500 --> 00:43.440
Wir brauchen also das Ich, um diese Variablen verwenden zu können, und dann brauchen wir ein

00:43.590 --> 00:50.100
zweites Argument, das unsere Eingabe ist, und wir nennen es "state", weil state genau die Eingabe unserer neuronalen Netzwerke

00:50.100 --> 00:50.580
ist.

00:50.580 --> 00:51.980
Sie wissen, das sind die Staaten.

00:51.990 --> 00:57.320
Es gibt andere Eingänge, die in das neuronale Netzwerk eingehen, und als Ausgänge werden die q-Werte der

00:57.330 --> 01:00.560
drei möglichen Aktionen nach links oder nach rechts gehen.

01:00.690 --> 01:06.210
Wir müssen es jedoch nicht als Argument vorbringen, denn genau das, was wir zu

01:06.210 --> 01:11.880
dieser Vorwärtsfunktion zurückkehren möchten, aktiviert nicht nur die Neuronen, sondern auch und sie liefern meistens

01:11.880 --> 01:16.640
die Cube-Werte für jede mögliche Aktion abhängig von der Eingabezustand hier.

01:16.650 --> 01:17.060
Gut.

01:17.100 --> 01:19.000
Das sind also die zwei Argumente, die wir brauchen.

01:19.140 --> 01:24.440
Gehen wir nun in die Funktion und geben Sie an, was wir tun wollten.

01:24.740 --> 01:29.940
OK, das erste, was wir tun werden, ist die Aktivierung der verborgenen Neuronen und wir werden die

01:29.940 --> 01:34.690
verborgenen Neuronen durch die Variable x nennen, so dass x die verborgenen Neuronen darstellt.

01:34.800 --> 01:36.750
Und so, wie man sie aktiviert.

01:36.930 --> 01:39.990
Natürlich nehmen wir unsere Input-Neuronen.

01:40.170 --> 01:45.360
Wir werden unsere erste vollständige Verbindung verwenden, wenn Sie die versteckten Neuronen erhalten möchten,

01:45.360 --> 01:49.570
und dann die Inaktivierungsfunktion anwenden, die die korrigierte Funktion ist.

01:49.860 --> 01:51.450
Wie wirst du das tun?

01:51.450 --> 01:54.680
Denken Sie daran, dass wir die Fackel importiert haben.

01:54.730 --> 02:01.450
Dieses Funktionsmodul enthält alle Funktionen, um das neuronale Netzwerk zu implementieren.

02:01.560 --> 02:02.960
Und wir gaben die Abkürzung.

02:03.450 --> 02:08.130
Also, was wir jetzt tun werden, ist, dass wir eine dieser Funktionen aus dem

02:08.130 --> 02:11.240
Funktionsmodul verwenden und diese Funktion soll wirklich funktionieren.

02:11.430 --> 02:16.490
Was wirklich relevant ist, ist die Gleichrichterfunktion, die Sie in den Intuitionsvorlesungen gesehen haben.

02:16.620 --> 02:19.040
Das ist einfach so und dann die Gleichrichterfunktion gegeben.

02:19.170 --> 02:26.130
Da diese Funktion jedoch von der Funktion übernommen wird, in der die Abkürzung gegeben wurde, müssen

02:26.130 --> 02:31.860
wir hier zuerst die Gedanken eingeben und dann können wir diese Funktion übernehmen.

02:31.990 --> 02:36.610
Und wenn ich tippe, sind wir hier, wir haben die eigentliche Funktion.

02:36.630 --> 02:41.980
Das ist also eine Funktion, die die verborgenen Neuronen aktiviert, nämlich x.

02:42.030 --> 02:47.640
In dieser Funktion verstehen wir nun vollkommen, was wir eingeben müssen, nämlich die Neuronen, die

02:47.640 --> 02:48.920
wir aktivieren möchten.

02:48.990 --> 02:54.300
Das sind die versteckten Neuronen, und um diese versteckten Neuronen zu erhalten, nehmen wir

02:54.520 --> 03:01.540
unsere erste vollständige Verbindung, die wir auf unsere Eingangsneuronen anwenden, um von den Eingangsneuronen zu den Neuronen zu gelangen.

03:01.800 --> 03:04.450
Nehmen wir also unsere erste vollständige Verbindung.

03:04.620 --> 03:08.070
Aber unsere erste vollständige Verbindung ist eine Variable unseres Objekts.

03:08.130 --> 03:12.070
Deshalb müssen wir hier zuerst selbst eingeben.

03:12.120 --> 03:13.550
FC eins hier gehts.

03:13.620 --> 03:16.660
Dies ist die erste vollständige Verbindung unseres neuronalen Netzwerks.

03:16.980 --> 03:22.890
Innerhalb dieser persönlichen Verbindung werden wir unsere Eingabezustände eingeben, um von den Eingabe-Neuronen zu den verborgenen

03:23.010 --> 03:24.210
Neuronen zu gelangen.

03:24.480 --> 03:30.680
Und da wir ihm den Namen STATE gegeben haben, haben wir zwei Eingabestatus.

03:30.720 --> 03:34.360
Wir bekommen jetzt aktivierte versteckte Neuronen.

03:34.510 --> 03:35.000
Gut.

03:35.040 --> 03:40.610
Und jetzt, da wir die verborgenen Neuronen haben, werden wir die Ausgabeneuronen zurückgeben.

03:40.640 --> 03:46.240
In der nächsten Zeile und wie Sie es verstanden haben, entsprechen die Ausgabeneuronen unseren Handlungen.

03:46.370 --> 03:48.170
Dies sind jedoch nicht die Aktionen direkt.

03:48.290 --> 03:55.760
Dies sind die q-Werte, da wir ein digitales Modell erstellen, das ein tieferes Modell zum Q-Lernen kombiniert. Daher verwenden wir q-Lernen

03:56.020 --> 04:02.090
hier, um die q-Werte für jede unserer Aktionen zu erhalten, und verwenden später gesäubertes Max oder in

04:02.090 --> 04:09.560
unserem Max werden wir dies tun Holen Sie sich die endgültige Aktion, so dass hier der Voivode, den ich gerade einführen

04:09.560 --> 04:13.560
möchte, der APA-Nuance entspricht und da die Ausgabeneuronen die Schlüsselwerte sind.

04:13.640 --> 04:15.590
Nun, ich werde diese Variable nennen.

04:15.590 --> 04:24.630
Q Das bedeutet, dass wir zu q-Werten gehen und jetzt direkt unsere Nahrungsverbindung nehmen, die die Variable ist.

04:24.810 --> 04:27.010
Um eine Variable aus unserem Objekt zu setzen.

04:27.020 --> 04:33.830
Wir nehmen hier das selbstlernende F C mit und geben hier natürlich die Neuronen der linken Seite dieser

04:34.010 --> 04:34.860
Verbindung ein.

04:34.910 --> 04:38.050
Das ist es, was wir aus der ersten Zeile bekommen haben, nämlich x.

04:38.270 --> 04:40.770
Also x Da gehen wir hin.

04:40.790 --> 04:42.650
Wir erhalten jetzt unsere Q-Werte.

04:42.680 --> 04:45.790
Das sind die Ausgangsneuronen unseres neuronalen Netzwerks.

04:46.100 --> 04:46.800
OK.

04:47.060 --> 04:53.050
Und dann wird die letzte Codezeile natürlich verwendet, um diese Werte zurückzugeben.

04:53.210 --> 05:02.900
Also müssen wir nur einen Return und einfach Q-Werte hinzufügen, und das gibt die Schlüsselwerte

05:02.900 --> 05:06.310
für jede mögliche Aktion zurück.

05:06.370 --> 05:06.760
Gut.

05:06.760 --> 05:08.370
Also herzlichen Glückwunsch.

05:08.370 --> 05:13.720
Wir sind mit unserer ersten Klasse fertig und tatsächlich haben wir die Architektur des neuronalen Netzwerks fertiggestellt.

05:13.720 --> 05:15.550
Denken Sie daran, dass dies nicht abgeschlossen ist.

05:15.550 --> 05:19.890
Sie können die Architektur des neuronalen Netzwerks immer verbessern, indem Sie verschiedene ausprobieren.

05:20.020 --> 05:22.780
Fühlen Sie sich also frei, indem Sie hier weitere Neuronen hinzufügen.

05:22.780 --> 05:28.270
Wenn Sie beispielsweise 50 versteckte Neuronen hinzufügen möchten, können Sie einfach die 30 hier und die

05:28.270 --> 05:34.860
30 hier durch 50, 50 und 50 ersetzen. Anschließend können Sie weitere verborgene Ebenen hinzufügen, indem Sie nützliche Verbindungen herstellen.

05:34.990 --> 05:37.630
Nun, das ist wirklich die Aufgabe eines Künstlers.

05:37.660 --> 05:41.980
Es gibt keine allgemeine Regel für die beste Architektur in jeder Situation.

05:42.040 --> 05:43.720
Deshalb müssen wir experimentieren.

05:43.940 --> 05:50.140
Lassen Sie uns damit versuchen, Sie werden sehen, dass wir irgendwann ein ziemlich gutes selbstfahrendes Auto bekommen.

05:50.170 --> 05:50.590
Gut.

05:50.620 --> 05:55.960
Und jetzt machen wir die nächste Klasse, in der es um die Wiederholung von Erfahrungen geht, und wir werden diese in den

05:55.990 --> 05:57.450
nächsten drei bis zwei Stunden machen.

05:57.610 --> 05:59.080
Bis dahin genießen Sie die KI.