WEBVTT

00:00.330 --> 00:02.320
Hallo und herzlich willkommen zur Geschichte.

00:02.460 --> 00:09.240
Nun gut, nachdem wir diese vier Windungen und das LCN gemacht haben, haben wir nun einen verschlüsselten Zustand, der die Eingabe

00:09.240 --> 00:14.500
dieser beiden neuronalen Netzwerke sein wird, die wir für den Schauspieler und den Kritiker machen werden.

00:14.790 --> 00:20.730
Und davon zu reden, das einzige, was wir jetzt tun müssen, ist die Erstellung von Werkzeugen in unseren vollständigen Verbindungen.

00:20.730 --> 00:22.880
Einer für den Schauspieler und einer für den Kritiker.

00:23.190 --> 00:27.260
Aber bevor wir das tun, müssen wir die Anzahl der möglichen Aktionen ermitteln.

00:27.290 --> 00:32.520
Ich werde Sie hier Variable nennen, die keine Variable des Objekts sein wird.

00:32.520 --> 00:38.970
Also werde ich hier nicht selbst verwenden, aber ich werde brauchbare Nicht-Ausgaben erstellen, die eine Reihe

00:38.970 --> 00:41.610
möglicher Aktionen darstellen und diese erhalten.

00:41.760 --> 00:44.520
Nun, wir können es aus dem Aktionsraum bekommen.

00:44.520 --> 00:51.330
Wir nehmen also unseren Aktionsraum, der die Eingabe der Funktion ist, wenn wir das Objekt erstellen.

00:51.510 --> 00:56.300
Und dann fügen wir das hinzu und erhalten so viele mögliche Aktionen.

00:56.580 --> 01:03.180
Und jetzt werden der Schauspieler und der Kritiker die gleiche Eingabe nehmen, die hier mit

01:03.180 --> 01:06.290
den Faltungen und GLSEN ausgegeben wird.

01:06.500 --> 01:12.900
Es wird also dieselbe Eingabe benötigt, die ein verschlüsselter Zustand ist, aber dann haben sie zwei unterschiedliche lineare Verbindungen, so

01:13.110 --> 01:19.000
dass wir schließlich tatsächlich zwei neuronale Netzwerke erhalten, eines für die zwei und eines für einen Kritiker.

01:19.020 --> 01:21.030
Also machen wir diese zwei getrennten neuronalen Netzwerke.

01:21.060 --> 01:27.360
Aber da wir mit der Kodierung hier bereits den großen Job gemacht haben, müssen wir einfach

01:27.360 --> 01:33.640
zwei Objekte erstellen, eines für den Schauspieler und eine weitere lineare Verbindung für den Kritiker.

01:33.660 --> 01:35.430
Und genau das werde ich tun.

01:35.490 --> 01:42.560
Ich werde jetzt zwei Objekte erstellen, ein erstes Objekt für die lineare Verbindung des Kritikers, das

01:42.570 --> 01:49.210
ich Kritiker nennen werde und die Partitur Linnie sind, und diese lineare Verbindung herzustellen.

01:49.380 --> 01:55.020
Sie wissen, wie es geht, wir müssen nur das Motormodul und dann die lineare Klasse nehmen, auf die wir zwei

01:55.020 --> 01:55.800
Eingänge haben.

01:55.880 --> 02:01.800
Nun, die Eingabe-Neuronen, die die Ausgaben von all dem sind, einschließlich hier mit den Windungen

02:01.910 --> 02:05.190
und dem GM, der 256 Neuronen ist.

02:05.190 --> 02:12.120
Wenn ich also zweihundertsechsundfünfzig sechs hier setze, werden wir eine Ausgabe haben, weil die Ausgabe des neuronalen Netzwerks

02:12.210 --> 02:17.940
für den Kritiker der Wert der Funktion ist, die auf den Eingabezustand angewendet wird,

02:18.080 --> 02:20.960
und auf die eingegebenen kodierten Zustände Hier.

02:21.180 --> 02:28.680
Wenn wir also den Eingabezustand s nennen, der die Ausgabe von all dies ist, wird die Ausgabe des neuronalen Netzwerks

02:28.680 --> 02:32.530
des Kritikers VS sein und hat daher eine Dimension.

02:32.550 --> 02:33.710
Es ist nur ein Wert.

02:33.870 --> 02:36.320
Und hier haben wir eine.

02:36.510 --> 02:43.020
Denken Sie daran, dies ist das, was die Schauspieler teilen, damit sie einige allgemeine Informationen erhalten,

02:43.020 --> 02:46.590
mit denen sie ihre Aktion relevanter spielen können.

02:46.980 --> 02:50.430
OK, also für das neuronale Netzwerk des Kritikers.

02:50.580 --> 02:59.820
Und jetzt machen wir das neue Netzwerk des Schauspielers und deshalb bin ich hier ein selbstlernender Schauspieler, und

02:59.850 --> 03:02.830
die Eingaben sind bereits verschlüsselt.

03:02.850 --> 03:08.430
Also müssen wir jetzt einfach eine lineare Verbindung hinzufügen und sagen, dass wir in

03:08.430 --> 03:15.870
einem Modul die lineare Klasse nehmen und jetzt sagen, dass dieses neue Netzwerk des Schauspielers den verschlüsselten Zustand annehmen

03:15.870 --> 03:19.840
wird, der hier die Größe 256 hat, also 256.

03:20.070 --> 03:26.010
Die Ausgabe wird jedoch anders sein, da Sie natürlich wissen, dass die Ausgabe des neuronalen

03:26.010 --> 03:30.790
Netzwerks für den Aktor andere Schlüssel die Schlüsselwerte der Eingangszustände umfasst.

03:30.860 --> 03:33.620
Die, die wir hören konnten und die Aktionsplatte.

03:33.810 --> 03:40.980
Wenn wir also diesen verschlüsselten Zustand nennen, den wir hier als Aktion meinen, ist die Ausgabe

03:40.980 --> 03:44.480
dieses neuronalen Netzwerks tatsächlich q als a.

03:44.880 --> 03:50.010
Und da Sie wissen, dass wir für jede Aktion einen enormen Wert haben, haben wir keine Ausgaben.

03:50.010 --> 03:57.680
Q-Werte und daher die Ausgabe hier wird keine Ausgaben sein, da keine Ausgabe tatsächlich die Anzahl

03:57.680 --> 03:59.380
der Menschen ist.

03:59.840 --> 04:01.100
Okay, perfekt.

04:01.130 --> 04:05.360
Also wenn du willst kann ich hier für dich schreiben.

04:05.390 --> 04:18.410
Der Kritiker ist sowohl der verschlüsselte als auch der kodierte Zustand und für den Schauspieler ist die Ausgabe süß wie in Ordnung.

04:18.410 --> 04:23.750
Deshalb ist es sehr wichtig, diese Unterscheidung hier zu verstehen und zu verstehen, dass wir daher

04:23.900 --> 04:25.370
zwei separate Nachrichtennetzwerke haben.

04:25.370 --> 04:29.370
Eine für den Kritiker und eine für den Schauspieler. Okay, perfekt.

04:29.380 --> 04:32.080
Damit sind wir fast fertig mit dieser Funktion.

04:32.170 --> 04:33.920
Jetzt ist das Wichtigste getan.

04:34.030 --> 04:39.370
Das einzige, was wir noch tun müssen, ist, alle Gewichte dieser beiden neuronalen Netzwerke und alle

04:39.790 --> 04:40.830
Vorurteile zu initialisieren.

04:40.860 --> 04:45.800
Um dies zu tun, werden wir natürlich die zwei Funktionen verwenden, die wir zuvor gemacht haben, nämlich

04:45.900 --> 04:48.480
die Initialisierung von Spalten und die Gewichtungen darin.

04:48.490 --> 04:49.720
Also lass uns das schnell machen.

04:49.870 --> 04:52.180
Es wird ziemlich einfach und schnell sein.

04:52.180 --> 04:56.590
Zuerst initialisieren wir einige zufällige Gewichtungen und wenden dazu die Gewichtungen in ihrer

04:56.590 --> 04:58.420
Funktion auf unser Objekt an.

04:58.420 --> 05:03.150
Hier müssen wir uns also selbst nehmen, um unser Objekt zu bekommen und zu protestieren.

05:03.160 --> 05:06.440
Wir wenden das Gewicht in seiner Funktion an.

05:06.620 --> 05:14.200
Deshalb müssen wir im Inneren nur die Gewichtungen in diese Funktion einfügen und dann bekommen wir diese Funktion

05:14.200 --> 05:20.080
auf unser Objekt. Dadurch initialisieren wir einige zufällige Gewichtungen, um ein zukünftiges optimales Lernen

05:20.140 --> 05:21.930
dieser Gewichtungen zu erhalten.

05:22.000 --> 05:27.460
Jetzt müssen wir für den Schauspieler und den Kritiker eine besondere Normalisierung vornehmen.

05:27.670 --> 05:33.700
Aber denk dran, ich glaube, ich habe dies in den vorherigen Tutorials gesagt. Wir

05:33.780 --> 05:38.890
werden nicht die gleiche Abweichung für das X in Acryl-Yakked einstellen.

05:38.890 --> 05:40.840
Und die Kritiker werden eine große bekommen.

05:40.840 --> 05:41.800
Und warum machen wir das?

05:41.800 --> 05:47.560
Was ist der Zweck, eine kleine Standardabweichung der Gewichte für den Schauspieler und die große Standardabweichung des

05:47.560 --> 05:49.320
Wegs für den Kritiker anzugeben.

05:49.510 --> 05:53.830
Nun, das erlaubt es, Exploration gegen Ausbeutung zu handhaben.

05:53.830 --> 05:58.620
Das ist genau der Zweck, dies zu tun, indem dem Schauspieler in einem größeren Publikum eine kleine Abweichung zur

05:58.630 --> 05:59.460
Kritik gegeben wird.

05:59.490 --> 06:04.510
Wir haben ein gutes Management zwischen Exploration und Ausbeutung.

06:04.600 --> 06:07.510
Also lass uns das tun, lass uns zuerst auf den Schauspieler aufpassen.

06:07.510 --> 06:14.170
Also nehmen wir uns selbst oder widersprechen uns, dann nehmen wir das neuronale Netzwerk unseres Schauspielers, das Schauspieler Linnea ist.

06:14.270 --> 06:20.350
Dann werden wir auf die Gewichtungen dieses neuen Netzwerks des Schauspielers zugreifen und uns daran erinnern, auf die Daten

06:20.350 --> 06:23.360
der Gewichtungen zuzugreifen, die wir brauchen diese Daten.

06:23.410 --> 06:24.280
Gut.

06:24.280 --> 06:31.000
Damit erhalten wir die Gewichte und nun verwenden wir den Initialisierer für den normalisierten Kamm.

06:31.390 --> 06:36.520
Also kopiere ich dieses Einfügen hier und wir werden ein Argument eingeben.

06:36.520 --> 06:38.810
Die Standardabweichung, die diese Gewichte haben sollen.

06:39.160 --> 06:42.130
Denken Sie jedoch zuerst daran, dass diese Funktion zwei Argumente benötigt.

06:42.200 --> 06:45.280
Zuerst den Weg, den wir initialisieren wollen.

06:45.280 --> 06:49.750
Also müssen wir das einfach noch einmal nehmen und hier begründen.

06:49.870 --> 06:53.010
Und das zweite Argument ist die Standardabweichung.

06:53.170 --> 06:54.420
Wir wollen diese Gewichte haben.

06:54.580 --> 07:02.880
Wie gesagt, wir wollen eine kleine Standardabweichung des Schauspielers in einem kleinen, es wird 0 sein. 01 perfekt.

07:02.890 --> 07:05.880
Hier sind also die Gewichte des neuronalen Netzwerks des Schauspielers.

07:05.900 --> 07:09.610
Nun kümmern wir uns um die Neigung der neuen Arbeit des Schauspielers.

07:09.850 --> 07:15.460
Und deshalb machen wir hier fast dasselbe, wie wir diese Paste kopieren wollen.

07:15.520 --> 07:26.470
Ersetzen Sie das Gewicht von Käufern, um auf die Käufer zuzugreifen. Nach den Daten fügen wir einfach Fülldaten hinzu, und merken Sie sich, wenn Sie

07:26.560 --> 07:31.170
Null setzen, da alle Geräte mit Null initialisiert werden sollen.

07:31.510 --> 07:37.840
Ich glaube also nicht, dass diese Zeile notwendig ist, da, wie Sie sich erinnern, die Käufer bereits mit

07:37.840 --> 07:41.400
dieser Füllfunktion in der Wait-Funktion auf Null gesetzt werden.

07:41.620 --> 07:47.560
Sie wissen also, dass wir dies tun, um sicherzustellen, dass die Käufer tatsächlich auf Null gesetzt werden.

07:47.560 --> 07:49.490
Aber ich denke es ist hier schon gemacht.

07:49.690 --> 07:52.720
Aber jetzt sind wir zu 100 Prozent sicher.

07:53.050 --> 07:55.990
In Ordnung, jetzt machen wir dasselbe für den Kritiker.

07:56.050 --> 07:59.660
Also lasst uns effizient sein und diese beiden Zeilen abdecken.

08:00.220 --> 08:07.180
Lassen Sie uns ihnen hier gegenüberstehen und hier werden wir den Schauspieler nur durch Kritiker ersetzen.

08:07.180 --> 08:08.400
Hier gilt das gleiche.

08:08.540 --> 08:13.600
Jetzt müssen wir nur noch die Standardabweichung ändern, die wir für

08:13.600 --> 08:15.680
die Kritiker haben wollen.

08:15.970 --> 08:23.310
Und wenn Sie sich diesmal einmal an eine große Standardabweichung erinnern anstatt an eine offene oder eine, werden wir eine eingeben,

08:23.830 --> 08:29.680
also haben wir eine kleine Standardabweichung für die Gewichte der neuen Arbeit des Schauspielers und eine

08:29.680 --> 08:31.610
große Standardabweichung für die Gewichte.

08:31.630 --> 08:33.290
Und dann, wenn wir an den Kritiker kommen.

08:33.370 --> 08:37.560
Und das ist natürlich etwas, das wir hier aktiv durch Kredit ersetzen müssen.

08:37.980 --> 08:40.460
Alles klar jetzt werden wir cool.

08:40.510 --> 08:46.300
Wir haben also noch zwei weitere Dinge zu tun, zuerst die Vorurteile des Teams zu initialisieren und dazu nehmen wir unser Objekt selbst, weil die LACMA

08:46.300 --> 08:53.500
zu unserem Objekt gehört und wir sagen, oder als T. N. dann das und dann bekommen

08:53.870 --> 08:57.980
wir die zwei Arten von Käufern, die in der letzten sind.

08:58.180 --> 09:04.650
Das ist Voreingenommenheit und die Bewertung nach Alter und die andere basiert auf dem Alter des Alters.

09:04.660 --> 09:09.880
Das sind die beiden Arten der Verzerrung in der CME und die gleichen werden auf Null initialisiert.

09:09.880 --> 09:18.810
Also greifen wir zuerst auf die Daten zu und verwenden dann die Funktion zum Unterstreichen der Unterstriche, um alle Käufer mit Nullen

09:18.850 --> 09:21.940
zu füllen, die mit Ihren initialisiert werden.

09:21.940 --> 09:22.320
Recht.

09:22.360 --> 09:31.500
Und jetzt für die zweite Käufergruppe werden wir hier gleich durch Alter nach Alter ersetzt.

09:31.500 --> 09:32.430
Gut.

09:32.570 --> 09:39.560
Das initialisiert die Neigung der Nullen. Jetzt müssen wir als letztes eine Methode verwenden, die vom Ende geerbt

09:39.560 --> 09:43.090
wird, und das Modul, das die Train-Methode ist.

09:43.220 --> 09:47.360
Und im Grunde gibt es nur eine Methode, die das Modul in Behandlung bringt.

09:47.540 --> 09:48.760
Was nützt es also?

09:48.890 --> 09:55.440
Nun, es ist die Verwendung, die es erlaubt, zu aktivieren, wenn es zu Störungen im Badezimmer kommt.

09:55.550 --> 10:03.100
Um es zu benutzen, fügen wir einfach einen selbstgedachten Zug hinzu, und das Modul ist perfekt für die Arbeit.

10:03.170 --> 10:05.650
Damit sind wir mit der init-Funktion fertig.

10:05.720 --> 10:11.210
Wir haben unsere Konvolutionen, wir haben die CME, wir haben zwei getrennte neuronale Netzwerke für den

10:11.210 --> 10:15.400
Kritiker und den Schauspieler, und alle Gewichtungen und Verzerrungen sind gut initialisiert.

10:15.620 --> 10:16.940
Das ist also alles gut.

10:16.940 --> 10:21.860
Wir sind bereit, mit dem nächsten Schritt fortzufahren, nämlich mit der Forward-Funktion, die

10:21.890 --> 10:27.230
das Signal natürlich von vornherein mit den ursprünglichen Eingabebildern im gesamten Gehirn weiterleitet, bis wir

10:27.230 --> 10:28.640
die Ausgabe erhalten.

10:29.000 --> 10:30.770
Machen wir das im nächsten Tutorial.

10:30.800 --> 10:32.330
Und bis dahin genießen Sie AI.