WEBVTT

00:00.450 --> 00:05.400
Hallo und herzlich willkommen auf diesem Weg in Torro. Jetzt wird die Forward-Funktion eingerichtet,

00:05.400 --> 00:11.040
die das Signal vom gesamten Gehirn ausgehend von den Eingangsbildern bis zu den Outputs weiterleitet, die

00:11.130 --> 00:16.860
die Schlüsselwerte für den Schauspieler und enthalten der De-Wert, der von der Funktion für den Kritiker

00:17.040 --> 00:17.950
genommen wird.

00:18.240 --> 00:23.820
Es wird also ähnlich sein wie bei Dume, aber diesmal wird sich etwas ändern.

00:23.880 --> 00:25.550
Eine Änderung wird das ändern.

00:25.560 --> 00:27.510
Jetzt haben wir eine Illustration im Gehirn.

00:27.510 --> 00:32.470
Also müssen wir alle etwas mehr tun, um das Signal zu verbreiten und damit vorsichtig zu sein.

00:32.850 --> 00:38.280
Die andere Sache ist weniger wichtig, aber es ändert sich

00:38.280 --> 00:44.220
im Vergleich zu früher nicht, dass wir keine echte Aktivierungsfunktion verwenden

00:44.220 --> 00:48.880
werden, da Sie die nichtlineare Aktivierungsfunktion kennen Funktion.

00:48.980 --> 00:51.390
Sie werden das in der Vergangenheit sehen.

00:51.780 --> 00:55.970
Also machen wir das. Lassen Sie uns diese Funktion mit einem Tod beginnen.

00:56.040 --> 00:59.190
Es ist eigentlich die letzte Funktion dieser Klasse.

00:59.280 --> 01:06.900
Wir nennen es also Vorwärts wie Einstein und diese vierte Funktion wird das Objekt übernehmen, da wir

01:06.900 --> 01:09.930
die Objekte und Eingaben verwenden werden.

01:10.170 --> 01:13.520
So wichtig zu verstehen, was diese Eingaben sein werden.

01:13.590 --> 01:19.170
Dies sind nicht nur die Eingabebilder, sondern auch die verborgenen Knoten und

01:19.170 --> 01:20.980
die Zellknoten derselben.

01:21.090 --> 01:25.120
Deshalb wollte ich hervorheben, dass sich einige Dinge jetzt ändern werden.

01:25.180 --> 01:30.820
Grundsätzlich betrachten wir die Vorwärtsfunktion des Internets und der Zellknoten der Liste.

01:31.200 --> 01:38.900
Wenn wir jetzt von ihnen sprechen, trennen wir diese beiden Eingaben dieses Arguments, indem wir die Vorwärtsfunktion setzen

01:38.900 --> 01:41.540
und wie können wir sie trennen.

01:41.700 --> 01:46.160
Nun, wir können uns an einen neuen Voivode erinnern, der die Eingabebilder sein wird.

01:46.230 --> 01:55.620
Das sind also Eingabebilder, und wir trennen sie mit dem Sturz H x und C X, einem Tempel der

01:55.620 --> 01:59.090
verborgenen Zustände und der Zellzustände am Kolosseum.

01:59.370 --> 02:04.470
Also sind H x andere Staaten und C X die Südstaaten.

02:04.540 --> 02:09.580
Alles klar und das wird gleich der Eingabe sein, die dieses Argument hier ist.

02:09.580 --> 02:14.950
Nun haben wir diese Trennung vorgenommen und deshalb können wir damit beginnen, das Signal

02:15.220 --> 02:21.400
im gesamten Gehirn zu verbreiten. Um dies zu erreichen, werden wir nacheinander verschiedene Schichten von der ersten

02:21.700 --> 02:28.690
bis zur letzten Ebene erhalten, indem wir unsere Verbindungen verwenden, also die Faltungen der LACMA-Verbindung die lineare Verbindung hier

02:29.020 --> 02:30.300
die volle Verbindung.

02:30.490 --> 02:31.400
Also lass uns das tun.

02:31.450 --> 02:33.620
Jetzt wird es genauso sein wie zuvor.

02:33.750 --> 02:40.420
Wir werden unsere erste Schicht bekommen, die wir X nennen, und diese erste Schicht müssen wir, um das Signal von

02:40.510 --> 02:46.240
den Eingängen zu dieser ersten Schicht zu verbreiten. Daher müssen wir die erste Faltung verwenden, da es

02:46.240 --> 02:51.770
die erste Faltung ist Dadurch wird das Signal von den Eingangsbildern auf die erste Ebene übertragen.

02:52.030 --> 02:58.450
Was wir jetzt tun werden, ist dies zu kopieren, denn dies ist die erste Faltung, die wir hier

02:58.450 --> 03:06.100
hatten, und wir wenden diese erste Faltung auf unsere Eingabebilder an, die jetzt die richtigen Eingänge sind und die wir erhalten, die

03:06.100 --> 03:09.560
das Signal von den Eingabebildern ausbreiten die erste schicht.

03:09.820 --> 03:16.390
Denken Sie jedoch daran, dass wir eine nichtlineare Aktivierungsfunktion verwenden müssen, um die Linearität zu durchbrechen, um

03:16.390 --> 03:23.170
die nichtlinearen Beziehungen in Bildern lernen zu können. Um dies zu tun, werden wir die Aktivierungsfunktion verwenden, die

03:23.500 --> 03:28.050
wir gerade verwenden sehen Sie jetzt und das durch Berührung stecken.

03:28.180 --> 03:30.110
Aber vorher wollen wir es bekommen.

03:30.130 --> 03:36.430
Um es zu verstehen ist es so, als würden wir wirklich das Funktionsmodul nehmen, das eine

03:36.490 --> 03:45.790
Abkürzung und dann das und dann eine Schleife hat, und dann setzen wir das alles in Klammern, weil wir die Neuronen nichtlinear aktivieren wollen.

03:45.880 --> 03:51.160
Diese erste Schicht hier haben wir durch Anwenden der ersten Faltung auf die Eingänge erhalten.

03:51.160 --> 03:55.310
Jetzt gehen wir zum PI-Fackel Doug, um zu verstehen, was es ist.

03:55.360 --> 03:56.110
Hier ist es.

03:56.200 --> 04:00.320
So können Sie darauf zugreifen, um die Taschenlampe festzuhalten oder den Schrägstrich zu aktivieren.

04:00.340 --> 04:06.940
Und dann, dass H G und L und dann müssen Sie nichtlineare Aktivierungen finden und dann die nichtlinearen Aktivierungsfunktionen, die

04:06.940 --> 04:08.080
Sie finden werden.

04:08.170 --> 04:14.040
Nun, das ist wirklich der Klassiker, wenn wir wissen, dass es nur ein Maximum von Null ist und X die Grafik im Auge hat.

04:14.260 --> 04:17.160
Dann hast du sechs, die dies ist.

04:17.160 --> 04:19.350
Also etwas raffinierter.

04:19.570 --> 04:21.190
Und dann gehen wir mal hin.

04:21.550 --> 04:26.470
Und wie Sie sehen, ist Blau ein Wiederholen plus ein zusätzliches Element.

04:26.620 --> 04:29.280
Es ist also wirklich etwas anspruchsvoller.

04:29.340 --> 04:34.180
Und so verwenden wir es, um die Neuronen und die verschiedenen Schichten nichtlinear zu aktivieren.

04:34.180 --> 04:39.420
Übrigens wird diese neue Aktivierungsfunktion in ihrer Einheit als Exponential bezeichnet.

04:39.490 --> 04:40.250
Also los geht's.

04:40.270 --> 04:44.230
Wir wenden das Elu auf die erste Faltungsschicht an.

04:44.470 --> 04:46.300
Und jetzt wird es einfach.

04:46.370 --> 04:52.270
Wir werden mit dem nächsten fortfahren, um das Signal auszubreiten, das von der ersten

04:52.270 --> 04:59.440
Faltungsschicht zur zweiten Faltungsschicht führt, die wir X nennen werden, da wir im Grunde nur X hinzufügen, wobei

04:59.470 --> 05:02.190
x jetzt die erste Faltungsfaltung ist.

05:02.290 --> 05:07.990
Durch Ausbreitung des Signals von der ersten Faltungsschicht zur nächsten wird X die

05:07.990 --> 05:09.190
nächste Faltungsschicht.

05:09.520 --> 05:15.130
Um das Signal von der ersten Faltungsschicht auf die zweite zu übertragen, können wir

05:15.220 --> 05:20.490
das nicht einfach kopieren und hier einfügen und eins nach dem anderen ersetzen.

05:20.510 --> 05:27.340
Und natürlich wird die zweite Faltung nicht auf die Eingabebilder angewendet, sondern auf X, die erste

05:27.340 --> 05:29.530
Faltungsschicht, die sich hier befindet.

05:29.830 --> 05:30.790
Alles klar perfekt.

05:30.790 --> 05:32.800
Jetzt bekommen wir dort unsere zweite Faltung.

05:33.010 --> 05:38.230
Und nun lasst uns das Signal wieder von der zweiten Faltung zur dritten weiterleiten.

05:38.230 --> 05:46.000
Und deshalb können wir dies direkt kopieren und hier einfügen und zwei durch drei ersetzen.

05:46.000 --> 05:46.840
Da gehen wir.

05:46.990 --> 05:47.900
Und der letzte.

05:47.920 --> 05:53.770
Um das Signal von der dritten Faltung dort zur vierten und letzten zu verbreiten, können wir

05:53.770 --> 05:58.770
es hier einfach noch einmal kopieren und drei durch kommende vier ersetzen.

05:58.840 --> 05:59.790
Da gehen wir.

06:00.220 --> 06:01.870
Also lasst uns zusammenfassen.

06:01.870 --> 06:03.310
Wir beginnen mit unseren Eingaben.

06:03.460 --> 06:07.170
Wir wenden die erste Faltung an, um dort die erste Faltung zu erhalten.

06:07.360 --> 06:12.130
Dann wenden wir die zweite Faltung auf die erste Faltungsschicht an, um die zweite Faltungsschicht

06:12.130 --> 06:12.850
zu erhalten.

06:12.970 --> 06:17.830
Dann wenden wir diese dritte Faltung auf die zweite Faltung dort an, um die dritte Faltungsschicht

06:17.830 --> 06:18.510
zu erhalten.

06:18.550 --> 06:24.650
Und schließlich wenden wir die vierte Faltung auf die dritte Faltung dort an, um dort die vierte Faltung zu

06:24.650 --> 06:25.180
erhalten.

06:25.510 --> 06:29.900
Und so verbreitet sich das Signal in den Augen.

06:30.130 --> 06:35.620
Nun haben wir also das Ausgangssignal nach den vier Faltungen und jetzt wissen wir, was

06:35.620 --> 06:40.790
zu tun ist, um dieses gesamte Ausgangssignal in einem eindimensionalen Vektor zu erweitern.

06:40.900 --> 06:42.640
Das ist der Abflachungsschritt.

06:42.880 --> 06:45.440
Also aktualisieren wir x erneut x.

06:45.490 --> 06:49.010
Nun wird dieser abgeflachte eindimensionale Vektor.

06:49.230 --> 06:57.070
Und um das zu tun, ist es das Gleiche, wir müssen X nehmen, das bisher die vierte Faltungsschicht X ist, aber dann

06:57.520 --> 07:05.660
verwenden wir eine View-Funktion und setzen zunächst ein Minus, um zu sagen, dass wir einen eindimensionalen Vektor haben wollen, und dann als zweites

07:05.660 --> 07:11.810
Argument Um die Anzahl der Elemente in den Vektor zu setzen, muss man sich drei Mal

07:11.880 --> 07:13.560
drei Mal drei erinnern.

07:13.670 --> 07:20.270
Und deshalb können wir hier 32 mal drei mal drei setzen.

07:20.270 --> 07:20.720
Da gehen wir.

07:20.720 --> 07:24.570
Nun haben wir unseren abgeflachten Vektor und der Abflachungsschritt ist abgeschlossen.

07:24.680 --> 07:25.580
Perfekt.

07:25.580 --> 07:28.030
Nun kümmern wir uns um den LCN-Teil.

07:28.280 --> 07:33.030
So wie Sie es verstanden haben, nimmt der LSD den abgeflachten Vektor als Eingabe auf.

07:33.200 --> 07:37.190
Dieser eindimensionale Vektor von drei zwei mal drei mal drei Elementen.

07:37.190 --> 07:40.310
Für den icn ist es also schon fertig und gut vorbereitet.

07:40.320 --> 07:49.070
Das Team ist nun bereit, diesen Flaten-Vektor als Eingaben zu verwenden, und daher können wir unsere LACMA und Eingaben als Argument

07:49.190 --> 07:52.010
nehmen, wenn zuerst X bereit ist.

07:52.010 --> 07:55.960
FLATOW Und Vektor, das ist dieser Röntgenstrahl, den wir gerade erweitert haben.

07:56.270 --> 08:00.810
Aber auch und hier kommt der Ärger ins Spiel.

08:00.890 --> 08:04.540
Wir müssen H x und z x setzen.

08:04.550 --> 08:10.820
Wir können ha-Satan hier als X verwenden, weil wir diese Trennungen von den ursprünglichen Eingabeargumenten

08:11.060 --> 08:12.980
der Vorwärtsfunktion vorgenommen haben.

08:12.980 --> 08:20.460
Also hat LACMA X den Plattenvektor nach den vier Faltungen und alle in der Zellnotiz verborgenen Vektor.

08:20.480 --> 08:21.390
Also los geht's.

08:21.440 --> 08:27.530
Dann dürfen wir das Selbst nicht vergessen, da LSD eine Variable oder Funktion ist, also

08:27.530 --> 08:35.210
eine an das Objekt selbst angehängte Variable und ein CM, und dies führt tatsächlich zu insgesamt zwei Ausgaben, die

08:35.210 --> 08:37.850
die Ausgangsknoten und die Ausgangstöne sind.

08:37.880 --> 08:42.250
Es ist also aktuell und daher können wir H. aktualisieren.

08:42.260 --> 08:48.890
X y und z x die Zellknoten, da dies genau die Ausgabe dieses NCM ist.

08:50.030 --> 08:50.500
Großartig.

08:50.510 --> 08:52.750
Also sind wir jetzt fast fertig.

08:52.790 --> 08:58.850
Jetzt, da wir die Ausgaben der Abbildung haben, müssen wir die nützliche Ausgabe erhalten,

08:58.850 --> 09:05.570
da eigentlich nur die versteckten Noten nützlich sind. Daher werden wir es bis dahin wieder X

09:05.570 --> 09:12.490
erhalten, und X ist jetzt gleich dem ersten Element des Ausgabeabtastens der USA ist ein X gleich.

09:12.680 --> 09:14.270
Und wir sind fast fertig.

09:14.270 --> 09:18.590
Denken Sie daran, dass wir zwei Hirn, ein Gehirn für den Schauspieler in einem Raum für den Kritiker haben.

09:18.860 --> 09:24.380
Und deshalb müssen wir Signale ausgeben, um das Ausgangssignal des Schauspielers und das Ausgangssignal des

09:24.380 --> 09:25.480
Kritikers zurückzugeben.

09:25.580 --> 09:30.730
Deshalb geben wir nun diese beiden Ausgangssignale zurück und wie können wir das tun.

09:30.830 --> 09:32.010
Das ist sehr einfach.

09:32.030 --> 09:38.690
Wir müssen einfach unsere linearen Verbindungen nehmen, aber getrennt davon ist dies eine lineare Verbindung des Kritikers und

09:38.770 --> 09:40.740
die vollständige Verbindung des Schauspielers.

09:41.180 --> 09:47.870
Wir haben jede dieser Verbindungen auf den Ausgang X angewendet, der ein nützlicher Ausgang des LACMA ist

09:47.870 --> 09:50.470
und nur das Ausgangssignal sein wird.

09:50.480 --> 09:50.990
Also los geht's.

09:50.990 --> 09:51.840
Machen wir das.

09:51.900 --> 09:59.660
Wir nehmen zuerst selbst oder Objekt, dann bekommen wir die lineare Verbindung des Kritikers, die Kritiker ist, und

09:59.690 --> 10:08.090
diese Kolinearität, die wir auf das Ausgangssignal X des CM anwenden, und dann nehmen wir dasselbe wieder und dann nehmen

10:08.090 --> 10:15.290
wir die lineare Verbindung des Schauspielers Welches ist Schauspieler und es ist Colinear, was dasselbe gilt

10:15.290 --> 10:16.200
für x.

10:16.310 --> 10:19.580
Da gehen wir also das ist die Hauptsache, die wir brauchen.

10:19.710 --> 10:26.040
Aber dann werden wir auch die Spitze von Ajax an einen Knoten zurückgeben und X sehen, um den Knoten zu verkaufen,

10:26.040 --> 10:29.490
weil wir sie später und den Retro-Look des LCN verwenden werden.

10:29.520 --> 10:30.430
Alles klar perfekt.

10:30.480 --> 10:32.960
Jetzt sind wir mit dem Gehirn fertig.

10:32.970 --> 10:38.040
Oder sollte ich die Gehirne sagen, weil wir tatsächlich zwei Gehirne für den Schauspieler und einen Kritiker gemacht haben.

10:38.250 --> 10:41.990
Glückwunsch, dass Sie mit dem Verstand den achten Platz erreicht haben.

10:42.180 --> 10:47.940
Ich hoffe, das war nicht zu überwältigend, um bei CNN und Anniston kombiniert zu werden, aber die gute Nachricht ist,

10:47.940 --> 10:51.190
dass wir wirklich mit dem besten und leistungsfähigsten Modell arbeiten.

10:51.300 --> 10:53.010
Also los geht's.

10:53.010 --> 10:55.950
Mit diesem ersten Familienmodell haben wir es tatsächlich geschafft.

10:56.010 --> 10:56.810
Y.

10:56.880 --> 11:02.040
Deshalb werden wir uns in den nächsten zwei Schritten um den Optimierer kümmern, da wir einen separaten

11:02.190 --> 11:03.300
Optimierer erstellen werden.

11:03.300 --> 11:08.850
Wir werden nicht jede Codezeile abschneiden, da viele davon aus den Forschungsarbeiten stammen und dies

11:08.850 --> 11:10.520
ist eigentlich ziemlich konkret.

11:10.530 --> 11:16.470
Und wenn wir auf die Details dieses Optimierers

11:16.470 --> 11:22.410
eingehen, könnte dies für den nächsten Schritt ein

11:22.410 --> 11:26.890
wenig zu überwältigend sein sehen.

11:27.030 --> 11:29.240
Vertrauen Sie mir also, dass Sie dafür etwas Energie behalten möchten.

11:29.310 --> 11:32.300
Und deshalb werden wir nicht zu viel Zeit dafür aufwenden.

11:32.490 --> 11:37.830
Trotzdem werde ich den Code erweitern und Sie werden die ganze Idee hinter dieser Optimierung verstehen.

11:38.190 --> 11:44.740
Herzlichen Glückwunsch noch einmal, dass Sie diese Aktivitätsklasse erstellt haben, und wir sehen uns im nächsten Statoil 290-Optimierer.

11:44.760 --> 11:46.140
Bis dahin genieße ich