WEBVTT

00:00.490 --> 00:02.550
Hallo und herzlich willkommen zu diesem Tutorial.

00:02.560 --> 00:07.550
Also gut, also fangen wir mit dem ersten Mann unserer Moral und dem wichtigsten Geflügel an, das durcheinander

00:07.630 --> 00:08.410
geraten ist.

00:08.440 --> 00:09.020
Warum.

00:09.180 --> 00:14.590
Und dies ist in dieser Datei, dass wir das Gehirn des Homo implementieren werden. Sie kennen das Gehirn

00:14.650 --> 00:20.290
im Herzen des 8: 3-Simmos, das sich in dieser Datei befindet und die das neuronale Netzwerk bilden wird, das

00:20.290 --> 00:25.030
natürlich einige Convolutional-Signale enthält, wenn dies funktioniert da wir natürlich immer noch einiges an Verstärkung

00:25.030 --> 00:25.570
lernen.

00:25.690 --> 00:31.690
So können Sie Augen haben und in dieses neuronale Netzwerk alles integrieren, was mit dem aktiven

00:31.870 --> 00:34.600
Craigmile zusammenhängt und es gibt einen Bonus.

00:34.630 --> 00:39.550
Wie ich Ihnen sagte, implementieren wir eine der mächtigsten A-3-Sitten und das macht

00:39.550 --> 00:45.910
es so mächtig, dass es ein neues Netzwerk und genauer im Langzeitgedächtnis des LCN enthält, damit wir

00:45.910 --> 00:48.660
die zeitlichen Eigenschaften dessen erfahren können los

00:48.670 --> 00:54.710
Das sind wiederum die zeitlichen Eigenschaften der Eingabe, so dass die Vorhersagen noch besser sein können.

00:55.270 --> 00:56.050
Also los geht's.

00:56.050 --> 01:01.330
Wir implementieren ein sehr leistungsfähiges Modell, das im Wesentlichen alle neuronalen Netzwerke kombiniert, die wir im

01:01.420 --> 01:02.590
Vertiefungskurs gesehen haben.

01:02.680 --> 01:08.070
Das ist ein künstliches neuronales Netzwerk, ein konvolutionäres neuronales Netzwerk und ein Rekord-neues Netzwerk.

01:08.260 --> 01:13.240
Und im Herzen all dieser Netzwerke gibt es natürlich das A-380-Modell, das die AI-KI sehr mächtig

01:13.240 --> 01:14.040
machen wird.

01:14.410 --> 01:18.300
Also lasst uns dies machen, dieses Modell angreifen und implementieren.

01:18.430 --> 01:21.760
Wir beginnen also mit zwei Funktionen.

01:21.850 --> 01:26.410
Es gibt nur einige Funktionen, die sich darum kümmern, wie wir die Gewichte initialisieren können, weil

01:26.410 --> 01:30.460
Sie wissen, dass wir einige neue Netzwerke haben werden. Deshalb werden wir Gewichte haben,

01:30.460 --> 01:36.740
und wir möchten diese beiden Funktionen nur für uns einrichten Wir haben bereits ein Werkzeug, um das neuronale Netzwerk so einfach in

01:36.750 --> 01:38.090
Ihr Heim zu integrieren.

01:38.290 --> 01:41.600
Diese beiden Funktionen werden also normierte Spalten sein.

01:41.600 --> 01:48.730
Initialisierer ist im Grunde eine Funktion, die nicht nur einige Gewichte initialisieren kann, sondern auch eine bestimmte Varianz

01:48.730 --> 01:50.370
der Tensorgewichte einstellt.

01:50.380 --> 01:52.770
Genau das implementieren wir gerade.

01:53.020 --> 01:57.700
Und dann werden wir die zweite Funktion implementieren, die die Gewichte in dieser Funktion sein werden

01:57.700 --> 02:01.840
und die Gewichte im Wesentlichen in einer für das Lernen ausreichenden Zeit initialisieren.

02:01.840 --> 02:02.330
Gut.

02:02.350 --> 02:08.070
Sobald wir mit diesen beiden Funktionen fertig sind, werden wir mit der Implementierung des neuronalen Netzwerks beginnen.

02:08.330 --> 02:14.770
Also lass es uns tun, lass uns diese beiden Funktionen schnell machen, also beginne

02:14.770 --> 02:24.420
ich mit einem def hier. Dann werde ich den Namen dieser Funktion nennen, die normalisiert ist und diese Kernspalten die Initialisierung unterstreichen.

02:24.720 --> 02:25.550
Da gehen wir.

02:25.650 --> 02:28.780
Und diese Funktion benötigt nur zwei Eingaben.

02:29.010 --> 02:35.790
Zuerst werden es die Gewichte sein, die wir initialisieren wollen, und die Standardabweichung, denn wie ich gerade

02:35.790 --> 02:40.200
sagte, möchten wir eine bestimmte Varianz für unseren Tensor einstellen.

02:40.230 --> 02:45.300
Und wenn Sie verstehen wollen, warum wir dies tun müssen, dann wissen Sie, wann

02:45.620 --> 02:50.490
wir das neuronale Netzwerk, das der Schauspieler und der Kritiker sein wird, gemäß dem

02:50.490 --> 02:53.670
Durchmorgen von morgen erstellen eine für den Kritiker.

02:53.880 --> 02:59.970
Diese beiden vollständig verbundenen Schichten haben Gewichtungen, und wir werden für jede dieser beiden

02:59.970 --> 03:01.810
Gewichtungsgruppen eine Standardabweichung festlegen.

03:01.860 --> 03:05.650
Wir werden also eine kleine Standardabweichung für den Schauspieler festlegen.

03:05.700 --> 03:12.570
Es wird ungefähr 0 sein. 01 und eine große Standardabweichung für den Kritiker, die ungefähr 1 sein wird, denke ich.

03:12.750 --> 03:18.690
Deshalb erstellen wir diese Funktion, damit wir die Standardabweichung für die Gewichte, die wir später für den

03:18.690 --> 03:21.900
Schauspieler und den Craic initialisieren, sehr einfach einstellen können.

03:21.930 --> 03:23.560
Deshalb machen wir das.

03:23.560 --> 03:28.860
Jetzt legen wir nur einen Standardwert fest, der sich jedoch nach der Initialisierung der Gewichtungen

03:28.860 --> 03:29.500
ändert.

03:29.520 --> 03:32.100
Also lasst uns dies für 1 verwenden. 0

03:32.240 --> 03:32.920
Gut.

03:33.000 --> 03:37.340
Jetzt können wir definieren, was in dieser Funktion steckt.

03:37.410 --> 03:41.960
Was also zuerst vorbereitet wird, ist die Ausgabe, die wir aufrufen werden.

03:42.000 --> 03:46.310
Dies ist also für alle das, was von dieser Funktion zurückgegeben wird.

03:46.380 --> 03:50.210
Und so machen wir es zuerst.

03:50.330 --> 03:56.750
So wie Sie verstanden haben, wird diese Ausgabe ein Tensor von Gewichten sein, die eine bestimmte Standardabweichung haben.

03:56.850 --> 04:01.970
Bevor wir uns jedoch mit der Einstellung der Standardabweichung befassen, wollen wir sie nur initialisieren und dann

04:02.010 --> 04:06.550
die Standardabweichung hier setzen, die das Argument ist, das die Eingabe dieser Funktion ist.

04:06.870 --> 04:10.670
Wenn Sie also die Tensorgewichte initialisieren, wissen Sie vielleicht, wie es geht.

04:10.680 --> 04:12.150
Wir haben es schon gemacht.

04:12.180 --> 04:20.250
Wir werden unsere Fackelbibliothek verwenden und aus dieser Fackelbibliothek werden wir die Runde und Funktion übernehmen,

04:21.180 --> 04:27.540
die die brennende Antwort mit zufälligen Gewichtungen initialisiert, die einer Normalverteilung folgen.

04:27.540 --> 04:29.630
Deshalb wird es Rant genannt.

04:29.820 --> 04:31.100
Und wie normal.

04:31.230 --> 04:36.380
Was wir also einfach eingeben müssen, ist die Anzahl der Elemente, die die Ausdehnung enthalten wird.

04:36.510 --> 04:41.510
Und diese Anzahl von Elementen ist natürlich die Anzahl der Gewichte, da wir hier tatsächlich einen Tensor

04:41.500 --> 04:43.140
für diese Gewichte initialisiert haben.

04:43.350 --> 04:53.410
Um diese Anzahl von Elementen zu erhalten, können wir einfach unsere Gewichte verwenden und Punkt hinzufügen, um die Größe mit Klammern zu erhalten.

04:53.410 --> 05:00.280
Dies gibt die Anzahl der Elemente und Gewichte an, so dass der Brennertensor die gleiche Anzahl

05:00.280 --> 05:05.320
von Elementen unserer Gewichte aufweist und dieser nach einer Normalverteilung mit zufälligen

05:05.320 --> 05:06.860
Gewichten initialisiert wird.

05:06.860 --> 05:07.330
Gut.

05:07.360 --> 05:13.390
Nun ist es an der Zeit, die Standardabweichung festzulegen, die hier gewünscht wird.

05:13.510 --> 05:16.960
Also machen wir jetzt eine einfache Normalisierung.

05:16.960 --> 05:21.400
Wir haben ein gefoltertes Gefühl von Gewichten und jetzt wollen wir es normalisieren.

05:21.600 --> 05:25.810
Um dies zu normalisieren, wird einfach die explizite Berechnung geschrieben.

05:25.840 --> 05:34.960
Was wir hier einfach tun müssen, ist, unsere Ausgabe zu nehmen und sie zu aktualisieren, indem sie mit der

05:34.960 --> 05:41.140
Standardabweichung multipliziert wird, die wir mit der soeben erwähnten Summe dividieren möchten.

05:41.140 --> 05:44.960
Um die Summe zu erhalten, verwenden wir die Quadratwurzelfunktion mit der Fackel.

05:45.010 --> 05:48.700
Und so ist das, wenn man hier Fackel nimmt, die s q r t ist.

05:48.820 --> 05:50.710
Das ist die Quadratwurzelfunktion.

05:50.830 --> 05:55.980
Im Inneren geben wir dem Quadrat einige der Gewichte eines Vektors ein.

05:56.160 --> 05:58.000
Und so nehmen wir unsere Ergebnisse.

05:58.210 --> 06:06.040
Dann benutzen wir die Potenzfunktion, in die wir eingeben, weil wir das Quadrat der Summe nehmen

06:06.040 --> 06:08.950
wollen und dann die Sonne.

06:09.000 --> 06:15.300
Im Inneren geben wir den Index des Kegels an, der das Gewicht enthält.

06:15.310 --> 06:23.990
Möchten Sie einige und dann diese Gewichte separat erhalten, weil Sie sie gut zusammenfassen möchten, erweitern

06:24.490 --> 06:29.440
wir normalerweise die Schule in Abhängigkeit von unserer Leistung.

06:29.470 --> 06:29.820
Gut.

06:29.820 --> 06:37.280
Dies wird also die Gewichte herausholen, die bisher als eine Art Torchin-Gewichte initialisiert wurden, die alle diese

06:37.340 --> 06:38.320
Gewichte erhält.

06:38.330 --> 06:43.850
Wir nehmen die Summe des Quadrats und dann die Quadratwurzel, um die Normalisierung anzuwenden.

06:44.030 --> 06:50.230
Und wenn wir diese Standardabweichung am Zähler haben, stellen wir sicher, dass wir sie hier schreiben

06:50.230 --> 06:50.900
können.

06:51.960 --> 06:58.890
Die Varianten out entsprechen dem Quadrat der Standardabweichung.

06:58.890 --> 07:05.940
Diese Formel stellt sicher, dass der von uns initialisierte Tensor der Gewichte eine Abweichung aufweist, die

07:06.030 --> 07:10.860
dem Quadrat der Standardabweichung entspricht, die wir als Argumente verwenden.

07:11.190 --> 07:17.940
Und so können wir eine konkrete Standardabweichung für die Zukunft und Kritiker festlegen, die bald erstellt wird, und

07:17.940 --> 07:24.150
wir werden eine kleine Standardabweichung für den Schauspieler und eine größere für den Kritiker wählen, und wir

07:24.340 --> 07:27.780
werden dies seit dieser Funktion sehr leicht tun.

07:27.780 --> 07:28.150
Gut.

07:28.170 --> 07:31.120
Wir haben also nur noch eine Sache zu tun.

07:31.200 --> 07:38.940
Es ist natürlich, die Ausgabe zurückzugeben, die jetzt mit dieser spezifischen Standardabweichung normalisiert ist.

07:38.940 --> 07:40.340
Alles klar so perfekt.

07:40.350 --> 07:42.680
Das war die erste Funktion, die wir machen mussten.

07:42.870 --> 07:46.220
Dies ist das erste Werkzeug, das wir heute Abend gerne verwenden werden.

07:46.250 --> 07:47.290
H-3-Seehirn

07:47.370 --> 07:49.250
Wir haben jetzt noch eine weitere Funktion zu erstellen.

07:49.350 --> 07:51.130
Es wird die Gewichtsfunktion sein.

07:51.360 --> 07:57.160
Und das ist nur eine Funktion, die die Gewichte initialisiert, um das Lernen optimal zu gestalten.

07:57.570 --> 08:01.110
Also machen wir das im nächsten Tutorial und bis dahin ich.