WEBVTT

00:00.270 --> 00:02.250
Hallo und willkommen im Laden.

00:02.430 --> 00:05.810
Ich bin total aufgeregt, weil wir die A-3 im Gehirn sehen lassen.

00:05.810 --> 00:07.430
Das ist das Gehirn unserer KI.

00:07.590 --> 00:10.800
Und wenn ich über Gehirne spreche, möchte ich etwas hervorheben.

00:10.870 --> 00:15.750
Denken Sie daran, dass wir im ersten Modul ein einfaches Gehirn mit nur vollständig verbundenen Schichten erstellt haben.

00:15.840 --> 00:22.260
Dann haben wir im zweiten Modul für Dhoom ein Gehirn gemacht, das nicht nur vollständig verbundene Schichten, sondern auch

00:22.350 --> 00:29.070
Augen hatte, weil wir die Faltungsschichten hinzugefügt haben, die dem Auge Augen verliehen, weil es die Bilder beobachten und

00:29.070 --> 00:31.550
verstehen kann, was im Inneren vorgeht.

00:31.830 --> 00:37.590
Und jetzt sagen wir das sogar auf hohem Niveau, weil wir ein Gehirn schaffen werden, das nicht

00:37.590 --> 00:41.310
nur Augen hat und Schichten, sondern auch Gedächtnis vollständig verbindet.

00:41.430 --> 00:46.710
Wie ich bereits im vorigen Tutorial gesagt habe, werden wir in diesem großen Gehirn

00:46.710 --> 00:53.490
eine Aufzeichnung zu dieser Arbeit hinzufügen, die unserem Gehirn ein langes Gedächtnis geben wird, damit es die zeitlichen

00:53.580 --> 00:57.010
Beziehungen der zeitlichen Eigenschaften der Eingabebilder verstehen kann.

00:57.120 --> 01:02.400
Also gehen wir weiter und noch leistungsfähigeres Gehirn kann ich Ihnen sagen, dass der Dymo, um

01:02.640 --> 01:09.930
den es bei Intiman geht, wirklich sehr mächtig ist und wir sehen, wie der Aufbau von KI und der Einsatz tieferer und

01:10.260 --> 01:14.820
tieferer Schritte und das Forsman-Lernen immer näher zusammenrücken Wie funktioniert das menschliche Gehirn?

01:14.820 --> 01:19.560
Sie wissen, wir haben mit den grundlegenden Beziehungen des Gehirns mit den linearen Verbindungen begonnen.

01:19.560 --> 01:22.230
Dann fügten wir Augen hinzu und wir fügten die Erinnerung hinzu.

01:22.230 --> 01:24.900
Wer weiß, was wir in den zukünftigen Modellen hinzufügen werden.

01:24.990 --> 01:30.780
Weißt du, 2018 werden sie vielleicht etwas hinzufügen, das das Gehirn noch mehr wie ein menschliches Gehirn aussehen

01:30.780 --> 01:31.330
lässt.

01:31.680 --> 01:37.590
Aber schon mit vollständig verbundenen Augen und Gedächtnis haben wir ein wirklich gutes und funktionelles

01:37.590 --> 01:38.280
Gehirn.

01:38.790 --> 01:39.690
Also machen wir's.

01:39.750 --> 01:41.140
Lass uns dieses Gehirn machen.

01:41.310 --> 01:46.470
Wie üblich werden wir dafür eine Klasse machen, weil es viele Eigenschaften mit den

01:46.470 --> 01:48.780
Windungen und der Wissenschaft haben wird.

01:48.870 --> 01:53.770
Wir werden es also so einrichten, dass alle diese Verbindungen initialisiert werden.

01:54.090 --> 01:59.220
Und dann haben wir natürlich die Ford-Funktion, die natürlich das Signal im Gehirn

01:59.220 --> 02:02.580
ausbreitet, so dass wir irgendwann die Ausgabe erhalten.

02:02.580 --> 02:03.200
Gut.

02:03.240 --> 02:04.020
Sind Sie bereit.

02:04.140 --> 02:05.400
Lass uns das machen.

02:05.400 --> 02:13.700
Klasse, die wir in der Klasse einführen, die wir als Schauspielerkredit bezeichnen, weil ich hier natürlich von Gehirn spreche.

02:13.710 --> 02:19.440
Aber vergessen wir nicht, dass wir mit dem Modell, das auf dem Prinzip der aktiven Kritiker basiert, mit dem

02:19.650 --> 02:24.810
Schauspieler und dem Kritiker getrennt machen, also tatsächlich eine der nahezu vollständigen Verbindungen für den Schauspieler

02:24.810 --> 02:27.770
und eine sinnvolle Verbindung für den Kritiker herstellen wird.

02:27.810 --> 02:30.880
Sie werden sehen, wie gut wir das machen werden.

02:30.900 --> 02:39.060
Also aktiver Kritiker und diese Schauspielklasse werden von Ende bis zum Ende von Maggio erben, damit wir alle

02:39.060 --> 02:40.780
Pitre-Tools einsetzen können.

02:40.860 --> 02:44.130
Also lasst uns dies tun, um in diesem Modul vom Ende zu erben.

02:44.190 --> 02:53.000
Nun, wir müssen zuerst die Fackel-Bibliothek nehmen, dann das und dann und das und Mudgal.

02:53.090 --> 02:54.100
Gut.

02:54.110 --> 02:55.600
Auf diese Weise erben wir davon.

02:56.990 --> 02:57.240
Gut.

02:57.260 --> 03:01.630
Wir gehen also mit unserer ersten Funktion, die natürlich in ihrer Funktion sein wird.

03:01.640 --> 03:10.400
Wir beginnen also mit seiner doppelten Unterstreichung, dann wird diese Funktion als Argument selbst mit dem Objekt

03:10.850 --> 03:17.970
genommen, dann die Eingabeform, die die Dominierungen unserer Eingabebilder ist, und wir nennen

03:18.050 --> 03:25.820
sie Nichteingaben und die Aktionsphase, die im Wesentlichen der Raum ist das enthält alle Aktionen.

03:26.000 --> 03:31.340
Wir wissen auch aus diesem Aktionsbereich, dass wir eine Reihe von Aktionen erhalten können, dh eine Anzahl von möglichen

03:31.700 --> 03:33.870
Aktionen, die tatsächlich sehr bald kommen werden.

03:33.870 --> 03:38.290
Deshalb brauchten wir das auch für die Argumente.

03:38.290 --> 03:39.390
Das ist alles was wir brauchen.

03:39.650 --> 03:45.450
Und dann gehen wir in die Funktion hinein und erstellen alle Variablen, die unserem Gehirn eigen sind.

03:45.830 --> 03:51.740
Bevor wir uns jedoch daran erinnern, was wir tun müssen, um die Vererbung auf irgendeine Weise zu

03:52.040 --> 03:59.450
aktivieren, damit wir alle Werkzeuge vom Ende von Maggio verwenden können, müssen wir die Superfunktion auf diese Weise verwenden, in die wir

03:59.450 --> 04:00.180
eingeben.

04:00.440 --> 04:10.740
Darsteller Kritiker, das ist unsere Klasse und kommen dann selbst mit dem Objekt in Ordnung, dann

04:10.740 --> 04:14.840
gehen wir wieder mit der Funktion.

04:14.940 --> 04:15.560
Da gehen wir.

04:15.600 --> 04:20.100
Das gibt uns alle Werkzeuge, die wir alle benötigen, um unser Gehirn aufzubauen.

04:20.400 --> 04:21.940
Also gut.

04:22.170 --> 04:24.690
Nun, es ist Zeit, Augen zu machen.

04:24.780 --> 04:26.210
Das sind die Windungen.

04:26.460 --> 04:31.770
Wir werden es also sehr schnell tun, weil wir dies bereits ausführlich für Doom erklärt haben.

04:31.800 --> 04:34.210
Weil ich mich an den Tag erinnere, an dem ich Eis hatte.

04:34.260 --> 04:39.240
Es ist also genau das Gleiche, wir werden einige Schlüsse ziehen und eine sehr

04:39.510 --> 04:45.240
einfache Architektur mit 32 Merkmalsdetektoren der Größe drei mal drei mal zwei und einem Abstand von einem verwenden.

04:45.450 --> 04:50.460
Das ist also eine ziemlich klassische Architektur, aber das wird tatsächlich genug sein, um zu

04:50.690 --> 04:53.010
wissen, was in der Pause passiert.

04:53.010 --> 04:54.090
OK.

04:54.480 --> 04:56.750
Also gut, machen wir diese Windungen.

04:56.790 --> 05:03.900
Wir fangen also mit self an, weil die Windungen Variablen der Objekte sein werden, so dass wir es als

05:03.900 --> 05:09.210
"Come" bezeichnen können und es wird vier Faltungen geben, und diese kann man.

05:09.540 --> 05:11.040
Und da gehen wir hin.

05:11.040 --> 05:18.900
Wir nehmen den N- und Maggio-Punkt und bringen den Kegel zur Klasse, weil der Convenant eigentlich

05:18.930 --> 05:20.670
ein Ekelobjekt ist.

05:21.540 --> 05:25.870
Und dann setzen wir zuerst die Eingabeform der Bilder ein.

05:25.920 --> 05:32.780
Also genau das, was wir hier haben, damit wir das kopieren und als erste Eingabe eingeben können.

05:33.090 --> 05:38.600
Das zweite Argument ist die Anzahl der Merkmalsdetektoren und die Anzahl der Kernel.

05:38.640 --> 05:45.060
Wir nehmen also 32, da wir gerade die klassische Wahl gesagt haben. Dann müssen wir die Größe

05:45.060 --> 05:50.130
des Kernels auswählen, die Anzahl der Zellen, die über das Eingabebild gleiten.

05:50.190 --> 05:55.170
Denken Sie also daran, dass wir entweder drei, vier oder fünf nehmen können, die zur Auswahl

05:55.290 --> 05:58.460
stehen. Wir werden drei wählen und dann wählen wir.

05:58.550 --> 06:01.100
Versucht zu.

06:01.340 --> 06:11.350
Und eine Auffüllung von einer, die wir verwenden, die für die erste Faltung, die vom Eingangsbild zur

06:11.350 --> 06:16.210
ersten Faltungsschicht führt, besteht aus 32 gefalteten Bildern.

06:16.360 --> 06:18.850
Nun sind wir bereit, die zweite Faltung vorzunehmen.

06:18.850 --> 06:27.290
Es wird also fast das selbe sein, also kopiere ich diese Zeile und stelle die unten unten eingefügte Linie

06:27.310 --> 06:33.490
wieder ein und füge sie ein letztes Mal ein, weil wir vier Faltungen

06:33.490 --> 06:42.640
haben werden, an denen sich fast nichts ändern muss Einer kommt zu eins nach drei und kommt zu einem von vier.

06:42.670 --> 06:45.160
Das werden unsere vier Windungen sein.

06:45.160 --> 06:49.330
Und jetzt müssen wir natürlich einige Dinge ändern, aber nicht viel, denn wir werden für

06:49.370 --> 06:52.280
jedes zwei Dinge und ein Muster von eins verfolgen.

06:52.420 --> 06:58.620
Sie verfügen alle über 32 Merkmalsdetektoren, die aus 32 gewundenen Bildern bestehen.

06:58.780 --> 07:04.040
Aber dann erinnere mich daran, dass dies dem linken Teil der Faltung entspricht.

07:04.180 --> 07:09.610
Das entspricht also tatsächlich dem, was sich am rechten Teil der vorherigen Schlussfolgerung befand, und Sie wissen, dass es wie ein

07:09.610 --> 07:10.370
Domino ist.

07:10.390 --> 07:11.440
Es ist wirklich leicht.

07:11.560 --> 07:22.390
Und deshalb müssen wir hier 32 setzen, und hier werden wir 32 und 32 sehr leicht sehen.

07:22.390 --> 07:27.790
Also gut, zusammenfassend fangen wir mit unseren Eingabebildern an, die keine haben.

07:27.810 --> 07:35.350
Simon Jones war die erste Faltung. Wir haben 32 gewundene Bilder, von denen jedes ein bestimmtes Merkmal erkennt. Von

07:35.800 --> 07:43.120
diesen 32 gewundenen Bildern wenden wir die zweite Faltung an, um 32 neue gefaltete Bilder und dann dieselben aus

07:43.420 --> 07:46.510
diesen 32 neuen gefalteten Bildern zu erhalten.

07:46.510 --> 07:52.430
Wir wenden die dritte Faltung an, um wieder 32 neue gefaltete Bilder zu erhalten, und schließlich wenden wir

07:52.450 --> 07:57.470
von den drei bis zu gewundenen Bildern die vierte Faltung an, um Merkmale zu erhalten.

07:57.490 --> 07:57.910
Gut.

07:57.910 --> 08:03.700
Und das wird ausreichen, oder ich werde eine Aufsicht haben, die den Ball sehr gut nimmt.

08:03.700 --> 08:07.250
Also gut, das ist es für die Faltung. Also das ist es für die Augen.

08:07.420 --> 08:09.490
Und jetzt kümmern wir uns um die Erinnerung.

08:09.640 --> 08:15.520
Diese neue Funktion dieses Gehirns, die wir im Gegensatz zu früher implementieren, wird nicht

08:15.680 --> 08:23.140
nur eine Überwachung haben, sondern auch ein langes Gedächtnis mit super Gedächtnis, weil wir Langzeitgedächtnis sehen werden, das

08:23.170 --> 08:29.230
ist diese Art von Aufzeichnung oder eine neuronale Ein Netzwerk, das Ihrem Modell eine

08:29.230 --> 08:36.580
Art langes Gedächtnis verleiht, so dass es einige lange zeitliche Beziehungen aus der Vergangenheit lernen kann. Wir werden

08:36.580 --> 08:43.180
also neue Variablen aus der Zeit mit sich selbst erstellen und diese neue Variable nennen wir

08:43.180 --> 08:47.260
sie einfach denn dies entspricht dem LACMA-Netzwerk im Gehirn.

08:47.290 --> 08:55.240
SVM und out, bevor wir den Code für das LCN schreiben, stellen wir sicher, dass wir verstehen, was dieser LACMA-Teil des Gehirns

08:55.240 --> 08:56.270
tun wird.

08:56.530 --> 09:03.980
So wie wir es verstanden haben, wird dieses LCN verwendet, um die zeitlichen Eigenschaften der eingegebenen Eingangsbilder zu lernen.

09:04.090 --> 09:09.730
Wenn der Ball beispielsweise auf einen LACMA trifft, wird die Waage codiert.

09:09.730 --> 09:11.410
Das ist also das erste, was man versteht.

09:11.410 --> 09:15.070
Es wird sozusagen kodieren, was im Spiel passiert.

09:15.070 --> 09:20.080
Als nächstes ist es wichtig zu verstehen, dass wir bei der Implementierung des

09:20.170 --> 09:26.680
ISTM die zeitliche Abhängigkeit in der richtigen Reihenfolge wählen müssen. Da wir unser neuronales Netzwerk mit einer Folge

09:26.680 --> 09:33.740
von vier Bildern füttern, bedeutet dies, dass wir dies bereits können Lernen Sie einige zeitliche Abhängigkeiten der Ordnung, denn dies

09:33.740 --> 09:40.310
ist einige zeitliche Abhängigkeiten, bei denen das, was um 1:20 geschieht, davon abhängt, was zum Zeitpunkt T geschieht.

09:40.360 --> 09:45.500
T minus 1 T minus 2 und T minus 3, damit wir das definitiv tun können.

09:45.730 --> 09:51.040
Die gute Nachricht ist jedoch, dass wir die Analyse YEM verwenden werden und

09:51.160 --> 09:54.560
daher einige noch komplexere zeitliche Beziehungen lernen können.

09:54.650 --> 10:00.430
Zum Beispiel können wir einige einfache Eigenschaften lernen, bei denen das, was um 1:20 geschieht, davon abhängt, was zum

10:00.430 --> 10:01.370
Zeitpunkt T geschieht.

10:01.370 --> 10:05.510
T minus 20 Minuten bis minus drei Minuten bis T minus.

10:05.940 --> 10:13.360
Das ist der lange Teil des langen Kurzzeitgedächtnisses mit diesem Assay, und wir können einige sehr

10:13.360 --> 10:15.490
komplexe zeitliche Beziehungen lernen.

10:15.490 --> 10:18.080
Also gut, fügen wir unser LCN hinzu.

10:18.160 --> 10:25.030
Dazu verwenden wir das Modul N in und fügen die Klasse als T hinzu. N. Zelle, die dies als

10:25.600 --> 10:31.960
ein Objekt erstellen wird, das DST und Teil des neuen Netzwerks darstellt, denn im Moment

10:31.960 --> 10:38.570
ist es auch wichtig zu verstehen, dass wir eine CR erstellen, und dann wissen Sie, dass

10:38.590 --> 10:45.520
Faltungsprotokoll ein neues Netzwerk aufzeichnet und der arland - Teil nach dem CNN-Teil und daher müssen

10:45.610 --> 10:51.350
wir in dieser LACMA-Zelle zunächst die Größe der Ausgabe nach der Faltung eingeben.

10:51.400 --> 10:56.060
Das sind also 32 mal drei mal drei.

10:56.230 --> 11:02.670
Also diese 32 mal drei mal drei ist tatsächlich die Ausgabe nach den vier Windungen hier.

11:02.830 --> 11:07.600
Aber das ist der Input der RNA, der LSD und der Arbeit.

11:07.870 --> 11:13.710
Und warum ist die Leistung der vier Windungen halb so groß, dreimal dreimal dreimal.

11:13.870 --> 11:16.030
Keine Sorge, es ist nicht so direkt.

11:16.060 --> 11:22.140
Es ist eigentlich keine einfache Formel, aber es gibt eine Formel, um diese Anzahl von Ausgangsneuronen zu berechnen.

11:22.210 --> 11:26.490
Nach dem Abflachen der gepoolten und verwundenen Bilder der Dekonvolution.

11:26.710 --> 11:32.050
Aber wenn wir die Bedingungen dieser großen Formel zusammengestellt haben, dann bekommen wir 32 mal drei mal drei.

11:32.200 --> 11:36.060
Ich wollte nicht zu viel Zeit damit verbringen, weil wir viel mehr zu tun haben.

11:36.190 --> 11:39.470
Außerdem haben wir bereits eine Funktion zur Berechnung dieser Zahl erstellt.

11:39.520 --> 11:43.710
Denken Sie daran, dass es für das Verhängnis war, als wir diese Neuronen zählen ließen.

11:43.870 --> 11:45.750
Sie können es also wiederverwenden, wenn Sie möchten.

11:45.760 --> 11:51.610
Sie sind nicht überzeugt, aber genau das bekommen wir, wenn Sie die Bedingungen dieser großen Formel wie die Berechnung

11:51.610 --> 11:53.490
der Anzahl der Ausgaben zusammengestellt haben.

11:53.530 --> 11:59.380
Das ist also das erste Argument, und dann wird das zweite Argument die Anzahl der Ausgabeneuronen

11:59.380 --> 12:00.370
der sein.

12:00.610 --> 12:05.220
Und wir gehen für 256 OK.

12:05.220 --> 12:12.180
Und was bedeutet das nun, dass wir jetzt einen Vektor haben, der jedes Ereignis des Spiels kodiert, oder

12:12.540 --> 12:19.260
anders ausgedrückt, wir einen verschlüsselten Zustand haben und dass wir jetzt zwischen Ihnen und dem Kritiker trennen können

12:19.620 --> 12:25.470
Wir wissen, dass wir zwei separate neue Netzwerke erstellen werden, eines für den Schauspieler und

12:25.470 --> 12:31.410
eines für den Kritiker, aber sie werden dieselbe Kodierung der Bilder und der zeitlichen Beziehungen

12:31.410 --> 12:33.990
für diese beiden neuronalen Netzwerke sein.

12:33.990 --> 12:37.740
Dies ist also der gemeinsame Teil, den wir für diese beiden neuen Netzwerke tun.

12:37.740 --> 12:43.650
Dies wird derselbe Anfang für die beiden neuen Netzwerke sein, aber jetzt werden sich die Dinge für den Schauspieler

12:43.650 --> 12:49.710
und den Bach ändern, weil wir eine in der vollen Verbindung für den Schauspieler und eine andere als eine fast

12:49.710 --> 12:52.200
vollständige Verbindung für den Craic herstellen werden .

12:52.230 --> 12:56.320
Also machen wir eine kurze Pause und machen wir das im nächsten Schritt.

12:56.400 --> 12:57.860
Bis dahin genießen Sie die KI.