WEBVTT

00:00.390 --> 00:01.110
Sind Sie bereit?

00:01.350 --> 00:06.930
Lassen Sie uns dies tun. Beginnen wir mit der Installation aller Systemabhängigkeiten für Vista.

00:06.930 --> 00:14.340
Klicken Sie auf diese Wiedergabetaste. Jetzt werden alle Abhängigkeiten wie Pelo oder ZIPPI sowie einige andere Abhängigkeiten installiert,

00:14.340 --> 00:18.170
die erforderlich sind Führen Sie dies erfolgreich aus.

00:18.180 --> 00:22.010
Aber alle anderen, wie PLI für die Fitness-Module, sind bereits installiert.

00:22.230 --> 00:23.070
Das ist wirklich großartig.

00:23.070 --> 00:28.620
Das ist wirklich das Schöne an gutem Kulam, und dank dessen hat keiner von Ihnen Probleme, den

00:29.250 --> 00:31.860
Code auszuführen und das Endergebnis zu visualisieren.

00:32.430 --> 00:32.790
Gut.

00:32.790 --> 00:35.250
Das wird also tatsächlich ein oder zwei Minuten dauern.

00:35.250 --> 00:38.090
Also werde ich hier und jetzt nur schnell vorspulen.

00:38.100 --> 00:41.250
Wir sehen uns sehr bald für den Rest der Ausführung des Codes.

00:42.780 --> 00:47.790
In Ordnung, wir scheinen am Ende der Installation der Systemabhängigkeiten zu sein, wie

00:47.940 --> 00:53.430
Sie sehen können, werden sie heruntergeladen und installiert, während sie mit den richtigen Anforderungen erfasst werden.

00:53.820 --> 00:56.670
Und in wenigen Sekunden sollte es erledigt sein.

00:57.300 --> 00:57.890
Richtig.

00:58.320 --> 01:01.060
Und mal sehen, drei, zwei.

01:01.380 --> 01:02.040
Na, bitte.

01:02.130 --> 01:03.900
Alles erfolgreich installiert.

01:03.900 --> 01:05.250
Machen Sie sich hier keine Sorgen über diese Fehler.

01:05.250 --> 01:11.040
Sie haben keinen Einfluss auf die Ausführung des Codes, aber alles wird erfolgreich installiert, so wie wir es möchten.

01:11.070 --> 01:11.550
Gut.

01:12.000 --> 01:14.520
Also jetzt nächster Schritt, sehr wichtig.

01:14.850 --> 01:16.620
Schauen Sie sich diesen wichtigen Hinweis an.

01:16.620 --> 01:22.290
Es heißt, dass Sie nach der Installation aller Benz, im Grunde nach dem Ausführen dieser ersten Zelle hier,

01:22.290 --> 01:24.030
Ihre Laufzeit neu starten müssen.

01:24.030 --> 01:26.550
Andernfalls werden hier einige Ausführungsfehler angezeigt.

01:26.560 --> 01:27.620
Also lass es uns schnell machen.

01:27.630 --> 01:28.440
Es ist sehr einfach.

01:28.440 --> 01:33.030
Sie müssen nur hier auf Laufzeit klicken und dann die Laufzeit neu starten und dann.

01:33.030 --> 01:33.420
Ja.

01:33.510 --> 01:33.930
Gut.

01:33.930 --> 01:40.050
Dadurch wird Ihre Laufzeit wiederhergestellt. Jetzt können Sie alle diese Zellen ausführen, indem Sie einfach auf die Wiedergabetaste

01:40.050 --> 01:40.490
klicken.

01:40.500 --> 01:44.530
Beginnen wir also mit dieser ersten Dateibildvorverarbeitung.

01:44.850 --> 01:45.350
Gut.

01:45.360 --> 01:51.750
Importieren wir also zuerst die Bibliotheken und verarbeiten dann die Bilder mit der Bildklasse vorverarbeiten.

01:51.750 --> 01:58.320
Und jetzt sind wir bereits zur Implementierung der Erfahrungswiederholung übergegangen, also zu dieser.

01:58.570 --> 01:59.160
Gut.

01:59.550 --> 02:00.360
Also lass uns das machen.

02:00.360 --> 02:04.860
Wir importieren zuerst die Bibliotheken und definieren dann einen Schritt der Umgebung.

02:05.310 --> 02:12.360
Dann machen wir die A. ICH. Fortschritte bei mehreren Schritten und Schritten mit der Fortschrittsklasse für den

02:12.360 --> 02:14.610
letzten Schritt genau so, wie wir sie im Ordner haben.

02:14.970 --> 02:20.370
Und dann implementieren wir die Erfahrung, die wir spielen, indem wir diese Wiederholungsspeicherklasse erstellen.

02:20.490 --> 02:20.970
Gut.

02:21.120 --> 02:21.750
Alles gut.

02:22.050 --> 02:24.110
Und jetzt gehen wir zum dritten Foul über.

02:24.840 --> 02:31.740
Dieser A. ICH. Angenommen, ich hatte mich beworben und wir importieren dann zuerst die Bibliotheken.

02:31.890 --> 02:32.250
Gut.

02:32.250 --> 02:37.290
Hier dauert es also ein wenig, weil wir alle Brennermodule importieren, dann importieren wir die Pakete zum

02:37.290 --> 02:41.040
Öffnen und tun dies mit dem Fitnessstudio und der Weisheit, Jim.

02:41.040 --> 02:43.080
Und die Verpackung ist alles gut.

02:43.470 --> 02:48.780
Und dann fahren wir mit Teil 1 fort, Gebäude II, wo wir das Gehirn, dann

02:48.780 --> 02:51.370
den Körper herstellen und dann alles zusammenbauen.

02:51.390 --> 03:00.150
Lassen Sie uns also zuerst das Gehirn mit der CNN-Klasse in Ordnung bringen, dann den Körper mit der

03:00.150 --> 03:04.370
Softmax-Körperklasse und dann die KI mit einer Klasse.

03:04.710 --> 03:05.250
Gut.

03:05.280 --> 03:06.060
Also alles gut.

03:06.420 --> 03:08.130
Und jetzt sind wir bereit, mit Teil zwei fortzufahren.

03:08.150 --> 03:12.120
Werden wir die KI natürlich mit tiefem Faltungs-Q-Lernen trainieren?

03:12.540 --> 03:12.980
Gut.

03:12.980 --> 03:15.060
Also Executive, genau wie das, was wir hier haben.

03:15.540 --> 03:19.140
Wir bekommen zuerst die Doom-Umgebung mit unseren neuen Modulen mit Doom.

03:19.140 --> 03:20.100
Mach dir darüber keine Sorgen.

03:20.370 --> 03:21.390
Dies ist kein Fehler.

03:21.780 --> 03:27.510
Dann werden wir das A bauen. ICH. durch Integrieren der verschiedenen Objekte, um CNN, die Körper des Max-Körpers

03:27.510 --> 03:30.930
und das gesamte A einzubringen. ICH. das Gehirn und den Körper enthalten.

03:31.020 --> 03:31.410
Gut.

03:31.410 --> 03:32.310
Habe ich das ausgeführt?

03:32.310 --> 03:32.700
Ja.

03:33.240 --> 03:34.950
Dann machen wir Erfahrung.

03:34.950 --> 03:42.090
Wir spielen mit Insteps und dem Speicher als objektivem Wiedergabespeicher und implementieren dann den

03:42.090 --> 03:42.720
Berechtigungs-Trace.

03:43.170 --> 03:43.800
Gut.

03:43.800 --> 03:45.180
Um die Leistung zu verbessern.

03:45.690 --> 03:49.950
Dann machen wir den gleitenden Durchschnitt in hundert Schritten mit der Klasse M a.

03:50.220 --> 03:52.410
Und schließlich, meine Freunde, sind Sie bereit?

03:52.530 --> 03:58.500
Nun, dies ist jetzt Zeit für den sehr aufregenden Teil, in dem wir das A trainieren werden. ICH. über zwanzig Dollar.

03:58.500 --> 03:58.860
Gut.

03:58.860 --> 04:01.440
Sie werden also sehen, dass dies schon ein bisschen lang sein wird.

04:01.440 --> 04:06.030
Weißt du, es wird ungefähr ein oder zwei Stunden dauern, weil ich die Abmessungen vergrößere. Wenn du

04:06.030 --> 04:09.810
das zu lange findest, kannst du die Emissionen auf achtzig mal achtzig reduzieren.

04:09.810 --> 04:12.990
Aber glauben Sie mir, Sie werden viel bessere Videos mit diesen Dimensionen haben.

04:13.080 --> 04:15.450
OK, bist du bereit?

04:15.690 --> 04:20.280
Lassen Sie uns dies in drei zu einem Schritt tun.

04:20.430 --> 04:20.880
Gut.

04:20.880 --> 04:26.700
Dies wird also den Code des Trainings ausführen und in wenigen Sekunden sollten wir in der Lage sein, die erste

04:26.700 --> 04:29.880
Epoche zu sehen, die natürlich eine negative Belohnung haben wird.

04:30.150 --> 04:35.640
Aber Sie werden sehen, dass die Belohnung im Laufe der Epochen nach und nach zunimmt,

04:35.640 --> 04:40.260
bis positive Belohnungen erreicht werden und dann Hunderte von Belohnungen erreicht werden.

04:40.260 --> 04:42.240
Nun, lasst uns das eigentlich anstreben.

04:42.240 --> 04:48.150
Hoffen wir, dass wir mit achtundzwanzig Dollar eine letzte Belohnung bei einigen hundert haben, wissen Sie, wie 100

04:48.150 --> 04:53.250
oder 200 oder 300, denn mit diesen Belohnungen habe ich tatsächlich mit ihnen experimentiert.

04:53.250 --> 04:53.490
Ja.

04:53.490 --> 04:56.790
Erstens eine negative Belohnung minus achtundneunzig.

04:57.120 --> 05:02.970
Ich sagte also, dass wir mit Belohnungen bei etwa 100, 200, 300 bereits einige großartige Ergebnisse erzielen werden.

05:02.970 --> 05:08.010
Weißt du, wir werden sehen, wie die AA es schafft, einige Monster zu töten oder ihnen auszuweichen

05:08.010 --> 05:09.930
oder sich auf die Weste zuzubewegen.

05:10.020 --> 05:14.220
OK, das ist das erste Buch, eins minus achtundneunzig.

05:14.430 --> 05:18.780
Und dann wissen Sie, wir werden bei Buch Nummer zwei mit vielleicht schon einer besseren Belohnung sehen.

05:18.780 --> 05:21.660
Aber zu Beginn ist die UVP natürlich nicht geschult.

05:21.660 --> 05:23.520
Es erforscht die Umwelt.

05:23.520 --> 05:23.780
Richtig.

05:23.790 --> 05:28.620
Erinnern Sie sich an diesen Kompromiss zwischen Lernen, Erforschung und Ausbeutung?

05:28.620 --> 05:33.180
Nun, am Anfang ist die Idee rein erforschend und dann wird sie trainieren

05:33.180 --> 05:37.890
und dann wird sie immer kleiner und dann wird sie eine hohe Belohnung erreichen.

05:37.890 --> 05:41.040
Es ist also völlig in Ordnung, am Anfang negative Belohnungen zu haben.

05:41.040 --> 05:41.880
Vielleicht bekommen wir das.

05:41.950 --> 05:47.680
Während der drei ersten Epochen, aber dann werden Sie sehen, dass wir nach einer Zahl von vier,

05:47.700 --> 05:54.280
fünf oder sechs beginnen werden, vielleicht positive Belohnungen zu erreichen und dann hoffentlich Belohnungen bei etwa 100, 200 oder 300.

05:54.340 --> 05:57.580
OK, also wird es eine Weile dauern, wie ich sagte.

05:57.580 --> 06:02.340
Wir werden also nicht zwei Stunden hier bleiben, sonst werden mir die Dinge ausgehen, die ich sagen kann.

06:02.620 --> 06:10.000
Also werde ich jetzt eine lustige oder coole Musik machen und los geht's, Epoche Nummer zwei, minus

06:10.000 --> 06:10.830
62.

06:10.840 --> 06:12.220
Es gibt also bereits einige Verbesserungen.

06:12.220 --> 06:12.640
Das ist gut.

06:12.640 --> 06:15.790
Aber Sie werden sehen, dass es noch bessere Verbesserungen geben wird.

06:16.000 --> 06:18.300
Je weiter wir in den Epochen kommen.

06:18.430 --> 06:20.040
OK, was habe ich gesagt?

06:20.050 --> 06:25.330
Ja, ich werde jetzt coole Musik machen und das Training im beschleunigten Modus spielen.

06:25.480 --> 06:30.320
Und natürlich sehen wir uns am Ende des Trainings, um die Endergebnisse zu sehen.

06:30.340 --> 06:30.880
Gut.

06:31.000 --> 06:31.840
Also los geht's.

06:32.050 --> 06:34.870
Drei zu eins gehen.

07:20.010 --> 07:25.780
In Ordnung, und hier sind wir am Ende des Trainings. Herzlichen Glückwunsch, Sie haben ein tiefgreifendes, faltungsorientiertes Lernmodell für

07:26.010 --> 07:30.000
eine sehr herausfordernde Anwendung trainiert, nämlich das Spiel des Untergangs zu spielen.

07:30.510 --> 07:31.980
Also, wofür soll ich sagen?

07:32.130 --> 07:37.080
Nun, wie wir es uns erhofft hatten, erreichten wir eine durchschnittliche Belohnung von mehr als 100.

07:37.590 --> 07:43.190
Dann ist es natürlich wichtig zu sagen, dass Sie mit mehr Epochen höhere Belohnungen erhalten.

07:43.440 --> 07:49.350
Wenn Sie beispielsweise bereit sind, dieses Modell für mehr zu trainieren, sieht es nach 100 Epochen oder sogar

07:49.530 --> 07:54.460
mehr aus, um Belohnungen von mehr als 300, 400, 500 oder sogar 1000 zu erreichen.

07:54.660 --> 07:56.000
Fühlen Sie sich frei, es zu tun.

07:56.010 --> 07:59.190
Zum Beispiel können Sie dies für die Nacht laufen lassen, während Sie schlafen.

07:59.190 --> 08:02.010
Und wenn Sie morgens aufwachen, erzielen Sie bessere Ergebnisse.

08:02.370 --> 08:05.580
Beachten Sie, dass Sie diese auch in der Laufzeit-GPU verwenden können.

08:05.580 --> 08:10.500
Wenn Sie den Laufzeittyp ändern, was ich nicht tun sollte, da sonst das Notebook neu gestartet wird.

08:10.500 --> 08:16.230
Aber im Hardwarebeschleuniger hier können Sie zwischen GPU und sogar Tipu wählen, aber das ist nur möglich, wenn Sie,

08:16.230 --> 08:20.190
wie Sie wissen, die Leistung optimieren und ein super hartes Training absolvieren möchten.

08:20.340 --> 08:25.060
Aber hier habe ich nur eine klassische Sache verwendet, weil ich Ihnen nur zeigen möchte, wie man das alles ausführt.

08:25.320 --> 08:26.240
Und los geht's.

08:26.250 --> 08:32.610
Jetzt werden wir den Rest der Arbeitsmappe mit diesem zusätzlichen Code ausführen, der nur für diesen Code spezifisch ist, diesem

08:32.610 --> 08:36.090
Notizbuch, in dem wir natürlich AA in Aktion visualisieren werden.

08:36.570 --> 08:36.840
Gut.

08:36.840 --> 08:37.470
Also lass uns das machen.

08:37.470 --> 08:39.660
Importieren wir zunächst die Bibliotheken.

08:39.840 --> 08:40.380
Richtig.

08:40.380 --> 08:41.010
Alles gut.

08:41.400 --> 08:46.110
Dann werden wir die Eingabeform und eine Reihe möglicher Aktionen drucken.

08:46.110 --> 08:46.470
Gut.

08:46.470 --> 08:52.200
Hier werden wir also tatsächlich feststellen, dass wir sieben mögliche Aktionen in der Doom-Korridor-Umgebung

08:52.200 --> 08:52.830
haben.

08:52.840 --> 08:59.550
Das sind also vorwärts, rückwärts, links, rechts, schießen und dann vielleicht sich selbst oder was auch

08:59.550 --> 09:00.450
immer schützen.

09:00.450 --> 09:06.000
Ich weiß nicht, was die letzte Aktion ist, aber so ähnlich, dann sind dies die

09:06.000 --> 09:07.380
Dimensionen des Eingaberahmens.

09:07.530 --> 09:09.450
Dies entspricht der Höhe des Rahmens.

09:09.450 --> 09:11.460
Es hat 240 Pixel Höhe.

09:11.700 --> 09:14.550
Das entspricht der Breite des Rahmens, oder?

09:14.550 --> 09:16.890
Es ist dreihundertzwanzig groß.

09:17.070 --> 09:22.800
Und das entspricht, wissen Sie, der Tatsache, dass wir mit farbigen Bildern arbeiten und die drei

09:22.800 --> 09:25.410
hier den drei Elementen unserer Kanäle entsprechen.

09:25.920 --> 09:31.320
Also gut, dann führen wir die nächste Zelle aus, in der ein Rahmen der Umgebung angezeigt wird, um zu sehen, wie

09:31.320 --> 09:31.860
es ist.

09:32.130 --> 09:36.780
Denken Sie daran, dass dies nützlich ist, um die Umgebung zu sehen, mit der Sie arbeiten.

09:36.780 --> 09:37.230
Richtig.

09:37.230 --> 09:39.360
Hier sehen wir also, dass wir uns im Dume Corridor befinden.

09:39.360 --> 09:45.480
Wenn Sie hier jedoch mit weiteren Umgebungen experimentieren möchten, denken Sie daran, dass diese auch

09:45.480 --> 09:48.510
auf der Hauptseite hier aufgeführt sind.

09:48.510 --> 09:48.990
Genau hier.

09:48.990 --> 09:49.260
Ja.

09:49.260 --> 09:53.190
Sie haben alle Listen der Umgebungen, mit denen ich experimentieren möchte.

09:53.400 --> 09:58.080
Weißt du, wenn du dir einen anderen ansehen willst, weißt du, ich kann dir zeigen,

09:58.290 --> 10:02.610
dass wir diesen bekommen, und dann gehe ich zurück zu diesem Zoomkorridor.

10:02.880 --> 10:03.230
Richtig.

10:03.240 --> 10:06.600
Also, wenn ich das durch dieses ersetze.

10:07.520 --> 10:13.490
Richtig, und ich führe dies gut aus, diesmal werden wir drei Aktionen erhalten, natürlich ist es einfacher, und

10:13.490 --> 10:17.630
wenn wir dies gut ausführen, werden wir diese Umgebung sehen, richtig.

10:17.650 --> 10:24.170
Es ist also nur eine Möglichkeit, schnell zu sehen, mit was Sie arbeiten, und eine Vorschau zu erhalten, was der ACA

10:24.170 --> 10:25.970
in der Umgebung tun wird.

10:26.450 --> 10:26.780
Gut.

10:26.780 --> 10:29.050
Also gehen wir zurück in die Ecke.

10:29.360 --> 10:33.800
Lassen Sie uns dies jetzt ausführen, falls wir es für den nächsten Verkauf benötigen.

10:34.100 --> 10:37.110
Alles klar, perfektes Schicksal, Cawdor.

10:37.370 --> 10:39.830
Kommen wir nun zu den endgültigen Verkäufen.

10:39.890 --> 10:43.490
Dies ist eine Hilfsfunktion, die für die Visualisierungen verwendet wird.

10:43.680 --> 10:48.140
Lassen Sie uns also den Verkauf ausführen und nun die Idee für eine Episode ausführen.

10:48.140 --> 10:52.970
Und hier werden Sie in der Lage sein, den Code zu verstehen, weil es im Grunde genommen

10:53.240 --> 10:59.210
der Prozess ist, die Luft laufen zu lassen und eine vollständige Episode, in der es bei jedem Schritt in einem bestimmten Zustand

10:59.210 --> 11:00.920
in Aktion gespielt wird der Staat.

11:01.070 --> 11:04.480
Dann wird es die Belohnung bekommen und dann das nächste Datum erreichen.

11:04.670 --> 11:04.940
Richtig.

11:04.990 --> 11:07.460
Das ist also der klassische MGP-Prozess, richtig.

11:07.470 --> 11:08.720
Marktentscheidungsprozess.

11:09.140 --> 11:09.950
Und so geht es los.

11:09.950 --> 11:11.600
Das ist für eine Episode gemacht.

11:11.610 --> 11:18.950
Und schließlich werden wir das Video des Spiels unseres A bekommen. ICH. , der für zwanzig Dollar trainiert wurde,

11:18.990 --> 11:25.220
konnte mehr als 100 Belohnungen erreichen, was uns einige ziemlich gute Ergebnisse bringen wird, aber vielleicht nicht die besten

11:25.220 --> 11:26.060
erreichen wird.

11:26.060 --> 11:26.890
Aber es ist ok.

11:26.900 --> 11:28.520
Sie werden das selbst experimentieren.

11:28.820 --> 11:34.220
Und jetzt möchte ich, dass Sie hier auf die Schaltfläche klicken, da ich Ihnen zeigen möchte, wie das

11:34.220 --> 11:35.240
Video gefüllt ist.

11:35.480 --> 11:40.730
Das sind also einige Ordner, die einige Elemente wie die Frames, die Frames der Ergebnisse

11:40.730 --> 11:42.590
oder einige Jasen-Dateien enthalten.

11:42.830 --> 11:45.500
Aber wirklich, was interessiert, ist das endgültige Video.

11:45.680 --> 11:50.990
Und um es zu bekommen, müssen wir hier nur auf die Wiedergabetaste klicken und Sie werden sehen, dass es hier

11:50.990 --> 11:52.130
im Hauptordner ausgefüllt wird.

11:52.130 --> 11:52.730
Verpassen Sie es nicht.

11:53.000 --> 11:53.690
Und es ist in Ordnung.

11:53.690 --> 11:57.290
Sie wissen, es sieht so aus, als ob die Zelle bereits ausgeführt wurde, was der Fall ist.

11:57.500 --> 12:03.830
Aber Sie werden sehen, dass wir in wenigen Sekunden einen Avatar sehen werden, eine Videodatei, die hier ausgefüllt wird.

12:03.830 --> 12:05.420
Es erscheint in etwa zehn Sekunden.

12:05.690 --> 12:07.800
Ich kann sogar einen Countdown machen, wenn Sie wollen.

12:08.120 --> 12:08.990
Also lass uns das machen.

12:09.200 --> 12:20.750
Und zehn, neun, acht, sieben, sechs, fünf, vier, drei, zwei, eins gehen.

12:21.730 --> 12:24.070
Und jetzt sollte es wirklich in ein paar Sekunden erscheinen.

12:24.100 --> 12:24.760
Ja, los geht's.

12:25.150 --> 12:25.490
Gut.

12:25.500 --> 12:28.390
Also Agent Gameplay, diese Idee, das ist dein Video.

12:28.390 --> 12:36.640
Laden wir es also herunter und es wird auf Ihren Computer heruntergeladen, den ich hier finden werde.

12:36.730 --> 12:37.140
Richtig.

12:37.180 --> 12:43.480
Das ist das Video-Agent-Gameplay, das Evia unbedingt mit einem Video-Player mit Codecs wie VLSI

12:43.480 --> 12:44.080
öffnet.

12:44.110 --> 12:44.430
Richtig.

12:44.450 --> 12:48.930
Es funktioniert nicht mit dem Quick Time Player, wenn Sie einen Mac verwenden, aber es funktioniert definitiv mit VLCC.

12:49.270 --> 12:50.110
Schauen wir uns das an.

12:50.680 --> 12:52.160
Und hier ist das Video.

12:52.210 --> 12:52.570
Gut.

12:52.570 --> 12:54.850
Lassen Sie mich hier einfach die Pause drücken.

12:55.240 --> 12:55.540
Gut.

12:55.540 --> 12:56.230
Also hier ist das Video.

12:56.240 --> 13:01.260
Und wie Sie sehen können, sind dies die 256 x 256 Abmessungen des Rahmens.

13:01.540 --> 13:03.070
Wie Sie sehen können, ist es nicht sehr groß.

13:03.070 --> 13:03.330
Richtig.

13:03.340 --> 13:08.030
Deshalb wollte ich wirklich mit diesen Dimensionen arbeiten, anstatt 80 mal 80.

13:08.710 --> 13:10.060
Schauen wir uns jetzt das Video an.

13:10.070 --> 13:15.970
Das ist also der A. ICH. Wenn du in einer Episode Doom spielst, muss vermieden werden, dass die Monster nicht getötet werden.

13:15.970 --> 13:17.860
Es muss vorwärts gehen, um das Beste zu erreichen.

13:18.160 --> 13:22.090
Mal sehen, wie es drei zu eins geht.

13:23.820 --> 13:29.970
Also gut, zuerst wird es geschlossen, es bewegt sich vorwärts, OK, und dann wurde es von den Monstern getötet, aber das

13:29.970 --> 13:31.530
ist immer noch ziemlich gut.

13:31.530 --> 13:36.240
Weißt du, es hat verstanden, dass es sich in Richtung Westen bewegen musste, weil die höchsten Belohnungen gut sind,

13:36.240 --> 13:37.740
wenn man die Weste erreicht.

13:38.190 --> 13:42.720
Und natürlich wissen Sie, wenn Sie wirklich sehen möchten, wie das Video Ihrer Luft die Weste erreicht und

13:42.720 --> 13:48.780
bei diesem Spiel gewinnt, müssen Sie Ihr Auge auf weitere Epochen trainieren und vielleicht sogar eine andere Art von Verbesserung vornehmen, wie z

13:48.780 --> 13:54.210
Stimmen Sie Ihr Gehirn des A. ICH. oder eine Parametereinstellung durchführen, z. B. die

13:54.210 --> 13:55.010
Lernrate einstellen.

13:55.170 --> 14:01.050
Nun, Sie haben viele Möglichkeiten, wenn einer von Ihnen ein fantastisches Video oder, wie Sie wissen, das Video von A erhält. ICH. zum Beispiel eine Belohnung

14:01.050 --> 14:03.800
von mehr als 1000 erreicht zu haben.

14:03.810 --> 14:06.470
Fühlen Sie sich frei, es in den Fragen und Antworten zu teilen.

14:06.480 --> 14:09.280
Ich bin sicher, andere Studenten werden sich sehr darüber freuen.

14:09.870 --> 14:10.480
Gut.

14:10.500 --> 14:14.770
Ich hoffe, Ihnen hat die Implementierung des tiefen, konvolutionellen Lernmodells gefallen.

14:15.010 --> 14:19.770
Jetzt fahren wir mit dem nächsten Teil fort, in dem es um die Implementierung

14:19.770 --> 14:24.800
des H3C-Modells und eines noch besseren und leistungsstärkeren Modells geht, das für das Breakout-Spiel implementiert wird.

14:25.140 --> 14:26.840
Also wir sehen uns im nächsten Teil.

14:26.850 --> 14:28.590
Und bis dahin genießen Sie A. ICH..
