WEBVTT

00:00.620 --> 00:03.480
Helen wird zum Kurs über künstliche Intelligenz zurückkehren.

00:03.510 --> 00:08.760
Im heutigen Tutorial machen wir unseren ersten Schritt in die Welt von A-3. Als ersten

00:08.760 --> 00:11.220
Schritt werden wir herausfinden, wofür Missbilligung steht.

00:11.400 --> 00:14.270
A-3 C steht also für einen synchronen Vorteil.

00:14.310 --> 00:16.040
Schauspieler-Kritikalgorithmus.

00:16.260 --> 00:23.310
Dies ist ein Algorithmus, der bei Google im Jahr 2016 von einer Gruppe von Forschern gründlich entwickelt

00:23.370 --> 00:27.760
wurde. Er ist der innovative Algorithmus für künstliche Intelligenz.

00:27.780 --> 00:33.120
Bis jetzt gibt es mehrere Benachrichtigungen und wir werden dies im Kurs besonders in

00:33.390 --> 00:35.050
den praktischen Übungen besprechen.

00:35.160 --> 00:42.000
Trotzdem bläst dieser Algorithmus alles andere, einschließlich der tiefen Faltungs-Q-Lernnetzwerke, vollständig aus

00:42.240 --> 00:45.870
dem Wasser und ist schneller.

00:45.930 --> 00:50.300
Es dauert weniger Zeit für das Training und erzielt bessere Ergebnisse.

00:50.340 --> 00:55.680
In diesem Teil des Kurses werden wir uns also darauf beziehen,

00:55.680 --> 01:02.140
und wir haben bereits darauf Bezug genommen, indem wir noch mehr Papier auf das

01:02.140 --> 01:09.030
Papier verweisen, das veröffentlicht wurde, als zuerst A-3 eingeführt wurde minae und andere von Google

01:09.140 --> 01:15.660
deep mine, die Ihnen dieses Papier jetzt zeigen, damit Sie so eine Einführung haben.

01:16.020 --> 01:24.180
Also hier ist dieses Papier, das ich Ihnen zeigen wollte, damit Sie ein Gefühl dafür bekommen und sich ein wenig mit ihm vertraut

01:24.180 --> 01:25.180
machen können.

01:25.380 --> 01:33.270
Und natürlich ist es sehr empfehlenswert, die Zeitung zu lesen und zu verstehen, worüber sie

01:33.270 --> 01:39.900
genau sprechen, und Sie werden sehen, dass Adlon Sie während der praktischen

01:39.900 --> 01:48.240
Übungen durch bestimmte Abschnitte der Zeitung durch bestimmte Abschnitte oder Abschnitte führt relevant sein für das,

01:48.300 --> 01:51.870
was zu diesem Zeitpunkt programmiert wird.

01:51.960 --> 01:57.810
Und was ich hier hervorheben wollte, ist, wie Sie sehen können, dass hier viel recherchiert

01:57.810 --> 02:04.890
wurde, aber es gibt auch viele Referenzen, aber wie ein Teil des Bereichs ist es, dass am Ende

02:04.920 --> 02:09.950
die verschiedenen Algorithmen verglichen werden Ergebnisse, und darauf wollte ich hier hinweisen.

02:10.170 --> 02:11.450
Lassen Sie uns ein wenig vergrößern.

02:11.580 --> 02:18.090
Wie Sie also sehen können, ist auch bei Google ein tiefes Training drin oder sie bewerten ihre Algorithmen an Spielen genauso

02:18.150 --> 02:20.550
wie wir es in den Scores tun.

02:20.550 --> 02:27.690
Also genau das gleiche Prinzip, denn Spiele sind eine simulierte Umgebung oder eine kleine Umgebung eine begrenzte Umgebung mit

02:27.690 --> 02:32.780
bestimmten Regeln und sie möchten verstehen, wie gut diese künstliche Intelligenz in diesen Spielen

02:32.790 --> 02:33.570
funktioniert.

02:33.570 --> 02:34.080
Und es geht los.

02:34.080 --> 02:34.670
Genau.

02:34.680 --> 02:43.200
Alle diese Spiele, von denen Sie viele finden können, finden Sie im Open Gym und in den Spielen, mit denen wir

02:43.200 --> 02:44.250
gearbeitet haben.

02:44.250 --> 02:46.940
In diesem Abschnitt arbeiten wir beispielsweise mit Ausbrüchen.

02:46.940 --> 02:50.600
Es ist auch hier, wie Sie das für Breakout sehen können.

02:50.610 --> 02:55.470
Sie sind in Fettdruck dargestellt, sie haben den besten Algorithmus hervorgehoben, also ist Dick un der

02:55.470 --> 03:02.180
Algorithmus, mit dem wir gearbeitet haben, und dann noch ein paar andere Algorithmen. Dann haben Sie A-3, um zu sehen, ob Langzeit- oder

03:02.180 --> 03:03.540
Kurzzeitspeicher von LSD .

03:03.540 --> 03:08.270
Das ist das, was wir in diesem Teil des Kurses implementieren werden. Alle haben A-3 mit dem

03:08.280 --> 03:10.270
Nélisse-Team, was es noch stärker macht.

03:10.320 --> 03:15.620
Wie Sie sehen können, ist Breakout das beste Ergebnis, das von dreien Ihren Mitmenschen erzielt wird.

03:15.630 --> 03:17.010
Das ist also die Punktzahl.

03:17.110 --> 03:19.680
Sechs Sechs Punkt Acht im Vergleich zu den anderen.

03:19.890 --> 03:28.740
Und auch Sie können das für die meisten von ihnen sehen. Wenn Sie sich also jetzt ein größeres Bild machen, können Sie sehen, dass die

03:28.800 --> 03:31.990
meisten Mutigen tatsächlich in dieser letzten Spalte stehen.

03:32.010 --> 03:36.990
Ja, in der Tat gibt es einige Spiele, bei denen andere

03:36.990 --> 03:43.890
Algorithmen besser abschneiden, aber wie Sie sehen können, ist Dijk un tatsächlich in keinem der Spiele

03:43.890 --> 03:50.600
besser, aber Sie können sehen, dass es andere Algorithmen gibt cel ystem bietet die besten Ergebnisse.

03:50.640 --> 03:57.570
In den meisten Fällen kann man sehen, dass dieser Ball dieser Ball dieser Zauberstab dieser und so weiter ist.

03:57.570 --> 04:01.910
Sie sehen also, dass das Atriesystem ein wirklich mächtiger Algorithmus ist.

04:01.920 --> 04:08.430
Es ist in der Tat an der Spitze der künstlichen Intelligenz und genau das wird umgesetzt.

04:08.610 --> 04:15.600
Ein sehr aufregender Abschnitt, der vor Ihnen liegt, ermutigt Sie sehr, durch dieses Papier zu gehen und wirklich ein Gefühl

04:15.600 --> 04:18.170
dafür zu bekommen, worüber wir sprechen werden.

04:18.420 --> 04:24.650
Und dann werden wir in diesem Abschnitt und in der praktischen Seite der praktischen Seite

04:24.660 --> 04:27.240
von Stroh's ausführlich darauf eingehen.

04:27.240 --> 04:33.060
Wir werden hier tatsächlich mit ihrem Pseudocode arbeiten, der verfügbar ist und wir werden es

04:33.060 --> 04:33.470
sein.

04:33.570 --> 04:37.010
Ich werde Ihnen zeigen, wie Sie das umsetzen können und wie wir damit arbeiten werden.

04:37.380 --> 04:42.680
In diesem Sinne hoffe ich, dass Sie dieses Dokument genießen werden, und ich freue mich darauf, Sie das nächste Mal zu sehen.

04:42.690 --> 04:44.270
Und bis dahin genießen Sie AI.
