WEBVTT

00:01.110 --> 00:04.770
Hallo, willkommen zurück zum Kurs über künstliche Intelligenz.

00:04.770 --> 00:09.420
Heute werden wir den Angriffsplan für den Abschnitt besprechen, über den wir über Töten lernen.

00:09.450 --> 00:15.000
Und wir haben einige Tutorials, daher denke ich, dass es eine gute Idee

00:15.000 --> 00:20.580
ist, schnell durchzugehen, um zu verstehen, was in den kommenden Videos zu erwarten ist.

00:20.580 --> 00:21.650
Auf geht's.

00:22.140 --> 00:22.560
Gut.

00:22.560 --> 00:25.230
Was wir in diesem Abschnitt lernen werden.

00:25.230 --> 00:31.650
Zuerst werden wir zuerst darüber sprechen, was Verstärkungslernen tatsächlich ist und was die Philosophie

00:31.690 --> 00:37.890
hinter Verstärkungslernen ist und wie Verstärkungslernen tatsächlich im wirklichen Leben gesehen werden

00:37.890 --> 00:44.540
kann und wie es mit Dingen zusammenhängt, die wir im wirklichen Leben beobachten .

00:44.790 --> 00:51.630
Sie sprechen nicht über die Bellmen-Gleichung, sondern um ein grundlegendes Konzept, das alles oder viele

00:51.630 --> 00:56.580
Dinge, die gerade geschehen, und für die Stärkung des Lernens vor

00:56.940 --> 01:01.700
allem im Bereich des CULE-Lernens untermauert die folgenden Abschnitte.

01:01.800 --> 01:09.280
Dann sprechen wir über den Plan und den Plan, den die künstliche Intelligenz von Roheisen mit

01:09.300 --> 01:15.990
sich bringt, um in Umgebungen navigieren zu können. Wir werden sehen, wie das zusammenkommt, aber

01:15.990 --> 01:17.270
sehr interessant.

01:17.720 --> 01:22.890
Dort werden wir über den Markt der Entscheidungsprozesse und Ihr Konzept

01:22.890 --> 01:31.620
sprechen. Wir werden ein sehr neues Konzept einführen, das unserer Belman-Gleichung allmählich eine Stufe der Raffinesse zu unserem gesamten Verstärkungslernen

01:31.800 --> 01:37.070
zu unseren CULE-Lernkonzepten hinzufügen wird Dieser Abschnitt ist so strukturiert, dass wir

01:37.290 --> 01:43.080
die Bollmann-Gleichung in einer sehr vereinfachenden Form einführen. Im Verlauf der Tutorials fügen wir

01:43.260 --> 01:48.550
langsam einige Ebenen der Komplexität hinzu, um zur endgültigen Version zu gelangen.

01:48.690 --> 01:53.880
Das ist unser Ziel in Bezug auf Hillary, aber wir kommen langsam dahin.

01:54.000 --> 01:58.830
Damit wir genug Zeit haben, all diese Informationen zu verarbeiten und sich einzulassen.

01:58.890 --> 02:05.400
Und ein Zeichen von Dissidenten-Prosa ist eine zusätzliche Ebene der Raffinesse, zusätzlich zu dem, was wir diskutiert haben oder

02:05.400 --> 02:11.220
was wir haben werden oder bis dahin diskutiert wird, dann wird über Richtlinien und Pläne gesprochen.

02:11.220 --> 02:13.830
Ein weiterer interessanter Tauriel sind alle interessant.

02:13.830 --> 02:19.590
Ein weiteres kurzes Tutorial, in dem erläutert wird, wie sich die Politik von den Plänen unterscheidet und welche

02:19.590 --> 02:25.980
Unterschiede es gibt. Dies sind Begriffe, die Sie wahrscheinlich in der Literatur hören oder lesen werden, wenn Sie sich

02:25.980 --> 02:29.980
eingehend damit befassen, um zusätzliche Informationen zum verstärkten Lernen zu erhalten.

02:29.980 --> 02:34.590
Sie reden alle darüber, dass wir unserer Umwelt eine lebenslange Strafe zufügen.

02:34.770 --> 02:41.850
Dies ist eine weitere Möglichkeit, den Umgebungen, in denen unsere Agenten arbeiten werden, mehr Komplexität

02:41.850 --> 02:43.340
zu verleihen.

02:43.370 --> 02:48.780
Sie sprechen alle über die Intuition, die hinter dem Lernen steckt. Bis zu diesem Tutorial sprechen

02:48.780 --> 02:50.690
wir über Werte von Staaten.

02:50.790 --> 02:57.300
Und schließlich werden wir zu Werten, Aktionen oder Cube-Werten wechseln und dann

02:57.300 --> 02:59.880
den zeitlichen Unterschied einführen.

02:59.910 --> 03:06.690
Dies ist ein Tutorial, in dem alles, was wir gelernt haben, zusammenkommen wird, um zu

03:06.690 --> 03:13.930
erklären, wie Agenten oder künstliche Intelligenz genau wissen, wie sie ihre Werte durch den gesamten iterativen

03:14.090 --> 03:16.420
Prozess aktualisiert, der gerade durchläuft.

03:16.830 --> 03:23.100
Und schließlich werden wir uns eine sichtbare Lernenzusammenstellung ansehen, also nehmen wir alles, was wir lernen,

03:23.100 --> 03:29.550
und wir werden es vor unseren Augen sehen und sehen, wie eine künstliche Intelligenz CULE-Lernen ausführt

03:29.730 --> 03:35.870
Alle Dinge, die wir auf einer intuitiven Ebene besprechen werden, werden in der Praxis tatsächlich

03:35.880 --> 03:42.600
durchgeführt werden. Dies wird uns dabei helfen, das Wissen, das wir in diesem Abschnitt erhalten werden, noch

03:42.810 --> 03:44.530
weiter zu erfassen.

03:44.550 --> 03:47.460
Hoffentlich sind Sie sehr auf die kommenden Tutorials gespannt.

03:47.460 --> 03:48.800
Ich bin definitiv.

03:48.810 --> 03:55.380
Und da kommen einige sehr interessante Folien und noch wichtiger, die Konzepte selbst sind sehr interessant und

03:55.380 --> 03:59.540
ich bin mir sicher, dass Sie sie sehr genießen werden.

03:59.760 --> 04:01.410
Und ich freue mich darauf, Sie das nächste Mal zu sehen.

04:01.410 --> 04:03.080
Bis dahin genießen Sie die KI.