WEBVTT

00:00.390 --> 00:03.060
Hallo und willkommen zurück zu dem Kurs zum tiefen Lernen.

00:03.120 --> 00:06.010
Wir haben also in diesem Abschnitt viel gelernt.

00:06.030 --> 00:08.390
Fassen wir zusammen, worüber wir gesprochen haben.

00:08.580 --> 00:09.920
Also gut, hier gehts.

00:10.110 --> 00:16.230
Wir haben mit einem Eingabebild begonnen, auf das wir mehrere verschiedene Feature-Detektoren angewendet haben, oder auch

00:16.230 --> 00:19.100
Filter genannt, um diese Feature-Maps zu erstellen.

00:19.140 --> 00:21.530
Und dies umfasst unser Faltungslager.

00:21.630 --> 00:28.910
Dann haben wir zusätzlich zu dieser entscheidenden Lehre die Lineareinheit oder die gleichgerichtete lineare Einheit angewendet, um Klarheit zu beseitigen

00:28.980 --> 00:32.050
oder die Nichtlinearität in unseren Bildern zu erhöhen.

00:32.060 --> 00:36.970
Dann haben wir ein Pooling-Lager für unser Faltungslager angelegt.

00:36.990 --> 00:44.910
Aus jeder einzelnen Feature-Map haben wir also eine Puled-Feature-Map erstellt, und im Grunde hat die ziehende Lehre viele

00:44.910 --> 00:45.840
Vorteile.

00:45.840 --> 00:54.690
Der Hauptzweck der ziehenden Höhle besteht darin, sicherzustellen, dass wir in unseren Bildern eine besondere räumliche Invariante haben.

00:54.690 --> 01:01.890
Wenn sich also etwas neigt oder verdreht oder etwas vom idealen Szenario abweicht, können wir

01:01.890 --> 01:07.210
diese Funktion noch nutzen und das Ziehen der Bilder erheblich reduzieren.

01:07.260 --> 01:15.360
Auch das Pooling hilft dabei, jegliche Art von Überanpassung unserer Daten oder des Gesamtmodells an die Daten zu vermeiden,

01:15.360 --> 01:18.220
da diese Daten einfach entfernt werden.

01:18.450 --> 01:24.300
Gleichzeitig bewahrt das Pooling jedoch die Hauptfunktionen, nach denen wir suchen, nur weil die Art und Weise, wie

01:24.330 --> 01:26.720
Anweisungen und Pooling verwendet wurden, Max-Pooling war.

01:26.970 --> 01:35.760
Dann haben wir alle gepoolten Bilder in einen langen Vektor oder eine Spalte all dieser Werte geglättet, und wir haben das in ein

01:35.760 --> 01:40.140
künstliches neuronales Netzwerk eingefügt, und das war eine schrittweise Abflachung.

01:40.140 --> 01:46.770
Und Schritt vier ist ein vollständig verbundenes künstliches neuronales Netzwerk, in dem alle diese

01:46.920 --> 01:53.700
Funktionen über ein Netzwerk verarbeitet werden. Dann haben wir die letzte endgültige, vollständig verbundene Schicht,

01:53.910 --> 02:00.630
die die Abstimmung für die Klassen vornimmt, und danach wird alles trainiert durch einen

02:00.720 --> 02:02.550
Vorwärtsfortpflanzungs- und Rückwärtsfortpflanzungsprozess.

02:02.580 --> 02:09.730
Viele Iterationen und in Parks und am Ende haben wir ein sehr gut definiertes neuronales Netzwerk.

02:09.920 --> 02:10.470
Und.

02:10.730 --> 02:14.850
Eine weitere wichtige Sache ist, dass nicht nur die Gewichte im

02:15.180 --> 02:22.590
künstlichen Neuronen-Arbeitsteil trainiert werden, sondern auch die Merkmalsdetektoren in demselben anteiligen Prozess trainiert und eingestellt werden, wodurch wir die besten

02:22.590 --> 02:23.930
Merkmalskarten erstellen können.

02:23.940 --> 02:31.110
Und am Ende erhalten wir ein voll ausgebildetes neuronales Netz, das Bilder erkennen und klassifizieren

02:31.110 --> 02:31.700
kann.

02:31.770 --> 02:32.360
Also los geht's.

02:32.370 --> 02:35.480
So funktionieren konvolutionelle neuronale Netzwerke.

02:35.730 --> 02:42.220
Und jetzt sollten Sie sich mit diesem Konzept vollkommen auskennen und zu den praktischen Anwendungen übergehen.

02:42.330 --> 02:51.370
Wenn Sie noch etwas lesen möchten, gibt es einen großartigen Blog von L. D. ab 2016 aufzulösen.

02:51.450 --> 02:53.400
Sie können den Link dort oben sehen.

02:53.400 --> 02:58.360
Der Blog heißt also The Nine Deep Learning Papers, die Sie wissen müssen, um den dritten Teil von CNN

02:58.440 --> 02:59.180
zu verstehen.

02:59.310 --> 03:04.860
Und in diesem Blog erhalten Sie einen kurzen Überblick über neun verschiedene

03:04.860 --> 03:10.590
CNNs, die von Menschen wie Ihnen erstellt wurden, und andere, die Sie weiterführen können.

03:10.590 --> 03:18.000
Es wird also eine Menge neuer Dinge geben, die für Sie völlig neu sind und dass Sie sich umsehen müssen, aber

03:18.000 --> 03:23.880
denken Sie nur an diesen Blog, sind diese neun Artikel gedacht, und auch wenn Sie nicht bereit

03:23.880 --> 03:29.220
sind, durchzugehen Sie können jetzt vielleicht nach den praktischen Übungen vielleicht nach einem zusätzlichen Training

03:29.490 --> 03:36.180
im Bereich des tiefen Lernens langsam auf diese Arbeiten zurückgreifen, und im Idealfall denke ich, dass Sie durch das

03:36.180 --> 03:41.360
Durchschauen der neuronalen Netzwerke anderer Menschen und deren Struktur einen großen Wert bekommen .

03:41.550 --> 03:46.620
Es kann illusorische Netze geben, und dies wird Ihnen helfen zu verstehen, was die

03:46.620 --> 03:51.870
besten Praktiken sind und warum Menschen bestimmte Dinge auf eine bestimmte Art und Weise getan haben.

03:51.870 --> 03:57.900
Dies wird Ihnen bei der Architektur neuronaler Netzwerke helfen, da neuronale Netzwerke und konvolutionelle neuronale Netzwerke keine Ausnahme sind.

03:58.020 --> 04:05.670
Sie sind wie eine architektonische Herausforderung. Sie müssen sich eine Idee einfallen lassen, diese strukturieren, anpassen und

04:05.670 --> 04:11.780
anpassen, um das bestmögliche Design und die bestmögliche und optimale Leistung zu erhalten.

04:11.790 --> 04:12.490
Also los geht's.

04:12.510 --> 04:13.430
Das sind wir für heute.

04:13.420 --> 04:17.720
Ich hoffe, Ihnen hat das heutige Tutorial und dieser ganze Abschnitt gefallen und ich freue mich darauf, Sie das nächste Mal zu sehen.

04:17.730 --> 04:19.440
Bis dahin tiefes Lernen genießen.