WEBVTT

00:00.690 --> 00:05.730
Hallo und willkommen zurück zu dem Kurs zum tiefen Lernen in der Presse des Tauriels. Wir haben herausgefunden, worum es

00:05.810 --> 00:07.290
bei konvolutionellen neuronalen Netzwerken geht.

00:07.350 --> 00:11.050
Und heute werden wir in die Faltung von Schritt 1 eintauchen.

00:11.100 --> 00:18.530
Dies ist also die Faltungsfunktion und wir versuchen, der Mathematik fern zu bleiben und die Dinge intuitiv zu halten.

00:18.540 --> 00:25.110
Ich kann diese Formel jedoch nicht für Sie freigeben, weil es so einfach ist, dass eine Faltung

00:25.110 --> 00:31.380
im Wesentlichen eine kombinierte Integration der beiden Funktionen darstellt. Sie zeigt Ihnen, wie eine Funktion die

00:31.470 --> 00:36.520
andere oder die Form der anderen Funktion modifiziert Wenn Sie Signalverarbeitung, Elektrotechnik

00:36.520 --> 00:42.390
oder einen Beruf ausführen, bei dem Signalverarbeitung erforderlich ist, hätten Sie unweigerlich eine Schlußfunktion gefunden.

00:42.390 --> 00:44.090
Es ist jetzt ziemlich beliebt.

00:44.100 --> 00:49.490
Wieder werden wir die mathematischen Lichter halten oder sie getrennt halten.

00:49.500 --> 00:56.190
Und wenn Sie sich mit der Mathematik hinter den konvolutionellen neuronalen Netzwerken befassen möchten,

00:56.520 --> 01:05.010
lesen Sie die Einführung in die konvolutionellen neuronalen Netzwerke von Jensine Wu, Professor an der Nanjing University in

01:05.010 --> 01:05.820
China.

01:05.820 --> 01:12.780
Dieses Papier wurde vor fünf oder sechs Tagen buchstäblich vor Tagen veröffentlicht

01:12.780 --> 01:17.690
und richtet sich speziell an Menschen, die

01:18.250 --> 01:23.700
sich an Anfänger wenden, die konvolutionelle neuronale Netze kennenlernen.

01:23.730 --> 01:32.040
Und ja, er sagte, sein ganzes Ziel sei es, die komplexen Dinge zu brechen oder aufzubrechen, damit Leute, die in diesem Bereich neu

01:32.040 --> 01:33.360
sind, verstehen können.

01:33.360 --> 01:40.680
Und er erwähnte auch, dass er einige Materialien auf seiner Homepage zur Verfügung hat. Wenn Sie also nur die letzten beiden

01:40.680 --> 01:47.220
Teile entfernen und Slash W mögen. J. X zu dem Teil, der

01:47.220 --> 01:52.380
seine Homepage ist, und Sie werden in der Lage sein, weitere Tutorials und Materialien

01:52.380 --> 01:59.120
zu finden, die noch nicht als Papiere veröffentlicht wurden, aber er verwendet sie in seinen Tutorials, sodass Sie

01:59.130 --> 02:05.130
diese nützlich finden könnten. Ich würde gerne eine Einführung in die Mathematik hinter neuronalen Koalitionsnetzen erhalten

02:05.130 --> 02:08.470
und eine Art Basis in diesem Bereich aufbauen.

02:08.550 --> 02:12.570
Aber wir gehen weiter und sprechen über die Faltung.

02:12.570 --> 02:17.160
Was ist hier eine intuitive, intuitive Lösung?

02:17.160 --> 02:21.690
Wir haben ein Eingabebild, wie wir besprochen haben. So werden Bilder nur Einsen und Nullen betrachtet, um die

02:21.690 --> 02:22.750
Dinge zu vereinfachen.

02:22.950 --> 02:25.050
Und Sie können das Smiley-Gesicht dort sehen.

02:25.090 --> 02:28.660
Dann haben wir einen Feature-Detektor, also drei und drei Matrix-Detektoren.

02:28.740 --> 02:30.120
Muss es drei mal drei sein?

02:30.150 --> 02:31.920
Nein, tut es nicht.

02:31.920 --> 02:35.810
Alex net denke ich verwendet sieben mal sieben.

02:35.850 --> 02:41.640
Und dann verwendet ein anderer dieser berühmten Geräte fünf mal fünf Merkmalsdetektoren.

02:41.640 --> 02:48.270
Sie können unterschiedlich sein, aber in der Regel werden Sie feststellen, dass es sich um drei mal drei

02:48.270 --> 02:52.110
handelt. Sie wissen, warum sie drei mal drei sind.

02:52.170 --> 02:57.510
Mit einem Drei-zu-Drei-Feature-Detektor sind auch die als "Merkmalsdetektoren" bezeichneten Merkmale wichtige Begriffe, weil Sie auf

02:57.510 --> 02:58.710
sie stoßen könnten.

02:58.710 --> 03:04.080
Es gibt viele verschiedene Begriffe für den Feature-Detektor, aber die gebräuchlichsten

03:04.110 --> 03:09.540
sind der Feature-Detektor oder Eik hört es als Kernel oder als Filter.

03:09.540 --> 03:14.760
In diesem Kurs werden wir entweder einen Filter oder einen Merkmalsdetektor

03:14.760 --> 03:23.670
austauschbar verwenden, bedenken Sie jedoch, dass er diese Namen hat und eine Koalitionsoperation durch ein X in einem Kreis gekennzeichnet wird.

03:23.670 --> 03:31.230
Wie Sie in den Formeln zuvor und hier gesehen haben, ist das, was passiert, auf einer intuitiven Ebene oder denken Sie einfach daran,

03:31.230 --> 03:34.980
was tatsächlich im Hintergrund passiert, und nicht an der Mathematik.

03:35.010 --> 03:40.740
Nun nehmen Sie diesen Merkmalsdetektor oder -filter und legen Sie ihn auf Ihr Bild, wie Sie es auf der linken Seite sehen.

03:40.740 --> 03:48.120
Sie decken also beispielsweise in diesem Fall die obere linke Ecke der neun Pixel in der oberen linken Ecke ab und

03:48.450 --> 03:58.760
multiplizieren im Grunde jeweils einen wertvollen Wert, so dass der Wert so ist, dass die obere 0 mit dem oberen linken Wert mit dem oberen linken Wert dann im

03:58.780 --> 04:04.980
Grunde ist in Position von 1 1 durch Position etwa 1 1 Positionsnummer oder 0 1 0

04:05.090 --> 04:08.670
1 0 2 durch 0 2 und so weiter.

04:08.670 --> 04:13.410
Es ist also eine elementweise Multiplikation dieser Matrizen.

04:13.410 --> 04:14.460
Und dann addieren Sie das Ergebnis.

04:14.460 --> 04:20.010
In diesem Fall stimmt also nichts überein, es ist also entweder 0 durch 0 0 oder durch 1.

04:20.010 --> 04:21.280
Das Ergebnis ist also Null.

04:21.530 --> 04:26.610
Und hier kann man sehen, dass einer von ihnen einen auf der linken Seite angeglichen hat.

04:26.610 --> 04:28.120
Und deshalb haben wir hier eine 1.

04:28.120 --> 04:30.820
Nichts passte zusammen. Nichts passte zusammen.

04:30.890 --> 04:38.100
Dann gehen wir weiter zum nächsten Wurf und Schritt, bei dem wir diesen ganzen Filter verschieben, wird als Schritt

04:38.100 --> 04:38.610
bezeichnet.

04:38.610 --> 04:40.570
Hier haben wir also einen Schritt von einem Pixel.

04:40.680 --> 04:45.820
Hier kann man wieder etwas sehen, das in der rechten unteren Ecke mit dem Schritt übereinstimmt, aber

04:46.110 --> 04:50.850
eine untere in der Mitte, die hier oben rechts angeordnet ist, entspricht dem Nichts.

04:50.970 --> 04:52.040
Der Schritt ist eins.

04:52.170 --> 04:53.930
Sie können den Schritt ändern.

04:54.330 --> 04:56.260
Sie können es zwei machen.

04:56.340 --> 04:58.580
Du wirst drei bekommen, was du willst.

04:58.830 --> 05:02.770
Die letztendlich gut funktionierende ist in der Regel ein oder zwei.

05:02.800 --> 05:04.280
Also halten sich die Leute daran.

05:04.600 --> 05:09.480
Und wir werden darüber sprechen, was der Schritt gegen Ende dieses Tutorials ist.

05:09.520 --> 05:14.170
Wir haben also absolut zusammenpassen, wenn ich höre, dass Sie zwei sehen können, weil

05:14.170 --> 05:17.270
zwei davon übereinstimmen und so weiter und so weiter.

05:17.290 --> 05:24.830
Also los geht's, es gibt noch eine andere, die da zusammen passt, wir gehen und wir sind fertig.

05:24.830 --> 05:27.770
Was haben wir also geschaffen?

05:27.800 --> 05:28.600
Recht.

05:28.820 --> 05:31.860
Hier einige wichtige Dinge.

05:31.970 --> 05:38.240
Das Bild auf der rechten Seite wird als Feature-Map bezeichnet. Es gibt auch einige Begriffe, die manchmal als

05:38.870 --> 05:40.530
Vold-Feature bezeichnet werden können.

05:41.000 --> 05:46.280
In Ihrem Blog- und Volutionsoperationsoperator wird also etwas nicht verwunden, sondern es wird gefaltet und es hat

05:46.280 --> 05:53.680
manchmal den Anschein, als würde ich für mich in die falsche Richtung denken, aber es ist der richtige Begriff, der gefaltet ist, ist

05:53.700 --> 05:57.900
eine Art alter Funktion oder es kann auch wird die Aktivierungskarte genannt.

05:58.040 --> 06:02.510
Aber wir werden es in diesem Kurs als Feature-Map bezeichnen, so dass man eines dieser

06:03.500 --> 06:06.300
Dinge nennen kann und was wir hier gemacht haben.

06:06.320 --> 06:09.910
Wie Sie sehen, haben wir die Größe des Bildes reduziert.

06:09.920 --> 06:15.500
Das ist die Nummer eins und das ist das Wichtigste, was ich über Ihr Eingabebild, den Feature-Text und

06:15.500 --> 06:17.090
den Schritt erwähnen wollte.

06:17.240 --> 06:21.690
Wenn Sie nur einen Schritt weiter sind, können Sie das Bild etwas verkleinern, aber wenn Sie ein

06:21.690 --> 06:25.410
Recht auf das Bild haben, wird mehr erzeugt, so wird das Feature noch kleiner.

06:25.610 --> 06:33.950
Und das ist eine sehr wichtige Funktion des Merkmalsdetektors dieses gesamten Faltungsschritts: Die Verkleinerung des Bildes

06:33.950 --> 06:42.100
ist einfacher, da es einfacher ist, es zu verarbeiten und es wird nur schneller.

06:42.110 --> 06:51.830
Es wird und Sie werden nur förderlich sein, denn stellen Sie sich vor, wir hätten ein 7: 7-Bild, aber stellen Sie

06:51.860 --> 06:55.310
sich vor, Sie haben ein richtiges Foto.

06:55.700 --> 07:02.270
Oder wenn Sie wie ein 256. auf einem 56-Pixel-Bild haben, ist es eine riesige Anzahl von Pixeln, die ich gewählt habe, wenn

07:02.900 --> 07:06.940
das X-Quadrat oder ähnliches gilt, sagen wir, Sie haben 300, aber 300 Pixel.

07:07.060 --> 07:13.400
Wir werden also nicht mit dem R verwechselt. G. B 256 muss sagen, als hätten wir ein 300 x 300 Bild

07:13.400 --> 07:14.720
in Bezug auf Größe und Pixel.

07:14.780 --> 07:22.640
Dann haben Sie 300 Quadratpixel, das ist eine enorme Anzahl von Pixeln, und daher verringern Merkmalsdetektoren die Größe des

07:23.360 --> 07:27.580
Bildes und daher ist ein Schritt von zwei von Vorteil.

07:27.740 --> 07:29.970
Aber dann fragen wir uns, ob wir Informationen verlieren.

07:29.990 --> 07:34.520
Verlieren wir Informationen, wenn wir den Merkmalsdetektor anwenden?

07:34.520 --> 07:40.580
Nun, einige Informationen verlieren wir natürlich, weil wir weniger Werte und eine daraus resultierende Matrix haben.

07:40.700 --> 07:45.950
Gleichzeitig besteht der Zweck des Merkmalsdetektors jedoch darin, bestimmte Merkmale bestimmter Teile des Bildes

07:45.950 --> 07:48.170
zu erkennen, die integral sind.

07:48.620 --> 07:53.150
Wenn Sie beispielsweise so darüber nachdenken, hat der Merkmalsdetektor ein

07:53.150 --> 07:54.080
bestimmtes Muster.

07:54.080 --> 07:57.950
Die höchste Zahl in Ihrer Feature-Map ist, wenn das Muster übereinstimmt.

07:57.950 --> 08:04.820
In der Tat ist die höchste Zahl, die Sie erhalten können, in einem vereinfachten Beispiel, wenn die Funktion

08:04.820 --> 08:10.550
genau übereinstimmt und Sie die Nummer vier in unserer Funktionskarte sehen können, die genau ist.

08:10.550 --> 08:16.910
Wenn Sie es hier anschauen, ist genau dieser Merkmalsdetektor, denn es gibt nur vier und er

08:16.910 --> 08:21.460
passte perfekt, so dass Sie diesen Teil hier sehen können.

08:21.470 --> 08:23.220
Also wurde das Feature hier erkannt.

08:23.450 --> 08:32.340
Und wie wir am Anfang dieses Abschnitts besprochen haben, ist es, wie wir Dinge sehen, wie wir es

08:32.430 --> 08:33.080
erkennen.

08:33.090 --> 08:40.410
Wir betrachten nicht jeden einzelnen Pixel sozusagen in dem, was wir auf einem Bild oder im wirklichen Leben sehen.

08:40.410 --> 08:46.440
Wir betrachten nicht jedes einzelne Bild, das wir uns anschauen, wir betrachten die Nase, die Hüte,

08:47.070 --> 08:55.110
die Feder, die Augen unter den kleinen schwarzen Flecken unter den Augen des Geparden, um zwischen einem Gepard und einem Leoparden oder

08:55.110 --> 08:57.470
der Form des Zugs zu unterscheiden.

08:57.480 --> 09:02.610
Wir unterscheiden nicht zwischen einem Hochgeschwindigkeitszug und einem normalen Zug und so

09:02.610 --> 09:08.110
weiter, sodass wir uns nicht alles ansehen, was wir uns mit Features beschäftigen.

09:08.110 --> 09:15.480
Tatsächlich ist es das, was es uns ermöglicht, all die unnötigen Dinge voranzutreiben und zu beseitigen, die wir als

09:15.570 --> 09:22.740
Menschen nicht so viele Informationen verarbeiten, die in Ihre Augen gehen, die zu jeder Zeit wie Gigabytes Informationen

09:22.740 --> 09:28.680
aussehen, wenn Sie jeden einzelnen Punkt betrachten Wenn nicht Terabytes an Informationen pro Sekunde in

09:28.680 --> 09:35.640
Ihre Augen gelangen und wir trotzdem fortfahren können, weil wir das Unnötige beseitigen, konzentrieren wir uns nur

09:35.640 --> 09:41.510
auf die wichtigen Funktionen, die für uns wichtig sind, und genau dies tun die

09:41.640 --> 09:42.270
Funktionen.

09:42.270 --> 09:51.030
Nun geht es weiter mit unserem Eingabebild, und wir erstellen eine Feature-Map, also sagen wir, die vordere ist die, die wir gerade erstellt haben, aber

09:51.030 --> 09:54.300
wie kommt es, dass es viele davon gibt.

09:54.300 --> 10:00.300
Wir erstellen jedoch mehrere Feature-Maps, weil wir unterschiedliche Filter verwenden.

10:00.300 --> 10:00.590
Recht.

10:00.630 --> 10:05.430
Auf diese Weise bleiben viele Informationen erhalten, so dass wir nicht nur eine

10:05.880 --> 10:12.600
Feature-Map haben, sondern nach bestimmten Features suchen und dann oder im Wesentlichen das Netzwerk durch das Training entscheidet. Dies

10:12.600 --> 10:18.030
wird am Ende des Abschnitts besprochen Durch sein Training entscheidet er, welche Funktionen für bestimmte

10:18.120 --> 10:23.670
Typen oder bestimmte Kategorien wichtig sind, und er sucht danach und wird daher unterschiedliche Filter

10:23.670 --> 10:26.070
haben. Wir sprechen jetzt über Filter.

10:26.160 --> 10:32.280
Aber im Grunde wende ich diese Filter an, damit diese Feature-Map verwendet wird, dass sie einen Filter wie den, den wir gesehen haben, angewendet

10:32.280 --> 10:36.270
hat. Um dieses Feature zu erhalten, wendet Mabbett jedoch einen anderen Filter an, damit dieses

10:36.270 --> 10:38.080
Feature einen anderen Filter verwendet usw.

10:38.370 --> 10:43.430
Im Grunde erstellt es diese Feature-Maps.

10:43.650 --> 10:49.700
Und deshalb denke ich, dass der Begriff Feature-Detektor für mich besser ist als Filter.

10:49.710 --> 10:56.040
Denken Sie daran, wir sind hier, wir haben diesen Filter, den wir auch als Feature-Detektor bezeichnen können.

10:56.040 --> 10:59.440
Tatsächlich ist der Wort-Feature-Detektor meiner Meinung nach besser geeignet.

10:59.490 --> 11:03.390
Und der Grund dafür ist der Zweck.

11:03.390 --> 11:06.510
Wir wollen nicht nur unser Image herausfiltern.

11:06.510 --> 11:10.220
Aber auch wenn das Ganze ein Ganzes ist, ist es nur eine Frage der Terminologie.

11:10.230 --> 11:11.990
Grundsätzlich möchten wir jedoch Merkmale erkennen.

11:12.000 --> 11:12.270
Gut.

11:12.270 --> 11:19.680
In diesem Abschnitt begeben wir uns auf diese Feature-Map, die wir entdeckt haben, wo bestimmte Features im Bild vorhanden sind,

11:19.800 --> 11:24.240
und diese Feature-Map, an der sich bestimmte andere Features befinden, an denen

11:24.240 --> 11:30.350
sich ein bestimmtes Feature und diese Feature-Map befinden wird erkannt, wo sich eine bestimmte andere Funktion im

11:30.350 --> 11:31.420
Bild befindet.

11:31.440 --> 11:33.420
Das ist also, was wir tun.

11:33.420 --> 11:40.470
Und hör zu, wir haben ein paar Beispiele. Hier verwenden wir und das ist von Gip dot org.

11:40.610 --> 11:48.690
Ihre Dokumentation ist ein ähnliches Werkzeug wie Paint, und Sie können es verwenden, um Ihre Bilder anzupassen oder mit Ihren Bildern

11:48.690 --> 11:49.550
zu arbeiten.

11:49.560 --> 11:56.490
Grundsätzlich haben sie jedoch einige wertvolle Beispiele in ihrer Dokumentation. Hier haben sie ein Bild vom Taj Mahal und

11:56.490 --> 11:59.790
Sie können wählen, welchen Filter Sie anwenden möchten.

11:59.880 --> 12:06.150
Wenn Sie also dieses Programm herunterladen und ein Foto hochladen, können Sie eine Konvertierungsmatrix starten

12:06.150 --> 12:12.600
und Filter anwenden, und Sie werden feststellen, dass diese englischen Matrizen tatsächlich in der Bildverarbeitung und

12:12.600 --> 12:15.240
im Design usw. angewendet werden.

12:15.240 --> 12:17.150
Schauen wir uns also an, was wir bekommen.

12:17.240 --> 12:21.520
Wenn wir also diesen Filter fünf in der Mitte anwenden, wird eins eins eins eins eins.

12:21.690 --> 12:23.780
Sie können sehen, dass das Bild schärfer wird.

12:23.890 --> 12:29.010
Das ist also ganz intuitiv, wenn Sie daran denken.

12:29.010 --> 12:36.300
Also ist 5 das Pixel des Hauptpixels wie in der Mitte des Filters oder des Merkmalsdetektors

12:36.600 --> 12:43.410
und dann minus eins minus eins, nur eine Art reduziert die Pixel um das a

12:44.430 --> 12:45.000
intuitiv.

12:46.170 --> 12:47.020
Dann verwischen

12:47.040 --> 12:54.150
Grundsätzlich gilt also gleichbedeutend, dass alle Pixel in der Mitte gleich groß sind. Daher werden

12:54.150 --> 12:59.070
die Pixel miteinander kombiniert und Sie erhalten eine Unschärfekante.

12:59.070 --> 13:03.860
Hier kann man also sehen, dass es minus eins und eins ist, und dann bekommt man Nullen.

13:03.870 --> 13:11.100
Sie haben also gelöscht, um die Pixel um das Hauptelement in der Mitte zu entfernen, und Sie behalten dieses nur bei einem Minuszeichen. Dies

13:11.100 --> 13:15.610
gibt Ihnen einen Vorteil und dies war etwas schwieriger zu verstehen, wie es funktioniert.

13:16.290 --> 13:20.700
Wie wahrscheinlich schwerer, nur intuitiv an den Rand zu denken.

13:20.700 --> 13:23.340
Richtig, das macht wahrscheinlich mehr Sinn.

13:23.340 --> 13:25.860
Richtig, du nimmst sie eine Mitte.

13:25.850 --> 13:28.880
Sie reduzieren die mittlere.

13:29.050 --> 13:36.180
Wahrscheinlich gefällt Ihnen die Stärke des mittleren Pixels und Sie suchen dann nach denen, nach denen Sie suchen.

13:36.420 --> 13:41.980
Diese, die Sie sehen, erhöhen die Stärke der um sie herum.

13:42.090 --> 13:43.910
Also hast du die da.

13:44.720 --> 13:45.610
Ja das ist.

13:45.690 --> 13:50.700
Das gibt dir einen Vorteil, und du kannst sehen, was du da bekommst und einen anderen anführen.

13:50.700 --> 13:58.130
Der Schlüssel hier ist also, dass es symmetrisch ist und Sie können sehen, dass das Bild auch asymmetrisch

13:58.140 --> 14:03.580
wird, so dass Sie das Gefühl haben, dass es sich Ihnen gegenüber zeigt.

14:03.840 --> 14:08.910
Und das bekommst du, wenn du hier Minuspunkte hast und hier ist dies auch ein

14:08.970 --> 14:14.160
bisschen technisch, aber zumindest können wir eine Art Intuition bekommen und Lissa geht schnell wieder durch.

14:14.160 --> 14:21.480
Es gibt also eine Schärfe, es gibt Unschärfen, es gibt kantige Hände, dort gibt es eine Kantenerkennung und einen Boss.

14:21.480 --> 14:27.350
So wie Sie sehen, sind dies großartige Beispiele für dasselbe Bild, aber wir erhalten Feature-Maps.

14:27.360 --> 14:32.430
Daher verwenden wir verschiedene Funktionsdetektoren, um verschiedene Funktionskarten des gleichen Bildes zu erhalten.

14:32.430 --> 14:40.380
Daher haben wir jetzt eine Menge der letzten dieser Versionen dieses Bildes, in denen wir versucht haben, bestimmte Dinge in

14:40.440 --> 14:44.920
diesen Begriffen zu entdecken, die sie nicht zutreffen zu uns.

14:44.940 --> 14:50.460
Ihr zweiter Chef ist in Bezug auf konvolutionelle neuronale Netze wahrscheinlich nicht für uns geeignet, aber das Alter erkennt, dass

14:50.550 --> 14:51.630
dies wichtig ist.

14:51.630 --> 14:58.590
Wir möchten die Kanten erkennen, die die Kantenvergrößerung wahrscheinlich nicht verwackeln, also bestimmte Dinge wie z. B. kantigen Text.

14:58.580 --> 15:02.450
Wahrscheinlich der wichtigste für unsere Arbeit.

15:02.460 --> 15:07.560
Und wenn es um Computer geht, werden sie selbst entscheiden, oder neuronale Netzwerke entscheiden selbst, was

15:07.560 --> 15:12.900
wichtig ist, was nicht ist, und es wird wahrscheinlich nicht einmal für das menschliche Auge erkennbar sein.

15:12.900 --> 15:14.910
Sie werden nicht verstehen können, was diese Funktionen bedeuten.

15:14.910 --> 15:22.530
Aber der Computer wird entscheiden, und das ist das Schöne an neuronalen Netzwerken, die sie so viele verschiedene Dinge verarbeiten

15:22.530 --> 15:28.950
und verstehen können, ohne diese Intuition zu haben oder ohne diese Erklärung, warum sie verstehen, welche Funktionen

15:28.950 --> 15:34.380
für sie wichtig sind, ob wir einen Namen dafür haben oder Nicht, dass dies

15:34.810 --> 15:39.830
eine Gesamtheit ist, die für das künstliche neuronale Netzwerk keine Rolle spielt.

15:39.990 --> 15:41.260
Und mein Liebling.

15:41.280 --> 15:50.940
Hier ist ein Bild von Geoffrey Hinton von Geoffrey Hinton, der einen dieser Filter passiert hat.

15:50.940 --> 15:53.070
Also gut, das bringt uns zum Ende von Teresa Tauriel.

15:53.070 --> 15:55.460
Ich hoffe, es hat Ihnen Spaß gemacht, etwas über Faltung zu lernen.

15:55.470 --> 16:02.490
Der Schlüssel dazu ist, dass die Faltung der Hauptzweck unserer Entwicklung darin besteht, Merkmale in Ihrem Bild mithilfe des

16:02.490 --> 16:08.280
Merkmaldetektors zu finden, sie in eine Merkmalskarte aufzunehmen und durch das Einfügen in eine zukünftige

16:08.340 --> 16:15.710
Karte die räumlichen Beziehungen zwischen Pixeln zu erhalten, was sehr wichtig ist für uns wissen Sie, denn wenn sie völlig

16:15.720 --> 16:19.280
durcheinander geraten sind, haben wir das Muster verloren.

16:19.350 --> 16:25.110
Gleichzeitig ist es wichtig zu verstehen, dass die Funktionen eines neuronalen Netzwerks zumeist bestimmte

16:25.110 --> 16:32.430
Bilder erkennen und verwenden, um bestimmte Bilder zu erkennen. Klaas 'Bilder bedeuten für die Menschen nichts, aber sie funktionieren

16:32.460 --> 16:33.120
trotzdem.

16:33.120 --> 16:34.420
Und so ist Faltung.

16:34.440 --> 16:36.280
Und ich freue mich darauf, Sie als nächstes bei Tauriel zu sehen.

16:36.300 --> 16:37.980
Bis dahin viel Spaß beim Lernen.