WEBVTT

00:00.540 --> 00:03.030
Hallo en welkom terug bij de cursus over diep leren.

00:03.030 --> 00:07.080
In de vorige tutorial hebben we ontdekt waar convolutionele neurale netwerken over gaan.

00:07.200 --> 00:10.600
En vandaag gaan we in stap één convolutie duiken.

00:10.980 --> 00:14.640
Dit is dus de convolutiefunctie.

00:14.880 --> 00:20.730
Ik weet dat we proberen weg te blijven van wiskunde en dingen intuïtief te houden, maar ik kon het niet helpen, maar ik deel

00:20.730 --> 00:23.040
deze formule voor je omdat het zo eenvoudig is.

00:23.070 --> 00:30.330
Een convolutie is in feite een gecombineerde integratie van twee functies en het laat zien hoe de ene functie de andere wijzigt

00:30.330 --> 00:32.640
of de vorm van de andere wijzigt.

00:32.640 --> 00:38.370
En als je signaalverwerking of elektrotechniek hebt gedaan of een beroep hebt gedaan waar signaalverwerking

00:38.370 --> 00:42.330
vereist is, zou je onvermijdelijk een conclusiefunctie zijn tegengekomen.

00:42.330 --> 00:43.330
Het is behoorlijk populair.

00:43.710 --> 00:49.410
Nu, nogmaals, we gaan de wiskunde licht houden of ze gescheiden houden.

00:49.410 --> 00:55.860
En als je meer wilt weten over de wiskunde achter de convolutionele neurale netwerken, is

00:55.860 --> 01:04.380
een geweldige aanvulling om te lezen Inleiding tot convolutionele neurale netwerken door Janson Wu, een professor aan de Nanjing University

01:04.380 --> 01:05.520
in China.

01:05.790 --> 01:12.720
Dit artikel is letterlijk dagen geleden gepubliceerd, zoals vijf of zes dagen geleden, en het is specifiek gericht

01:12.720 --> 01:17.340
op mensen die beginnen met beginners die convolutionele neurale netwerken leren kennen.

01:17.370 --> 01:20.080
Dus de wiskunde daar moet toegankelijk zijn.

01:20.100 --> 01:30.540
Ik heb professor Tientsin Wu eigenlijk een e-mail gestuurd en hij zei dat zijn hele doel is om de complexe dingen op te lossen, zodat mensen die nieuw

01:30.540 --> 01:33.270
zijn op dit gebied het kunnen begrijpen.

01:33.300 --> 01:38.910
En hij zei ook dat hij wat materiaal beschikbaar heeft op zijn homepage.

01:38.910 --> 01:40.500
Zo weinig in de URL.

01:40.500 --> 01:47.160
Als je gewoon de laatste twee delen verwijdert en je gaat gewoon W. J. X naar dat deel, dat is zijn

01:47.160 --> 01:47.610
startpagina.

01:47.820 --> 01:52.920
En je zult in staat zijn om meer aanvullende tutorials en materialen te vinden die niet als papers zijn gepubliceerd.

01:53.280 --> 01:55.830
Maar hij gebruikt ze in zijn tutorials.

01:55.830 --> 01:57.870
Dus misschien vind je die handig.

01:57.880 --> 02:03.660
Dus blader daar rond als je een inleiding wilt krijgen in de wiskunde achter convolutionele neurale

02:03.660 --> 02:08.030
netwerken en een soort solide basis wilt bouwen rond dat gebied.

02:08.460 --> 02:12.410
Maar we gaan verder en we gaan praten over de evolutie.

02:12.450 --> 02:15.810
Dus wat is een revolutie in intuïtieve termen?

02:16.410 --> 02:17.060
Hier aan de linkerkant?

02:17.070 --> 02:18.750
We hebben een invoerafbeelding, zoals we hebben besproken.

02:18.930 --> 02:22.560
Dat is hoe we naar afbeeldingen gaan kijken, alleen enen en nullen om dingen te vereenvoudigen.

02:22.770 --> 02:24.560
En daar zie je de smiley.

02:24.960 --> 02:26.310
Daar hebben we een functiedetector.

02:26.320 --> 02:28.230
Dus feature detector is een drie bij drie matrix.

02:28.710 --> 02:30.030
Moet het drie bij drie zijn?

02:30.060 --> 02:30.880
Nee, dat doet het niet.

02:31.770 --> 02:34.680
Alex Netto denkt zeven bij zeven te gebruiken.

02:35.670 --> 02:40.530
En dan gebruikt een andere van die andere beroemde detectoren van vijf bij vijf kenmerken.

02:41.550 --> 02:48.390
Ze kunnen verschillend zijn, maar meestal zie je dat er drie bij drie zijn en dat zijn redenen om ze drie bij drie

02:48.390 --> 02:49.310
te maken.

02:49.320 --> 02:53.730
We houden ons dus aan de afspraak om een detector met drie bij drie kenmerken te hebben.

02:54.570 --> 02:58.630
Ook de functiedetectoren die dit worden genoemd, zijn belangrijke termen omdat u ze misschien tegenkomt.

02:58.680 --> 03:04.050
Er zijn veel verschillende termen voor de functiedetector, maar de meest voorkomende zijn functiedetector.

03:04.050 --> 03:09.160
Of je hoort het misschien kolonel genoemd worden of je hoort het filter genoemd worden.

03:09.420 --> 03:14.100
In deze cursus gaan we ofwel een filter ofwel een functiedetector door elkaar gebruiken.

03:14.370 --> 03:16.380
Maar houd er rekening mee dat het die namen heeft.

03:16.890 --> 03:25.290
En een convolutiebewerking wordt aangeduid met een X in een cirkel, net zoals je in de formules eerder zag.

03:25.620 --> 03:32.850
En hier gebeurt wat er gebeurt op een intuïtief niveau, alles of gewoon om erover te denken in termen van wat er feitelijk op de achtergrond

03:32.850 --> 03:34.710
gebeurt in plaats van de wiskunde.

03:34.920 --> 03:40.470
Nou, je neemt deze feature detector of filter en je zet het op je afbeelding zoals je links ziet.

03:40.620 --> 03:47.760
Dus je bedekt bijvoorbeeld de, in dit geval, de linkerbovenhoek, de negen pixels in

03:47.760 --> 03:54.030
de linkerbovenhoek, en je vermenigvuldigt in feite elke waarde met elke waarde.

03:54.030 --> 03:54.930
Dus respectieve waarden.

03:54.930 --> 04:02.340
Dus de bovenste nul bij de waarde linksboven bij de waarde linksboven, dan is het in feite positie nummer één één bij positie

04:02.340 --> 04:08.600
nummer één positie bij een nummer of nul één één nul één nul twee bij nul twee enzovoort.

04:08.610 --> 04:14.370
Dus alleen zijn element Y's vermenigvuldiging van deze matrices en dan tel je het resultaat op.

04:14.410 --> 04:16.620
Dus in dit geval klopt er niets.

04:16.620 --> 04:19.650
Dus het is altijd een nul bij nul nul bij één.

04:19.860 --> 04:20.890
Het resultaat is dus nul.

04:21.640 --> 04:26.490
Hier kun je zien dat een van hen overeenkwam, die aan de linkerkant overeenkwam.

04:26.490 --> 04:28.070
En daarom hebben we hier een.

04:28.080 --> 04:30.930
Niets kwam overeen, niets kwam overeen, niets kwam daar overeen.

04:30.930 --> 04:32.070
We gaan door naar de volgende worp.

04:32.070 --> 04:38.520
Dus en de stap waarmee we bewegen, dit hele filter wordt de stap genoemd.

04:38.540 --> 04:40.440
Dus hier hebben we een zijde van één pixel.

04:40.470 --> 04:44.960
Dus hier kun je weer iets zien dat overeenkomt met de rechterbenedenhoek, overeenkomt met de

04:45.210 --> 04:51.000
pas, maar een onderste in het midden komt hier overeen, rechtsboven komt overeen, dan meet niets dat het rechte stuk

04:51.000 --> 04:51.750
één is.

04:52.140 --> 04:53.400
U kunt de stap wijzigen.

04:54.150 --> 04:55.710
Je kunt er één, twee van maken.

04:56.250 --> 04:56.880
Je kan het krijgen.

04:56.880 --> 04:59.100
Drie, wat je maar wilt.

04:59.930 --> 05:02.670
Uiteindelijk is degene die goed werkt meestal op twee.

05:02.720 --> 05:08.300
Dus dat is waar mensen zich aan houden en we zullen het hebben over wat de stap is naar het einde van het

05:08.310 --> 05:08.630
verhaal.

05:09.500 --> 05:11.690
Dus hier zijn we aan het matchen.

05:11.690 --> 05:12.590
Dus we houden het hier gewoon in de gaten.

05:12.590 --> 05:17.150
Je kunt zien dat we een twee hebben omdat er twee bij elkaar passen, enzovoort, enzovoort.

05:17.190 --> 05:17.610
Spoedig.

05:17.810 --> 05:18.200
Daar gaan we.

05:18.200 --> 05:19.400
Er is er nog een die overeenkwam.

05:21.330 --> 05:22.220
Daar gaan we.

05:23.540 --> 05:28.100
En ze waren klaar, dus wat hebben we gecreëerd, toch.

05:28.250 --> 05:31.030
Een paar belangrijke dingen hier.

05:31.910 --> 05:36.580
De afbeelding rechts heet een feature map, heeft ook meerdere termen.

05:36.590 --> 05:40.140
Het kan ook wel eens worden genoemd, het kan de functie van Vold hebben.

05:40.880 --> 05:45.680
Dus wanneer u een convolutie-operator op iets toepast, wordt het niet ingewikkeld.

05:45.710 --> 05:46.910
Het wordt betrokken.

05:46.910 --> 05:51.590
En soms heb ik, denk ik, mezelf op de verkeerde manier lief.

05:51.590 --> 05:54.170
Maar het is de juiste term die erbij betrokken is.

05:54.680 --> 05:57.680
Het is een oude functie of het kan ook de activeringskaart worden genoemd.

05:57.920 --> 06:02.240
Maar we gaan het in deze cursus een feature map noemen, zodat het in elk van die dingen kan worden

06:02.240 --> 06:02.480
genoemd.

06:03.350 --> 06:06.200
En wat hebben we hier gedaan?

06:06.230 --> 06:09.860
Zoals je kunt zien, hebben we de afbeelding verkleind.

06:09.860 --> 06:10.550
Dat is nummer één.

06:10.550 --> 06:16.070
En dat is het belangrijkste wat ik wilde zeggen over je input, beeld en de functie intact en de

06:16.070 --> 06:16.670
pas.

06:17.270 --> 06:19.940
Als je een Strider hebt, zie je de afbeelding iets verkleind.

06:19.940 --> 06:23.120
Maar als je een rechte toevoeging aan de afbeelding hebt, zal deze meer verminderen.

06:23.120 --> 06:25.220
Dus de feature-up wordt nog kleiner.

06:25.460 --> 06:30.420
En dat is een zeer belangrijke functie van de functie.

06:30.440 --> 06:37.130
De textuur van deze hele convolutiestap is om die afbeelding kleiner te maken, want dat zal

06:37.130 --> 06:43.550
het gemakkelijker zijn om het te verwerken en het zal gewoon sneller zijn en.

06:45.980 --> 06:52.430
Hij zal gewoon sneller zijn, want stel je voor, zoals hier hebben we een wat, een zeven bij zeven afbeelding, maar stel je

06:52.430 --> 06:55.010
voor dat je een goede foto hebt, toch?

06:55.640 --> 06:59.200
Of je hebt een afbeelding van 256 bij 256 pixels.

06:59.210 --> 07:06.640
Dat is een enorm aantal pixels, 256 kwadraat of laten we zeggen dat je 300 bij 300 pixels hebt.

07:06.830 --> 07:09.820
Zodat we niet in de war raken met de RGV 256.

07:09.830 --> 07:14.420
Laten we zeggen dat we een afbeelding van 300 bij 300 hebben in termen van grootte en pixels.

07:14.670 --> 07:17.330
Dan heb je driehonderd vierkante pixels.

07:17.330 --> 07:18.500
Dat is een enorm aantal.

07:19.070 --> 07:26.090
En daarom zal een functiedetectoren de grootte van het beeld verkleinen en daarom is een recht van twee

07:26.090 --> 07:27.290
eigenlijk voordelig.

07:27.650 --> 07:29.900
Maar dan is de vraag, verliezen we informatie?

07:29.900 --> 07:34.250
Verliezen we informatie wanneer we de functiedetector toepassen?

07:34.430 --> 07:40.340
Welnu, sommige informatie verliezen we natuurlijk, omdat we minder waarden in onze resulterende matrix hebben.

07:40.610 --> 07:45.890
Maar tegelijkertijd is het doel van de kenmerkdetector om bepaalde kenmerken te detecteren, bepaalde delen van

07:45.890 --> 07:47.770
het beeld die integraal zijn.

07:48.470 --> 07:52.940
En dus, bijvoorbeeld, als je er zo over nadenkt, alsof de feature-detector een bepaald patroon

07:52.940 --> 07:53.240
heeft.

07:53.990 --> 07:57.890
Het hoogste getal in uw functiekaart is wanneer dat patroon overeenkomt.

07:57.890 --> 08:04.460
In feite is het hoogste aantal dat u kunt krijgen, in een echt vereenvoudigd voorbeeld, wanneer de functie is dat deze

08:04.610 --> 08:05.090
overeenkomt.

08:05.090 --> 08:05.540
Precies.

08:05.540 --> 08:09.200
En je kunt zien of die nummer vier we in onze functiekaart hebben.

08:09.470 --> 08:10.460
Dat is precies.

08:10.460 --> 08:16.850
Dus als je hier kijkt, is dat precies waar deze functiedetector, omdat er maar vier in

08:16.850 --> 08:19.040
zitten, perfect bij elkaar passen.

08:19.040 --> 08:21.080
Dus je kunt dit dit deel hier zien.

08:21.380 --> 08:27.110
Dus de functie werd hier gedetecteerd en zoals we aan het begin van deze sectie hebben besproken.

08:28.220 --> 08:36.140
Dat kenmerk is hoe we dingen zien, is hoe we dingen herkennen, we kijken niet naar elke pixel, om zo te zeggen, in

08:36.140 --> 08:40.100
wat we zien op een afbeelding of in het echte leven.

08:40.280 --> 08:41.740
We kijken niet naar alles.

08:41.750 --> 08:42.680
We kijken naar kenmerken.

08:42.680 --> 08:51.470
We kijken naar de neus, de hoed, de veer, de ogen of de kleine zwarte vlekken onder de ogen van de cheeta om

08:51.470 --> 08:57.250
onderscheid te maken tussen een cheeta en een luipaard of de vorm van de trein.

08:57.350 --> 09:00.610
We maken geen onderscheid tussen een bullet train, een normale trein enzovoort.

09:00.620 --> 09:04.520
We kijken dus niet naar alles, we kijken naar features en dat is wat we behouden.

09:04.520 --> 09:08.030
En dat is wat de feature map ons helpt te behouden.

09:08.060 --> 09:15.440
Eigenlijk is dat wat het ons in staat stelt om alle onnodige dingen naar voren te halen en ons te ontdoen van

09:15.440 --> 09:22.690
alle onnodige dingen die zelfs als mensen, we niet zoveel informatie verwerken die op een bepaald moment in je ogen komt, zoals

09:22.700 --> 09:23.990
gigabytes aan informatie.

09:24.170 --> 09:29.900
Als je naar elke stip kijkt, zo niet terabytes aan informatie die per seconde je ogen binnenkomt, en we

09:30.260 --> 09:36.110
kunnen nog steeds verwerken omdat we ons ontdoen van wat niet nodig is, concentreren we ons alleen op de

09:36.110 --> 09:36.950
belangrijke functies.

09:36.950 --> 09:41.900
Functies zijn belangrijk voor ons en dat is precies wat de functiekaart doet.

09:42.200 --> 09:45.830
Dus nu verder, dit is ons invoerbeeld.

09:46.160 --> 09:49.430
En u maken wij een feature map.

09:49.430 --> 09:52.360
Dus de voorste, laten we zeggen dat de voorste degene is die we zojuist hebben gemaakt.

09:52.640 --> 09:59.630
Maar hoe komt het dan dat er veel van zijn, maar we maken meerdere feature maps omdat we verschillende filters

09:59.630 --> 10:00.170
gebruiken.

10:00.170 --> 10:00.530
Rechts.

10:00.530 --> 10:03.770
En dat is nog een manier waarop we veel van de informatie bewaren.

10:03.770 --> 10:05.390
We hebben dus niet slechts één feature map.

10:05.780 --> 10:12.260
We zoeken naar bepaalde functies en dan of eigenlijk beslist het netwerk door middel van zijn training.

10:12.260 --> 10:14.360
En dit is iets dat we tegen het einde van de sectie zullen bespreken.

10:14.360 --> 10:21.350
Door zijn training beslist het welke functies belangrijk zijn voor bepaalde typen of bepaalde categorieën, en het zoekt

10:21.560 --> 10:24.620
ernaar en zal daarom verschillende filters hebben.

10:24.620 --> 10:25.880
En we zullen het nu hebben over filters.

10:26.090 --> 10:27.740
Maar in principe pas je deze filters toe.

10:27.740 --> 10:32.480
Dus om deze functiekaart te krijgen, heeft het een filter toegepast zoals we hebben gezien.

10:32.480 --> 10:36.200
Maar om vervolgens deze functiekaart te krijgen en een ander filter toe te passen om deze functie te krijgen, past u

10:36.200 --> 10:37.280
misschien een ander filter toe, enzovoort.

10:38.240 --> 10:43.160
En dus maakt het eigenlijk gewoon deze functiekaarten.

10:43.490 --> 10:49.510
En daarom vind ik persoonlijk de term feature detector beter dan filter.

10:49.530 --> 10:55.010
Dus onthoud, hier hebben we dit filter, dat we ook een functiedetector kunnen noemen.

10:55.040 --> 10:59.360
Nou, eigenlijk vind ik het woord feature-detector beter geschikt.

10:59.360 --> 11:03.110
En de reden daarvoor is dat dat het doel is.

11:03.110 --> 11:03.330
Rechts?

11:03.350 --> 11:06.440
We willen niet gewoon, we willen niet gewoon ons imago uitfilteren.

11:06.440 --> 11:10.160
Maar ook al is dat een geheel, dat is hetzelfde, alleen een kwestie van terminologie.

11:10.160 --> 11:11.930
Maar eigenlijk willen we functies detecteren.

11:11.930 --> 11:12.200
Oke.

11:12.200 --> 11:19.340
In deze laag gaan we in deze functiekaart kijken waar we bepaalde objecten in de afbeelding hebben

11:19.340 --> 11:20.210
gedetecteerd.

11:20.210 --> 11:24.560
In deze feature map hebben we gedetecteerd waar bepaalde andere features zijn, waar een bepaalde feature OK

11:24.560 --> 11:25.040
is.

11:25.250 --> 11:30.740
En deze feature map hebben we gedetecteerd waar een bepaalde andere feature zich op de afbeelding bevindt.

11:31.310 --> 11:33.320
Dat is dus wat we aan het doen zijn.

11:33.320 --> 11:34.550
En laten we een paar voorbeelden bekijken.

11:34.550 --> 11:41.500
Dus hier gebruiken we en dit is van GILBERG, hun documentatie.

11:41.690 --> 11:45.020
Het is een gratis tool zoals verf.

11:45.140 --> 11:49.490
En u kunt het gebruiken om uw afbeeldingen aan te passen of met uw afbeeldingen te werken.

11:49.490 --> 11:53.510
Maar eigenlijk hebben ze enkele waardevolle voorbeelden in hun documentatie.

11:53.510 --> 11:59.620
En hier hebben ze een foto van de Taj Mahal en kun je kiezen welk filter je wilt toepassen.

11:59.780 --> 12:06.080
Dus als je dit programma downloadt en je uploadt er een foto in en dan kun

12:06.080 --> 12:12.650
je een convolutiematrix starten en filters toepassen en je zult zien dat deze dingen, deze onderhandelaars, daadwerkelijk hebben

12:12.650 --> 12:15.160
toegepast in beeldverwerking en ontwerp enzovoort.

12:15.170 --> 12:16.700
Dus laten we eens kijken naar wat we krijgen, wat we krijgen.

12:16.730 --> 12:21.320
Dus als we dit filter vijf toepassen in het midden van min één, min één, min één, min één, kun

12:21.530 --> 12:23.420
je zien dat het de afbeelding verscherpt.

12:23.660 --> 12:25.610
En ja.

12:25.610 --> 12:28.720
Dus dit is vrij intuïtief als je erover nadenkt.

12:28.880 --> 12:36.230
Dus vijf is de pixel, de hoofdpixel zoals in het midden van het filter of de feature-detector en dan

12:36.420 --> 12:41.590
min één min één, min één, zoals je wilt, verkleint de pixels eromheen.

12:41.740 --> 12:44.780
Het innerlijke in intuïtieve zin.

12:46.100 --> 12:53.600
Dan heeft vervaging in feite dezelfde betekenis, geeft een gelijke betekenis aan alle pixels rond die in het midden, en

12:53.600 --> 12:58.980
daarom combineert het ze samen en krijg je een vervaging, rand en handen.

12:59.000 --> 13:03.800
Dus hier kun je die min één en één zien en dan krijg je nullen, toch.

13:03.830 --> 13:09.590
Dus je hebt verwijderd om de pixels rond de middelste in het midden te verwijderen.

13:09.590 --> 13:12.740
En je houdt deze alleen op een min één en het geeft je een voorsprong.

13:12.740 --> 13:18.920
En deze is een beetje moeilijker om te begrijpen hoe het werkt, zoals waarschijnlijk moeilijker om er intuïtief over na te denken.

13:19.460 --> 13:20.420
Rand detectie.

13:20.570 --> 13:20.840
Rechts.

13:20.870 --> 13:23.510
Dus deze is waarschijnlijk logischer, toch.

13:23.530 --> 13:27.410
Je neemt de middelste, je verkleint de middelste.

13:28.940 --> 13:32.450
De waarschijnlijk als de kracht van de middelste pixel.

13:32.450 --> 13:41.480
En dan zoek je naar degenen die je zoekt, je vergroot de kracht van degenen om hen heen.

13:42.020 --> 13:43.130
Dus die heb je daar.

13:44.570 --> 13:44.810
Ja.

13:44.810 --> 13:50.600
Dus dat geeft je een soort randdetectie en je kunt zien wat je daar krijgt en een andere baas.

13:50.640 --> 13:58.070
Dus de sleutel hier is dat het asymmetrisch is en je kunt zien dat het beeld ook asymmetrisch wordt.

13:58.080 --> 14:05.000
Dus je hebt zo'n soort gevoel dat het naar je toe steekt en dat is wat je krijgt als

14:05.000 --> 14:06.470
je hier minpunten hebt.

14:06.470 --> 14:11.570
En nogmaals, dit is erg, dit wordt nu een beetje technisch, maar we kunnen in ieder geval een

14:11.570 --> 14:12.710
soort intuïtief begrip krijgen.

14:12.740 --> 14:14.090
Laten we ze snel nog eens doornemen.

14:14.090 --> 14:19.520
Er is dus verscherping, er is onscherpte, er is een rand en dus is er randdetectie.

14:19.730 --> 14:21.710
Er is reliëf zo laag als je kunt zien.

14:21.710 --> 14:24.470
Dit zijn geweldige voorbeelden van hetzelfde beeld.

14:24.620 --> 14:30.530
Maar we krijgen feature maps, dus we gebruiken verschillende feature detectors om verschillende feature maps van dezelfde afbeelding

14:30.530 --> 14:31.550
te krijgen.

14:31.700 --> 14:39.770
En daarom hebben we nu veel van de vele versies van deze afbeelding waar we in elke versie hebben geprobeerd bepaalde dingen

14:39.770 --> 14:40.790
te detecteren.

14:41.090 --> 14:44.810
Deze voorwaarden zijn niet van toepassing op ons.

14:44.810 --> 14:49.790
Ze zien eruit alsof reliëf waarschijnlijk niet op ons van toepassing is in termen van convolutionele neurale netwerken, maar

14:50.000 --> 14:51.540
detecteren dat dat belangrijk is.

14:51.560 --> 14:56.360
We willen de randen detecteren, verbeteren, waarschijnlijk niet vervagen, verscherpen.

14:56.450 --> 15:02.390
Dus bepaalde dingen zoals edge-aanvallen zijn waarschijnlijk de belangrijkste voor ons soort werk.

15:02.390 --> 15:06.310
En in termen van begrip, zoals computers, zullen ze voor zichzelf beslissen.

15:06.320 --> 15:08.930
Ons neurale netwerk bepaalt zelf wat belangrijk is en wat niet.

15:08.930 --> 15:12.830
En het zal waarschijnlijk niet eens herkenbaar zijn voor het menselijk oog.

15:12.840 --> 15:16.730
U zult niet kunnen begrijpen wat die functies betekenen, maar de computer zal beslissen.

15:16.730 --> 15:24.050
En dat is het mooie van neurale netwerken, dat ze zoveel verschillende dingen kunnen verwerken en begrijpen zonder zelfs maar die

15:24.050 --> 15:30.260
intuïtie te hebben, zonder die verklaring te hebben waarom ze zullen begrijpen welke functies voor hen belangrijk zijn,

15:30.260 --> 15:36.740
of we er nu een naam voor hebben of niet, dat dat een geheel is dat een irrelevante vraag

15:36.740 --> 15:39.070
is voor hun kunstmatige neurale netwerk.

15:39.860 --> 15:47.030
En mijn favoriet, hier is een afbeelding van Geoffrey Hinton, een volgeling van Geoffrey Hinton, die er doorheen

15:47.960 --> 15:50.450
ging, een van deze filters.

15:50.870 --> 15:51.140
Oke.

15:51.140 --> 15:52.970
Dus dat brengt ons bij het einde van de tutorial van vandaag.

15:52.970 --> 15:55.070
Ik hoop dat je het leuk vond om over convolutie te leren.

15:55.370 --> 16:02.450
De belangrijkste conclusie is dat een convolutie met het primaire doel van een convolutie is om functies in uw afbeelding te vinden met

16:02.450 --> 16:08.030
behulp van de functiedetector, ze in een functiekaart te plaatsen en door ze in een functiekaart te

16:08.030 --> 16:14.990
plaatsen, behoudt het nog steeds de ruimtelijke relaties tussen pixels , wat erg belangrijk voor ons is, weet je, want als ze

16:15.410 --> 16:19.040
helemaal door elkaar worden gegooid, dan zijn we het patroon kwijt.

16:19.190 --> 16:25.040
En tegelijkertijd is het belangrijk om te begrijpen dat de functies die een neuraal netwerk

16:25.040 --> 16:32.390
zal detecteren en gebruiken om bepaalde afbeeldingen en klassen te herkennen meestal niets voor mensen betekenen, maar desalniettemin werken

16:32.390 --> 16:32.780
ze.

16:32.960 --> 16:34.310
En dat is wat Convolutie is.

16:34.310 --> 16:36.120
En ik kijk uit naar je volgende Turrill.

16:36.170 --> 16:37.940
Geniet tot die tijd van deep learning.
