WEBVTT

00:00.640 --> 00:02.940
Bonjour et bienvenue au cours sur l'apprentissage en profondeur.

00:02.970 --> 00:09.120
Nous parlons aujourd'hui d'un indice qui est corrigé dans vos unités. Il s'agit d'une étape supplémentaire

00:09.120 --> 00:12.180
par rapport à notre étape de convolution.

00:12.180 --> 00:16.140
Donc, ce n'est pas une grande étape séparée, c'est une petite étape de la première étape.

00:16.290 --> 00:18.230
Et ce qui se passe ici.

00:18.240 --> 00:24.090
Eh bien, nous avons notre image d'entrée que nous avons tous convolutionnel là-bas dont nous avons discuté et en

00:24.090 --> 00:26.080
plus de cela nous allons appliquer.

00:26.400 --> 00:27.190
Attendez.

00:27.240 --> 00:36.720
Notre fonction de redressement préférée et que vous connaissez bien la fonction de redressement de la section précédente sur

00:36.750 --> 00:47.400
les réseaux de neurones artificiels et dans notre exemple. Dans certains cas, les auteurs ou les instructeurs séparent la convolution et le

00:47.430 --> 00:54.030
tir direct en deux étapes distinctes dans nos exemples. un grand pas pour la

00:54.030 --> 00:57.060
deuxième évolution puis le redresseur.

00:57.270 --> 01:03.750
Et la raison pour laquelle nous appliquons le redresseur est parce que vous voulez augmenter la non-linéarité de

01:03.780 --> 01:13.410
notre image ou de notre réseau et de notre réseau de neurones commercial et notre feu agit en tant que filtre ou accède à cette fonction qui se

01:13.440 --> 01:19.200
désagrège et vous La raison pour laquelle nous voulons augmenter la non-linéarité dans notre réseau est

01:19.440 --> 01:25.950
que les images elles-mêmes sont très non linéaires, en particulier si vous reconnaissez différents objets les uns à côté

01:26.010 --> 01:32.790
des autres ou juste sur l'arrière-plan et des éléments comme celui-ci, comme si l'image comportait de nombreux éléments non linéaires

01:33.180 --> 01:38.050
et la transition entre les pixels adjacents de pixels serait souvent non linéaire.

01:38.040 --> 01:41.280
C'est vous savez parce que ses frontières sont différentes, les couleurs sont différentes.

01:41.460 --> 01:46.020
Il y a différents éléments dans vos images et lorsque vous appliquez

01:46.020 --> 01:52.410
une opération mathématique telle que la convolution, vous savez que si vous utilisez cette détection de caractéristiques pour

01:52.710 --> 01:59.710
créer nos cartes de caractéristiques, nous risquons de créer quelque chose de linéaire et nous devons donc rompre Le narrateur.

01:59.970 --> 02:05.960
Voyons un exemple: une image et une image originale.

02:05.970 --> 02:13.220
Maintenant, lorsque nous appliquons un détecteur de détection de caractéristiques à cette image, nous obtenons quelque chose comme ceci.

02:13.290 --> 02:16.230
Vous pouvez donc voir ici que le noir est négatif, le blanc est également une valeur positive.

02:16.230 --> 02:22.980
Lorsque vous appliquez un détecteur de caractéristiques à une image similaire, qui comporte non seulement des zéros et des zéros, mais également une multitude

02:22.980 --> 02:28.890
de valeurs différentes et que vous appliquez comme nous l'avons vu précédemment, le Texas peut avoir des valeurs négatives en elles-mêmes.

02:29.070 --> 02:30.920
Parfois, vous obtenez des valeurs négatives.

02:31.080 --> 02:34.670
Et voici les noirs sont les négatifs, les blancs sont positifs.

02:34.800 --> 02:45.240
Et une fonction d'unité linéaire rectifiée supprime tous les droits noirs dans les valeurs inférieures à zéro et

02:45.240 --> 02:46.490
devient zéro.

02:46.560 --> 02:49.160
Et ainsi à partir de cela, il devient ce droit.

02:49.290 --> 02:57.990
Il est donc difficile de voir quel est exactement l’avantage en termes de rupture de la

02:58.050 --> 02:58.910
linéarité.

02:59.400 --> 03:01.050
Je vais essayer d'expliquer.

03:01.080 --> 03:07.740
Je vais essayer de montrer un exemple sur cette image, mais au bout du compte, il s’agit d’un concept très mathématique

03:07.740 --> 03:12.480
et il faudrait faire beaucoup de calculs pour expliquer réellement ce qui se passe.

03:12.480 --> 03:13.800
Mais essayons, jetons un coup d'oeil.

03:13.800 --> 03:16.800
Donc, par exemple, regardons cela.

03:16.860 --> 03:17.580
Ce bâtiment ici.

03:17.580 --> 03:18.070
Droite.

03:18.090 --> 03:20.150
Donc, c'est un bâtiment à part.

03:20.730 --> 03:22.400
Ensuite, vous pouvez voir cette ombre.

03:22.440 --> 03:29.010
Cette partie noire de cette ombre ici et bien, vous voyez que le reflet de la lumière est blanc, puis

03:29.010 --> 03:33.160
que c'est un gris, puis qu'il s'assombrit et qu'il redevient plus sombre.

03:33.240 --> 03:35.860
Donc, et quand nous le retirons, nous éliminons ce point noir.

03:35.860 --> 03:38.220
Alors, réfléchissez-y en termes de linéarité.

03:38.250 --> 03:43.700
Ainsi, lorsque vous passez du blanc au gris, l’étape suivante est noire.

03:43.740 --> 03:50.970
Dès que la prochaine étape sera noire, il s'agira d'une progression linéaire allant du plus clair au plus sombre. C'est donc

03:50.970 --> 03:53.490
un peu comme une situation linéaire.

03:53.490 --> 03:56.560
Lorsque vous supprimez le noir, vous cassez la linéarité.

03:56.670 --> 03:57.800
Essayons un autre.

03:58.050 --> 03:59.110
Jetons un coup d'oeil ici.

03:59.220 --> 04:01.980
Et en même temps, c'est toujours le même bâtiment.

04:01.980 --> 04:08.320
Ce n'est pas que ce n'est pas comme vous ou votre semblable, ce n'est pas comme si vous mélangez deux bâtiments,

04:08.550 --> 04:09.810
mais c'est secondaire.

04:09.810 --> 04:11.940
Le point principal est de casser la linéarité.

04:12.210 --> 04:13.590
Alors regardons la même chose.

04:13.590 --> 04:19.480
Donc, vous voyez blanc gris noir gris blanc.

04:19.590 --> 04:22.520
Et quand vous le séparez, vous n’avez plus ce droit.

04:22.530 --> 04:29.600
Vous n'avez pas cette progression la progression graduelle que vous avez juste comme un changement brusque.

04:29.730 --> 04:33.540
Et cela aide à introduire la non-linéarité dans votre image.

04:33.540 --> 04:42.540
Il s’agit donc d’une explication très grossière, très semblable à une explication au doigt ou à la main, plutôt que technique, mais espérons-le, elle

04:42.690 --> 04:47.370
vous aidera à comprendre un peu mieux ce dont nous parlons.

04:47.370 --> 04:54.870
Donc, là encore, vous pouvez voir que le gris blanc est un meilleur exemple, même pour les couleurs plus foncées plus sombres plus sombres et

04:54.980 --> 04:55.680
plus sombres.

04:55.680 --> 05:04.460
Donc, cette partie a l’air qu’elle est plus fine que vous ne la séparez plus, c’est donc une explication très grossière.

05:04.480 --> 05:08.570
Ce n'est pas absolument parfait mais au moins, cela vous donne une idée de ce qui se passe.

05:08.800 --> 05:14.120
Mais si vous voulez en savoir plus, il y a un bon papier, comme toujours.

05:14.200 --> 05:20.370
Celui-ci a été créé par le corps de la CCJ de l’Université de Californie et porte le nom Comprendre les

05:20.380 --> 05:22.980
réseaux de neurones convolutifs dotés d’un modèle mathématique.

05:23.200 --> 05:28.840
Et fondamentalement, ils répondent aux questions et il suffit de regarder la première.

05:28.840 --> 05:33.820
Et la question est pourquoi une fonction d'activation non linéaire n'est-elle pas essentielle à la sortie

05:33.820 --> 05:36.130
du filtre de toutes les couches intermédiaires.

05:36.220 --> 05:44.280
Cela explique donc un peu plus en détail l’intuition et surtout les mathématiques.

05:44.320 --> 05:47.970
Il s’agit donc d’un document intéressant dans lequel vous pouvez obtenir des informations supplémentaires sur ce sujet.

05:48.100 --> 05:53.360
Et si vous voulez vraiment creuser et explorer des trucs sympas ici.

05:53.360 --> 05:55.690
Ensuite, il y a un autre document qui pourrait vous intéresser.

05:55.690 --> 06:01.720
C'est ce qu'on appelle approfondir le redresseur en surpassant les performances de niveau humain en image et

06:01.720 --> 06:02.830
en classification.

06:02.920 --> 06:09.190
Et ici, l’auteur se peigne les cheveux et d’autres de Microsoft Research.

06:09.400 --> 06:17.630
Ils proposent un type différent de fonction d'unité allégée rectifiée.

06:17.650 --> 06:21.830
Ils proposent la fonction rectifiée paramétrique que vous voyez ici à droite.

06:22.030 --> 06:26.740
Et ils font valoir que cela donne de meilleurs résultats sans sacrifier les performances.

06:26.740 --> 06:30.200
Si intéressant à lire si vous souhaitez approfondir un peu ce sujet.

06:30.490 --> 06:32.020
Et c'est tout pour aujourd'hui.

06:32.280 --> 06:38.380
Vraiment votre couche est assez simple donc pour ajuster juste appliquer la fonction redresseur et j’attends avec impatience de vous voir la

06:38.380 --> 06:39.230
prochaine fois.

06:39.250 --> 06:40.770
Jusque-là profiter de l'apprentissage.
