WEBVTT

00:00.450 --> 00:05.400
Bonjour et bienvenue sur ce chemin menant à Torro, nous allons maintenant faire en sorte que la

00:05.400 --> 00:11.040
fonction avant transmette le signal dans tout le cerveau depuis le tout début avec les images d’entrée jusqu’aux sorties

00:11.130 --> 00:16.860
qui contiendront les valeurs clés de l’acteur et la dé-valeur qui est la valeur prise par la fonction pour

00:17.040 --> 00:17.950
le critique.

00:18.240 --> 00:23.820
Donc, ça va être assez similaire à ce que nous avons fait pour Dume mais cette fois, quelque chose va changer.

00:23.880 --> 00:25.550
La modification va changer cela.

00:25.560 --> 00:27.510
Nous avons maintenant une illustration dans le cerveau.

00:27.510 --> 00:32.470
Nous devons donc tous faire quelque chose de plus pour propager le signal et faire attention à cela.

00:32.850 --> 00:38.280
Et l’autre chose moins importante, mais qui change encore par rapport à l’avant, c’est que

00:38.280 --> 00:44.220
nous n’allons pas utiliser une fonction d’activation réelle car vous connaissez la fonction d’activation non linéaire, mais

00:44.220 --> 00:48.880
nous allons utiliser les toilettes, qui sont vraiment plus sophistiquées. une fonction.

00:48.980 --> 00:51.390
Vous verrez que dans le passé, nous parlons de mentation.

00:51.780 --> 00:55.970
Alors faisons ceci, faisons que cette fonction commence par un décès.

00:56.040 --> 00:59.190
C'est en fait la dernière fonction de cette classe exécrée.

00:59.280 --> 01:06.900
Nous allons donc l'appeler comme Einstein et cette quatrième fonction va prendre l'objet lui-même parce que nous allons

01:06.900 --> 01:09.930
utiliser les objets et les entrées.

01:10.170 --> 01:13.520
Si important de comprendre quelles seront ces entrées.

01:13.590 --> 01:19.170
Ce ne seront pas seulement les images d'entrée, ces entrées contiendront également les noeuds cachés et les

01:19.170 --> 01:20.980
noeuds de cellules du même.

01:21.090 --> 01:25.120
C'est pourquoi je voulais souligner que certaines choses vont changer maintenant.

01:25.180 --> 01:30.820
Fondamentalement, nous considérons la fonction de transfert Internet et les nœuds de cellules de la liste.

01:31.200 --> 01:38.900
Et en parlant d’eux maintenant, nous allons séparer ces deux entrées de cet argument en mettant en avant la fonction

01:38.900 --> 01:41.540
d’avancement et comment pouvons-nous les séparer.

01:41.700 --> 01:46.160
Eh bien, nous pouvons rappeler un nouveau Voivode qui sera les images d’entrée.

01:46.230 --> 01:55.620
Nous avons donc séparé les images d'entrée et les avons séparées par les renversements H x et C X, qui est un temple des

01:55.620 --> 01:59.090
états cachés et des états cellulaires au Colisée.

01:59.370 --> 02:04.470
Donc, H x autres États et C X sont les États du Sud.

02:04.540 --> 02:09.580
Très bien et ce sera égal à l'entrée qui est cet argument ici.

02:09.580 --> 02:14.950
Donc maintenant nous avons fait cette séparation et donc nous pouvons commencer à propager

02:15.220 --> 02:21.400
le signal dans tout le cerveau et pour ce faire nous allons obtenir successivement différentes couches du

02:21.700 --> 02:28.690
premier au dernier en utilisant nos connexions qui sont les convolutions de la connexion LACMA la connexion linéaire ici

02:29.020 --> 02:30.300
les connexions complètes.

02:30.490 --> 02:31.400
Alors faisons ceci.

02:31.450 --> 02:33.620
Maintenant, ça va être comme avant.

02:33.750 --> 02:40.420
Nous allons obtenir notre première couche que nous appellerons X et obtenir cette première couche dont nous avons besoin pour propager

02:40.510 --> 02:46.240
le signal des entrées à cette première couche. Nous devons donc utiliser la première convolution car il

02:46.240 --> 02:51.770
s'agit de la première convolution. qui propage le signal des images d’entrée vers la première couche.

02:52.030 --> 02:58.450
Donc, ce que nous allons faire maintenant, c'est copier ceci car c'est la première convolution que nous avons eue

02:58.450 --> 03:06.100
ici et nous appliquons cette première convolution à nos images d'entrée qui sont maintenant les bonnes entrées et que nous obtenons qui propage

03:06.100 --> 03:09.560
le signal des images d'entrée vers la première couche.

03:09.820 --> 03:16.390
Mais rappelez-vous que nous devons utiliser une fonction d'activation non linéaire pour rompre la linéarité afin de pouvoir apprendre

03:16.390 --> 03:23.170
les relations non linéaires à l'intérieur des images. Pour ce faire, nous allons utiliser la fonction d'activation que nous sommes

03:23.500 --> 03:28.050
sur le point d'utiliser. voir maintenant et que par le toucher coincé.

03:28.180 --> 03:30.110
Mais avant cela, obtenons-le.

03:30.130 --> 03:36.430
Donc, pour l'obtenir, c'est comme si nous prenions le module fonctionnel qui comporte un

03:36.490 --> 03:45.790
raccourci, puis une boucle, puis nous mettons tout cela entre parenthèses, car nous souhaitons activer les neurones de manière non linéaire.

03:45.880 --> 03:51.160
Cette première couche ici que nous avons obtenue en appliquant la première convolution sur les entrées.

03:51.160 --> 03:55.310
Passons maintenant à la flamme PI Doug pour comprendre ce que c'est.

03:55.360 --> 03:56.110
C'est ici.

03:56.200 --> 04:00.320
Ainsi, vous pouvez y accéder à la torche coincé ou slash slash.

04:00.340 --> 04:06.940
Et puis que H G et L et ensuite vous devez trouver des activations non linéaires et ensuite les fonctions d'activation non linéaires

04:06.940 --> 04:08.080
que vous trouverez.

04:08.170 --> 04:14.040
Eh bien, c’est vraiment le classique lorsque nous savons que c’est un maximum de zéro et que vous tenez compte du graphique.

04:14.260 --> 04:17.160
Ensuite, vous avez six qui est celui-ci.

04:17.160 --> 04:19.350
Donc un peu plus sophistiqué.

04:19.570 --> 04:21.190
Et puis on y va on regarde.

04:21.550 --> 04:26.470
Et comme vous pouvez le voir, le bleu est une répétition plus un élément supplémentaire.

04:26.620 --> 04:29.280
Donc, c'est vraiment un peu plus sophistiqué.

04:29.340 --> 04:34.180
Et c'est donc celui que nous utilisons pour activer de manière non linéaire les neurones et les différentes couches.

04:34.180 --> 04:39.420
Et au fait, cette nouvelle fonction d'activation s'appelle l'exponentielle de leur unité.

04:39.490 --> 04:40.250
Alors on y va.

04:40.270 --> 04:44.230
Nous appliquons l'elu sur la première couche convolutive.

04:44.470 --> 04:46.300
Et maintenant, les choses vont être faciles.

04:46.370 --> 04:52.270
Nous allons passer à la suivante pour la propagation du signal qui va de la

04:52.270 --> 04:59.440
première couche convolutive à la deuxième couche convolutive que nous appellerons X car, fondamentalement, nous ajoutons simplement X

04:59.470 --> 05:02.190
maintenant. X est la première convolution.

05:02.290 --> 05:07.990
Et en propageant le signal de la première couche convolutive à la suivante, X deviendra la

05:07.990 --> 05:09.190
couche convolutive suivante.

05:09.520 --> 05:15.130
Et donc pour propager le signal de la première couche convolutive à la seconde, nous ne

05:15.220 --> 05:20.490
pouvons pas simplement copier ceci et le coller ici et le remplacer un par deux.

05:20.510 --> 05:27.340
Et maintenant, bien sûr, la deuxième convolution n'est pas appliquée aux images d'entrée mais à X, c'est la première

05:27.340 --> 05:29.530
couche de convolution qui est ici.

05:29.830 --> 05:30.790
Très bien parfait.

05:30.790 --> 05:32.800
Nous avons maintenant notre deuxième convolution ici.

05:33.010 --> 05:38.230
Et maintenant, propagons à nouveau le signal de la deuxième convolution vers la troisième.

05:38.230 --> 05:46.000
Et donc, nous pouvons directement copier ceci et le coller ici et le remplacer deux par trois.

05:46.000 --> 05:46.840
Nous y voilà.

05:46.990 --> 05:47.900
Et le dernier.

05:47.920 --> 05:53.770
Maintenant, pour propager le signal de la troisième convolution au quatrième et dernier, nous

05:53.770 --> 05:58.770
pouvons simplement copier à nouveau ici et remplacer trois par quatre.

05:58.840 --> 05:59.790
Nous y voilà.

06:00.220 --> 06:01.870
Alors récapitulons.

06:01.870 --> 06:03.310
Nous commençons avec nos entrées.

06:03.460 --> 06:07.170
Nous appliquons la première convolution pour obtenir la première convolution.

06:07.360 --> 06:12.130
Ensuite, nous appliquons la deuxième convolution à la première couche de convolution pour obtenir la deuxième couche

06:12.130 --> 06:12.850
de convolution.

06:12.970 --> 06:17.830
Ensuite, nous appliquons cette troisième convolution à la deuxième convolution afin d’obtenir la troisième couche

06:17.830 --> 06:18.510
de convolution.

06:18.550 --> 06:24.650
Et finalement, nous appliquons la quatrième convolution à la troisième convolution pour y obtenir la quatrième

06:24.650 --> 06:25.180
convolution.

06:25.510 --> 06:29.900
Et c'est ainsi que le signal se propage dans tous les yeux.

06:30.130 --> 06:35.620
Nous y voilà donc, nous avons maintenant le signal de sortie après les quatre convolutions et maintenant que

06:35.620 --> 06:40.790
nous savons quoi faire, nous devons développer tout ce signal de sortie dans un vecteur unidimensionnel.

06:40.900 --> 06:42.640
C'est l'étape d'aplatissement.

06:42.880 --> 06:45.440
Nous allons donc mettre à jour x à nouveau x.

06:45.490 --> 06:49.010
Deviendra maintenant ce vecteur unidimensionnel aplati.

06:49.230 --> 06:57.070
Et pour faire cela, nous devons prendre X qui est jusqu’à présent la quatrième couche convolutive X mais nous utilisons ensuite une fonction

06:57.520 --> 07:05.660
de vue et nous mettons d’abord un moins pour dire que nous voulons un vecteur à une dimension, puis un deuxième argument dont

07:05.660 --> 07:11.810
nous avons besoin. pour mettre le nombre d'éléments dans le vecteur et c'est rappeler trois fois deux

07:11.880 --> 07:13.560
fois trois fois trois.

07:13.670 --> 07:20.270
Et donc nous pouvons mettre ici 32 fois trois fois trois.

07:20.270 --> 07:20.720
Nous y voilà.

07:20.720 --> 07:24.570
Nous avons maintenant notre vecteur aplati et l'étape d'aplatissement est terminée.

07:24.680 --> 07:25.580
Parfait.

07:25.580 --> 07:28.030
Maintenant, occupons-nous de la partie LCN.

07:28.280 --> 07:33.030
Donc, comme vous l'avez compris, le LSD prend en entrée le vecteur aplati.

07:33.200 --> 07:37.190
Ce vecteur à une dimension de trois deux fois trois fois trois éléments.

07:37.190 --> 07:40.310
Donc, il est déjà prêt et bien préparé pour l’icn.

07:40.320 --> 07:49.070
L’équipe est maintenant prête à prendre ce vecteur Flaten en tant qu’entrées. Nous pouvons donc prendre notre LACMA et nos entrées en

07:49.190 --> 07:52.010
tant qu’argument premier. X est prêt.

07:52.010 --> 07:55.960
FLATOW Et le vecteur qui est ce rayon x ici que nous venons de développer.

07:56.270 --> 08:00.810
Mais aussi et c'est là que le problème entre en jeu.

08:00.890 --> 08:04.540
Nous devons mettre H x et z x.

08:04.550 --> 08:10.820
Et nous pouvons utiliser ha-Satan see X ici parce que nous avons fait cette séparation entre les arguments d'entrée

08:11.060 --> 08:12.980
originaux de la fonction forward.

08:12.980 --> 08:20.460
Donc, LACMA X le vecteur de sortie des plateaux après les quatre convolutions et tous les éléments cachés dans la note de cellule.

08:20.480 --> 08:21.390
Alors on y va.

08:21.440 --> 08:27.530
Ensuite, nous ne devons pas oublier le self, car le LSD est une variable ou une fonction, donc

08:27.530 --> 08:35.210
une variable attachée à l’objet même et à un CM, ce qui renvoie en fait deux sorties en tout qui seront les noeuds

08:35.210 --> 08:37.850
de sortie et les sons de sortie.

08:37.880 --> 08:42.250
C'est donc d'actualité et nous pouvons donc mettre à jour H.

08:42.260 --> 08:48.890
X y et z x les nœuds de cellules, car c’est exactement la sortie de ce NCM ici.

08:50.030 --> 08:50.500
Génial.

08:50.510 --> 08:52.750
Donc, nous avons presque terminé maintenant.

08:52.790 --> 08:58.850
Maintenant que nous avons les résultats de l'illustration, nous devons obtenir les résultats utiles,

08:58.850 --> 09:05.570
car seules les notes masquées sont utiles. Nous allons donc les récupérer d'ici là. X sera à

09:05.570 --> 09:12.490
nouveau égal à atax, le premier élément de l'exemple de sortie. des États-Unis un X est égal.

09:12.680 --> 09:14.270
Et nous avons presque fini.

09:14.270 --> 09:18.590
Rappelez-vous que nous avons deux cerveaux, un cerveau pour l'acteur dans la même pièce pour le critique.

09:18.860 --> 09:24.380
Et par conséquent, nous devons sortir des signaux pour renvoyer le signal de sortie de l'acteur et le signal de

09:24.380 --> 09:25.480
sortie du critique.

09:25.580 --> 09:30.730
Et donc maintenant, nous allons renvoyer ces deux signaux de sortie et comment pouvons-nous le faire.

09:30.830 --> 09:32.010
Eh bien c'est très facile.

09:32.030 --> 09:38.690
Nous avons simplement besoin de prendre nos connexions linéaires mais séparément il s’agit d’une connexion linéaire de la critique et de

09:38.770 --> 09:40.740
la connexion complète de l’acteur.

09:41.180 --> 09:47.870
Et nous avons appliqué chacune de ces connexions à la sortie X qui est une sortie utile du LACMA et sera

09:47.870 --> 09:50.470
tout ce qui constituera le signal de sortie.

09:50.480 --> 09:50.990
Alors on y va.

09:50.990 --> 09:51.840
Faisons le.

09:51.900 --> 09:59.660
On prend d’abord soi ou objet puis on obtient la connexion linéaire du critique qui est critique et cette colinéaire

09:59.690 --> 10:08.090
à laquelle on applique à X le signal de sortie le CM puis on reprend le même puis ça puis on

10:08.090 --> 10:15.290
prend la connexion linéaire de l’acteur qui est acteur et colinéaire sont les mêmes que nous appliquons

10:15.290 --> 10:16.200
à x.

10:16.310 --> 10:19.580
Voilà, c’est la principale chose dont nous avons besoin.

10:19.710 --> 10:26.040
Mais ensuite, nous allons également retourner le sommet d’Ajax à un nœud et voir X vendre le nœud, car nous les

10:26.040 --> 10:29.490
utiliserons plus tard ainsi que le look rétro du LCN.

10:29.520 --> 10:30.430
Très bien parfait.

10:30.480 --> 10:32.960
Alors maintenant, nous en avons fini avec le cerveau.

10:32.970 --> 10:38.040
Ou devrais-je dire les cerveaux parce que nous avons en fait fait deux cerveaux un pour l'acteur et un critique.

10:38.250 --> 10:41.990
Alors félicitations pour la huitième place avec le cerveau.

10:42.180 --> 10:47.940
J'espère que cela n'a pas été trop difficile à combiner à CNN et à Anniston, mais au moins la bonne nouvelle est que

10:47.940 --> 10:51.190
nous travaillons vraiment avec le modèle le meilleur et le plus puissant.

10:51.300 --> 10:53.010
Alors on y va.

10:53.010 --> 10:55.950
Nous en avons fini avec ce premier modèle familial.

10:56.010 --> 10:56.810
Y.

10:56.880 --> 11:02.040
Ainsi, dans les deux prochaines pages, nous nous occuperons de l'optimiseur, car nous allons créer

11:02.190 --> 11:03.300
un optimiseur séparé.

11:03.300 --> 11:08.850
Nous n'allons pas couper chaque ligne de code car cela provient en grande partie des documents de recherche et

11:08.850 --> 11:10.520
c'est en fait assez spécifique.

11:10.530 --> 11:16.470
Et si nous entrons dans les détails de ce qui se passe avec cet optimiseur, cela

11:16.470 --> 11:22.410
risque d’être un peu trop pénible pour la suite, car nous avons toujours la fonction train

11:22.410 --> 11:26.890
à faire qui sera une fonction énorme et qui contient voir.

11:27.030 --> 11:29.240
Alors croyez-moi, vous voulez garder de l'énergie pour cela.

11:29.310 --> 11:32.300
Et par conséquent, nous ne passerons pas trop de temps là-dessus.

11:32.490 --> 11:37.830
Mais je vais quand même développer le code et vous comprendrez l’idée de cette optimisation.

11:38.190 --> 11:44.740
Encore bravo encore pour cette activité et je vous verrai dans le prochain optimiseur Statoil 290.

11:44.760 --> 11:46.140
Jusque là profitez-en
