WEBVTT

00:00.270 --> 00:02.250
Bonjour et bienvenue dans la boutique.

00:02.430 --> 00:05.810
Je suis super excité parce que nous sommes sur le point de faire voir le cerveau de l'A-3.

00:05.810 --> 00:07.430
C'est le cerveau de notre IA.

00:07.590 --> 00:10.800
Et en parlant de cerveaux, je voudrais souligner quelque chose.

00:10.870 --> 00:15.750
Rappelez-vous que dans le premier module, nous avons créé un cerveau simple composé uniquement de couches entièrement connectées.

00:15.840 --> 00:22.260
Ensuite, dans le deuxième module de Dhoom, nous avons créé un cerveau comportant non seulement des couches entièrement connectées,

00:22.350 --> 00:29.070
mais également des yeux, car nous avons ajouté les couches convolutives qui permettaient aux yeux de voir les images et de

00:29.070 --> 00:31.550
comprendre ce qui se passait à l'intérieur.

00:31.830 --> 00:37.590
Et maintenant, nous allons dire que même à un niveau élevé parce que nous allons créer un cerveau qui non seulement

00:37.590 --> 00:41.310
aura des yeux et reliera entièrement les couches mais aussi la mémoire.

00:41.430 --> 00:46.710
Parce que, comme je l’ai dit dans le précédent tutoriel, nous allons ajouter un enregistrement de

00:46.710 --> 00:53.490
ce travail à l’intérieur de ce grand cerveau et qui donnera une longue mémoire à notre cerveau afin qu’il puisse comprendre

00:53.580 --> 00:57.010
les relations temporelles des propriétés temporelles des images d’entrée.

00:57.120 --> 01:02.400
Donc nous y sommes et cerveau encore plus puissant, je peux vous dire que le Dymo sur lequel

01:02.640 --> 01:09.930
nous parlons d’Intiman est vraiment très puissant et nous pouvons voir comment construire l’intelligence artificielle et faire de plus en plus profond et que l’apprentissage

01:10.260 --> 01:14.820
de Forsman consiste à se rapprocher de plus en plus comment fonctionne le cerveau humain.

01:14.820 --> 01:19.560
Vous savez que nous avons commencé par les relations fondamentales du cerveau avec les connexions linéaires.

01:19.560 --> 01:22.230
Ensuite, nous avons ajouté les yeux et la mémoire.

01:22.230 --> 01:24.900
Qui sait ce que nous allons ajouter dans les futurs modèles.

01:24.990 --> 01:30.780
Vous savez, en 2018, ils ajouteront peut-être quelque chose qui rendra le cerveau encore plus ressemblant à un cerveau

01:30.780 --> 01:31.330
humain.

01:31.680 --> 01:37.590
Mais déjà avec des yeux et une mémoire de lasers entièrement connectés, nous avons déjà un cerveau vraiment bon

01:37.590 --> 01:38.280
et fonctionnel.

01:38.790 --> 01:39.690
Alors faisons-le.

01:39.750 --> 01:41.140
Faisons ce cerveau.

01:41.310 --> 01:46.470
Donc, comme d'habitude, nous allons faire un cours sur ce sujet, car il aura beaucoup de

01:46.470 --> 01:48.780
propriétés avec les convolutions et la science.

01:48.870 --> 01:53.770
Donc, nous allons le faire fonctionner pour initialiser tout cela créer toutes ces connexions.

01:54.090 --> 01:59.220
Et bien sûr, nous aurons la fonction Ford qui propagera le signal à l’intérieur du

01:59.220 --> 02:02.580
cerveau afin que nous puissions éventuellement obtenir la sortie.

02:02.580 --> 02:03.200
D'accord.

02:03.240 --> 02:04.020
Es-tu prêt.

02:04.140 --> 02:05.400
Faisons cela.

02:05.400 --> 02:13.700
Nous présentons donc un cours en classe, que nous appelons crédit d'acteur, car je parle bien sûr de cerveaux ici.

02:13.710 --> 02:19.440
Mais n'oublions pas que nous faisons avec le modèle qui est basé sur le principe de critique

02:19.650 --> 02:24.810
actif avec l'acteur et le critique séparément, ce qui en fait une connexion presque complète pour

02:24.810 --> 02:27.770
l'acteur et une connexion significative pour la critique.

02:27.810 --> 02:30.880
Vous verrez à quel point nous ferons cela, ce sera en fait assez simple.

02:30.900 --> 02:39.060
Si critique actif et cette classe d'acteur va hériter de la fin et que Maggio afin que nous puissions utiliser

02:39.060 --> 02:40.780
tous les outils Pitre.

02:40.860 --> 02:44.130
Faisons donc cela pour hériter de la fin de ce module.

02:44.190 --> 02:53.000
Eh bien, nous devons prendre d’abord la bibliothèque de la torche, puis celle-là, puis celle-là et Mudgal.

02:53.090 --> 02:54.100
D'accord.

02:54.110 --> 02:55.600
De cette façon, nous en héritons.

02:56.990 --> 02:57.240
D'accord.

02:57.260 --> 03:01.630
Nous y allons donc avec notre première fonction qui sera bien sûr dans sa fonction.

03:01.640 --> 03:10.400
Donc, nous commençons par dans son double trait de soulignement, puis cette fonction prend l'argument self avec l'objet, puis

03:10.850 --> 03:17.970
la forme en entrée qui correspond aux dominations de nos images en entrée et

03:18.050 --> 03:25.820
nous l'appelons non entrées et la phase actions qui est essentiellement l'espace qui contient toutes les actions.

03:26.000 --> 03:31.340
Nous savons également que cet espace d’action permet d’obtenir un certain nombre d’actions, c’est-à-dire un certain nombre d’actions

03:31.700 --> 03:33.870
possibles qui le seront très bientôt.

03:33.870 --> 03:38.290
C'est pourquoi nous avions également besoin de cela pour les arguments.

03:38.290 --> 03:39.390
C'est tout ce dont nous avons besoin.

03:39.650 --> 03:45.450
Et ensuite, entrons dans la fonction et créons toutes les variables propres à notre cerveau.

03:45.830 --> 03:51.740
Mais avant cela, souvenez-vous de ce que nous devons faire pour activer d’une

03:52.040 --> 03:59.450
manière ou d’une autre l’héritage qui nous permet d’utiliser tous les outils de la fin du

03:59.450 --> 04:00.180
Maggio.

04:00.440 --> 04:10.740
Acteur critique qui est notre classe, puis montons nous-mêmes avec l’objet Très bien alors nous

04:10.740 --> 04:14.840
y revoilà avec la fonction.

04:14.940 --> 04:15.560
Nous y voilà.

04:15.600 --> 04:20.100
Cela nous donne tous les outils dont nous avons tous besoin pour développer notre cerveau.

04:20.400 --> 04:21.940
Très bien alors.

04:22.170 --> 04:24.690
Bien il est temps de faire les yeux des yeux.

04:24.780 --> 04:26.210
C'est les convolutions.

04:26.460 --> 04:31.770
Nous allons donc le faire très rapidement parce que nous avons déjà expliqué cela en détail pour Doom.

04:31.800 --> 04:34.210
Parce que je me souviens du jour où j'ai eu de la glace.

04:34.260 --> 04:39.240
Donc, c'est exactement la même chose, nous allons tirer certaines conclusions et nous allons utiliser une architecture

04:39.510 --> 04:45.240
très simple avec 32 détecteurs de caractéristiques de taille trois sur trois, une foulée de deux et un remplissage d'un.

04:45.450 --> 04:50.460
Il s’agit donc d’une architecture assez classique, mais elle vous suffira en réalité pour vous assurer de bien

04:50.690 --> 04:53.010
comprendre ce qui se passe pendant la pause.

04:53.010 --> 04:54.090
D'ACCORD.

04:54.480 --> 04:56.750
Très bien alors faisons ces convolutions.

04:56.790 --> 05:03.900
Nous commençons donc avec self car les convolutions seront des variables des objets afin que self puisse être appelé

05:03.900 --> 05:09.210
et il y aura quatre convolutions afin que celui-ci puisse en être un.

05:09.540 --> 05:11.040
Et c'est parti.

05:11.040 --> 05:18.900
Nous prenons le point N et Maggio, puis le cône dans la classe, car en réalité, ce sera un

05:18.930 --> 05:20.670
objet de dégoût.

05:21.540 --> 05:25.870
Et ensuite, à l'intérieur, nous mettons la forme d'entrée des images.

05:25.920 --> 05:32.780
Donc, c'est exactement ce que nous avons ici pour que nous puissions copier ceci et le saisir comme première entrée.

05:33.090 --> 05:38.600
Ensuite, le deuxième argument est le nombre de détecteurs de caractéristiques qui sont également le nombre de noyaux.

05:38.640 --> 05:45.060
Nous allons donc prendre 32 comme nous venons de dire choix classique, puis nous devons choisir la taille

05:45.060 --> 05:50.130
du noyau qui correspond au nombre de cellules qui glisseront sur l'image d'entrée.

05:50.190 --> 05:55.170
Et souvenez-vous donc que nous pouvons prendre trois ou quatre choix qui sont proposés et

05:55.290 --> 05:58.460
nous allons en choisir trois, puis nous allons choisir.

05:58.550 --> 06:01.100
Essayé de.

06:01.340 --> 06:11.350
Et un remplissage de celui que nous allons, qui correspond à la première convolution qui va de l’image d’entrée au premier

06:11.350 --> 06:16.210
calque de convolution, est composé de 32 images compliquées.

06:16.360 --> 06:18.850
Alors maintenant, nous sommes prêts à faire la deuxième convolution.

06:18.850 --> 06:27.290
Donc, en fait, ce sera presque pareil, donc je copie cette ligne et la base ci-dessous est collée à nouveau ci-dessous

06:27.310 --> 06:33.490
et je la colle une dernière fois, car nous aurons quatre tours avec presque rien

06:33.490 --> 06:42.640
à changer afin que nous puissions déjà remplacer. un par un vient à un par trois et vient un par un vient quatre.

06:42.670 --> 06:45.160
Ce seront nos quatre convolutions.

06:45.160 --> 06:49.330
Et maintenant, bien sûr, nous devons changer certaines choses ici, mais pas beaucoup, car nous allons

06:49.370 --> 06:52.280
en garder deux pour chacune et un modèle pour une.

06:52.420 --> 06:58.620
Ils auront tous 32 détecteurs de fonctions qui ont 32 sorties d'images convoluted.

06:58.780 --> 07:04.040
Mais alors rappelez-vous que cela correspond à la partie gauche de la convolution.

07:04.180 --> 07:09.610
Donc, en réalité, cela correspond à la partie droite de la conclusion précédente. Vous savez que c'est comme

07:09.610 --> 07:10.370
un dominos.

07:10.390 --> 07:11.440
C'est vraiment facile.

07:11.560 --> 07:22.390
Et donc ici nous devons mettre 32 et voici où nous allons voir très facilement 32 et 32.

07:22.390 --> 07:27.790
Très bien, pour résumer, nous commençons avec nos images d'entrée qui n'en ont aucune.

07:27.810 --> 07:35.350
Simon Jones a été la première convolution à obtenir 32 images compliquées détectant chacune une caractéristique spécifique, puis à partir

07:35.800 --> 07:43.120
de ces 32 images compliquées, nous appliquons la deuxième convolution pour obtenir 32 nouvelles images compliquées puis identiques à

07:43.420 --> 07:46.510
partir de ces 32 nouvelles images compliquées.

07:46.510 --> 07:52.430
Nous appliquons la troisième convolution pour obtenir à nouveau 32 nouvelles images compliquées, puis finalement, des

07:52.450 --> 07:57.470
trois images convolutives, nous appliquons la quatrième convolution pour obtenir des caractéristiques.

07:57.490 --> 07:57.910
D'accord.

07:57.910 --> 08:03.700
Et ce sera suffisant avec cela ou j'aurai une surveillance qui prendra très bien le ballon.

08:03.700 --> 08:07.250
Bon alors c'est tout pour la convolution Alors c'est tout pour les yeux.

08:07.420 --> 08:09.490
Et maintenant, prenons soin de la mémoire.

08:09.640 --> 08:15.520
Cette nouvelle fonctionnalité de ce cerveau que nous implémentons est opposée auparavant, avec non seulement

08:15.680 --> 08:23.140
une supervision, mais également une mémoire super longue et longue parce que nous verrons la mémoire à long terme

08:23.170 --> 08:29.230
qui est ce type de disque ou de neurone. réseau qui donne à votre modèle

08:29.230 --> 08:36.580
une sorte de longue mémoire pour qu’il puisse apprendre certaines relations temporelles du passé, donc nous allons créer de

08:36.580 --> 08:43.180
nouvelles variables à partir du temps passé avec soi et cette nouvelle variable que nous appellerons simplement

08:43.180 --> 08:47.260
car cela correspondra au réseau LACMA dans le cerveau.

08:47.290 --> 08:55.240
Alors SVM et avant que nous écrivions le code pour le LCN, assurons-nous de bien comprendre ce que cette partie du cerveau

08:55.240 --> 08:56.270
LACMA fera.

08:56.530 --> 09:03.980
Donc, comme nous l'avons compris, ce LCN est utilisé pour apprendre les propriétés temporelles des images d'entrée.

09:04.090 --> 09:09.730
Ainsi, par exemple, si la balle frappe un LACMA, la balance sera encodée.

09:09.730 --> 09:11.410
C'est donc la première chose à comprendre.

09:11.410 --> 09:15.070
Cela encodera ce qui se passe dans le jeu.

09:15.070 --> 09:20.080
Ensuite, la prochaine chose importante à comprendre lorsque nous avons implémenté ISTM est

09:20.170 --> 09:26.680
que nous devons choisir dans l’ordre des dépendances temporelles et ici puisque nous allons alimenter notre réseau de neurones

09:26.680 --> 09:33.740
avec une séquence de quatre images, cela signifie que nous pouvons déjà Apprenez quelques dépendances temporelles d'ordre car il s'agit

09:33.740 --> 09:40.310
de dépendances temporelles où ce qui se passe à 1h20 dépend de ce qui se passe à l'instant T.

09:40.360 --> 09:45.500
T moins 1 T moins 2 et T moins 3 afin que nous puissions le faire.

09:45.730 --> 09:51.040
Mais la bonne nouvelle est que nous allons utiliser l'analyse YEM et donc nous

09:51.160 --> 09:54.560
pourrons apprendre des relations temporelles encore plus complexes.

09:54.650 --> 10:00.430
Par exemple, nous pouvons apprendre quelques propriétés simples où ce qui se passera à 1:20 dépendra de ce qui se

10:00.430 --> 10:01.370
passera à T.

10:01.370 --> 10:05.510
T moins 20 minutes pour faire moins trois jusqu'à T moins.

10:05.940 --> 10:13.360
Et c’est la partie longue de la mémoire à court terme avec cet essai et nous pouvons apprendre

10:13.360 --> 10:15.490
des relations temporelles très complexes.

10:15.490 --> 10:18.080
Très bien, ajoutons notre LCN.

10:18.160 --> 10:25.030
Donc, pour ce faire, nous allons utiliser le module N dans, puis nous allons ajouter la classe en tant que T. N. la cellule qui créera cet

10:25.600 --> 10:31.960
objet en tant qu’objet représentant l’heure DST et faisant partie du nouveau réseau car, pour l’instant, il

10:31.960 --> 10:38.570
est également important de comprendre que nous réalisons un CR et que vous savez alors que l’enregistrement convolutionnel

10:38.590 --> 10:45.520
enregistre un nouveau réseau et que la partie arland vient après CNN partie et donc maintenant ce que nous

10:45.610 --> 10:51.350
devons entrer dans cette cellule LACMA est d’abord la taille de la sortie après la convolution.

10:51.400 --> 10:56.060
C'est donc 32 fois trois fois trois.

10:56.230 --> 11:02.670
Donc, ce 32 fois trois fois trois est en réalité la sortie après les quatre convolutions ici.

11:02.830 --> 11:07.600
Mais cela devient l'entrée de l'ARN le LSD et ça marche.

11:07.870 --> 11:13.710
Et maintenant, pourquoi la sortie des quatre circonvolutions est-elle la moitié de la taille trois fois deux fois trois fois trois?

11:13.870 --> 11:16.030
Eh bien, ne vous inquiétez pas, ce n'est pas si direct.

11:16.060 --> 11:22.140
Ce n'est pas une formule simple, mais il existe une formule pour calculer ce nombre de neurones de sortie.

11:22.210 --> 11:26.490
Après avoir aplati les images regroupées et convolutées de la déconvolution.

11:26.710 --> 11:32.050
Mais si nous avons réuni les termes de cette formule géniale, nous obtenons 32 fois trois fois trois.

11:32.200 --> 11:36.060
Je ne voulais pas passer trop de temps là-dessus, car nous avons beaucoup à faire plus.

11:36.190 --> 11:39.470
Et en plus nous avons déjà créé une fonction pour calculer ce nombre.

11:39.520 --> 11:43.710
Rappelez-vous que c’était pour le pire quand nous avons fait fonctionner ce nombre de neurones.

11:43.870 --> 11:45.750
Vous pouvez donc le réutiliser si vous le souhaitez.

11:45.760 --> 11:51.610
Vous n'êtes pas convaincu, mais c'est exactement ce que nous obtenons après avoir rassemblé les termes de cette grosse formule comme

11:51.610 --> 11:53.490
le calcul du nombre de sorties.

11:53.530 --> 11:59.380
Donc, c'est pour le premier argument et ensuite, le deuxième argument va être le nombre de neurones de

11:59.380 --> 12:00.370
sortie du.

12:00.610 --> 12:05.220
Et nous allons passer à 256 OK.

12:05.220 --> 12:12.180
Et donc qu'est-ce que cela signifie maintenant, cela signifie que nous avons maintenant un vecteur qui code chaque événement du jeu

12:12.540 --> 12:19.260
ou, en d'autres termes, nous avons un état codé et c'est donc maintenant que nous pouvons faire la séparation entre

12:19.620 --> 12:25.470
l'acteur et le critique parce que vous Nous savons que nous allons créer deux nouveaux réseaux, l’un

12:25.470 --> 12:31.410
pour l’acteur et l’autre pour le critique, mais il s'agira du même encodage des images et des relations

12:31.410 --> 12:33.990
temporelles entre ces deux réseaux de neurones.

12:33.990 --> 12:37.740
C'est donc la partie commune que nous faisons pour ces deux nouveaux réseaux.

12:37.740 --> 12:43.650
Ce sera le même début pour les deux nouveaux réseaux mais maintenant, les choses vont changer pour l'acteur et

12:43.650 --> 12:49.710
le ruisseau car nous allons en créer un dans la connexion complète pour l'acteur et un autre que la

12:49.710 --> 12:52.200
connexion presque complète pour le craic. .

12:52.230 --> 12:56.320
Alors prenons une petite pause et faisons cela dans un instant.

12:56.400 --> 12:57.860
Jusque-là, profitez de l'IA.