WEBVTT

00:00.300 --> 00:02.930
Bonjour et bienvenue dans ce tutoriel sur Python.

00:02.940 --> 00:08.700
Très bien, nous construisons simplement l'architecture d'un réseau de neurones avec la fonction de notre classe de

00:09.030 --> 00:13.650
réseau, puis nous allons créer une deuxième fonction qui sera la fonction avant

00:13.650 --> 00:15.810
et qui activera les neurones.

00:15.840 --> 00:19.770
C'est la fonction qui remplira pour la propagation.

00:19.830 --> 00:27.240
Alors faisons ceci, faisons cette fonction, appelons-la comme nous venons de le dire et cette

00:27.240 --> 00:29.550
fonction prendra deux arguments.

00:29.610 --> 00:35.070
Tout d'abord, comme d'habitude, vous savez utiliser les variables de l'objet, car

00:35.070 --> 00:37.400
nous allons utiliser SE1 NFC.

00:37.500 --> 00:43.440
Nous avons donc besoin que le self puisse utiliser ces variables, puis nous aurons besoin d'un

00:43.590 --> 00:50.100
deuxième argument, notre entrée, que nous appellerons état car cet état est exactement l'entrée de nos réseaux de

00:50.100 --> 00:50.580
neurones.

00:50.580 --> 00:51.980
Vous savez que ce sont les États.

00:51.990 --> 00:57.320
Il y a d'autres entrées qui entrent dans le réseau de neurones, puis comme sorties, les valeurs q des

00:57.330 --> 01:00.560
trois actions possibles vont de gauche à droite ou de droite.

01:00.690 --> 01:06.210
Mais nous n’avons pas besoin de le mettre ici comme argument, car c’est exactement ce que nous

01:06.210 --> 01:11.880
souhaitons revenir à cette fonction avant qui va non seulement activer les neurones, mais aussi et surtout renvoyer

01:11.880 --> 01:16.640
les valeurs de cube pour chaque action possible en fonction du état d'entrée ici.

01:16.650 --> 01:17.060
D'accord.

01:17.100 --> 01:19.000
Voilà donc les deux arguments dont nous avons besoin.

01:19.140 --> 01:24.440
Et maintenant, allons dans la fonction et spécifions ce que nous voulions faire.

01:24.740 --> 01:29.940
OK, donc la première chose que nous allons faire est d’activer les neurones cachés et nous allons

01:29.940 --> 01:34.690
appeler les neurones cachés par la variable x pour que x représente les neurones cachés.

01:34.800 --> 01:36.750
Et alors, comment les activer.

01:36.930 --> 01:39.990
Bien sûr, nous allons prendre nos neurones d’entrée.

01:40.170 --> 01:45.360
Nous allons utiliser notre première connexion complète si vous voulez obtenir les neurones cachés, puis

01:45.360 --> 01:49.570
nous allons leur appliquer la fonction d'inactivation, qui sera la fonction rectifiée.

01:49.860 --> 01:51.450
Alors, comment vas-tu faire ça?

01:51.450 --> 01:54.680
Rappelez-vous que nous avons importé le flambeau.

01:54.730 --> 02:01.450
Et c'est ce module fonctionnel qui contient toutes les fonctions permettant de mettre en œuvre le réseau de neurones.

02:01.560 --> 02:02.960
Et nous lui avons donné le raccourci.

02:03.450 --> 02:08.130
En fait, ce que nous allons faire maintenant, c’est que nous allons utiliser l’une de ces fonctions

02:08.130 --> 02:11.240
du module fonctionnel et que cette fonction doit vraiment fonctionner.

02:11.430 --> 02:16.490
Donc, ce qui est vraiment important, c'est la fonction de redressement que vous avez vue dans les conférences sur l'intuition.

02:16.620 --> 02:19.040
C'est juste et ensuite donné à la fonction de redresseur.

02:19.170 --> 02:26.130
Mais puisque cette fonction est prise à partir de et dans cette fonction qui a été donnée le raccourci, nous devons

02:26.130 --> 02:31.860
taper ici en premier lieu des pensées et ensuite c’est là que nous pouvons prendre cette fonction.

02:31.990 --> 02:36.610
Et en fait, si je tape, nous sommes ici, nous avons la vraie fonction.

02:36.630 --> 02:41.980
Donc, cela est dirigé par une fonction qui activera les neurones cachés qui est x.

02:42.030 --> 02:47.640
Donc, dans cette fonction, nous comprenons parfaitement ce que nous devons saisir, ce sont les neurones que

02:47.640 --> 02:48.920
nous voulons activer.

02:48.990 --> 02:54.300
Ce sont les neurones cachés et pour obtenir ces neurones cachés, nous allons

02:54.520 --> 03:01.540
prendre notre première connexion complète que nous appliquerons à nos neurones d’entrée pour passer des neurones d’entrée aux neurones.

03:01.800 --> 03:04.450
Prenons donc notre première connexion complète.

03:04.620 --> 03:08.070
Mais notre première connexion complète est une variable de notre objet.

03:08.130 --> 03:12.070
Par conséquent, nous devons taper ici en premier lieu.

03:12.120 --> 03:13.550
FC un ici nous allons.

03:13.620 --> 03:16.660
C'est la première connexion complète de notre réseau de neurones.

03:16.980 --> 03:22.890
Et à l'intérieur de cette connexion personnelle, nous allons entrer nos états d'entrée pour aller des neurones d'entrée

03:23.010 --> 03:24.210
aux neurones cachés.

03:24.480 --> 03:30.680
Et donc depuis que nous lui avons donné le nom STATE, nous avons ici deux états d'entrée et c'est parti.

03:30.720 --> 03:34.360
Nous obtenons maintenant des neurones cachés activés.

03:34.510 --> 03:35.000
D'accord.

03:35.040 --> 03:40.610
Et maintenant que nous avons les neurones cachés, nous allons renvoyer les neurones de sortie.

03:40.640 --> 03:46.240
Donc, ligne suivante et comme vous l'avez compris, les neurones de sortie correspondent à nos actions.

03:46.370 --> 03:48.170
Mais ce ne sont pas les actions directement.

03:48.290 --> 03:55.760
Ce sont les valeurs q parce que nous construisons un modèle numérique qui combine un modèle plus profond d’apprentissage Q

03:56.020 --> 04:02.090
et c’est pourquoi nous utilisons ici l’apprentissage q pour obtenir les valeurs q de chacune de

04:02.090 --> 04:09.560
nos actions. obtenez l'action finale donc ici le voivode que je vais présenter va correspondre à la nuance APA et

04:09.560 --> 04:13.560
puisque les neurones de sortie sont les valeurs clés.

04:13.640 --> 04:15.590
Eh bien, je vais appeler cette variable.

04:15.590 --> 04:24.630
Q Cela signifie que nous allons à q valeurs et maintenant nous prenons directement notre lien alimentaire qui est la variable.

04:24.810 --> 04:27.010
Pour mettre une variable de notre objet.

04:27.020 --> 04:33.830
Donc, nous prenons ici F C autodidacte et bien sûr nous introduisons les neurones du côté gauche de

04:34.010 --> 04:34.860
cette connexion.

04:34.910 --> 04:38.050
C'est ce que nous avons obtenu de la première ligne qui est x.

04:38.270 --> 04:40.770
Alors x on y va.

04:40.790 --> 04:42.650
Nous obtenons maintenant nos valeurs Q.

04:42.680 --> 04:45.790
C'est les neurones de sortie de notre réseau de neurones.

04:46.100 --> 04:46.800
D'ACCORD.

04:47.060 --> 04:53.050
Et puis la dernière ligne de code bien sûr cette fonction forward est utilisée pour renvoyer ces valeurs.

04:53.210 --> 05:02.900
Il suffit donc d’ajouter un retour et simplement des valeurs Q qui renverront les valeurs clés pour chaque action possible aller à

05:02.900 --> 05:06.310
gauche aller tout droit ou aller bien

05:06.370 --> 05:06.760
D'accord.

05:06.760 --> 05:08.370
Alors félicitations.

05:08.370 --> 05:13.720
Nous en avons terminé avec notre premier cours et nous avons en fait fini de créer l'architecture du réseau de neurones.

05:13.720 --> 05:15.550
Rappelez-vous que ce n'est pas un travail fini.

05:15.550 --> 05:19.890
Vous pouvez toujours améliorer l'architecture du réseau de neurones en en essayant différentes.

05:20.020 --> 05:22.780
Alors n'hésitez pas à faire cela en ajoutant plus de neurones ici.

05:22.780 --> 05:28.270
Par exemple, si vous souhaitez ajouter 50 neurones cachés, vous pouvez simplement remplacer les 30 ici et

05:28.270 --> 05:34.860
les 30 ici par 50, 50 et 50, puis vous pouvez ajouter des couches plus cachées en établissant des connexions utiles.

05:34.990 --> 05:37.630
C'est vraiment le travail d'un artiste.

05:37.660 --> 05:41.980
Il n'y a pas de règle générale sur ce qui serait la meilleure architecture dans chaque situation.

05:42.040 --> 05:43.720
C'est pourquoi nous devons expérimenter.

05:43.940 --> 05:50.140
Essayons avec cela, vous verrez que nous aurons finalement une très bonne voiture autonome.

05:50.170 --> 05:50.590
D'accord.

05:50.620 --> 05:55.960
Et maintenant, nous allons faire le prochain cours qui est consacré à la rediffusion d’expérience et nous le ferons dans les

05:55.990 --> 05:57.450
trois ou deux prochaines heures.

05:57.610 --> 05:59.080
Jusque-là, profitez de l'IA.
