WEBVTT

00:00.360 --> 00:06.360
Bonjour et bienvenue dans le didacticiel amusant de ce premier module de voiture autonome qui va être épique.

00:06.360 --> 00:11.850
Nous allons tester notre regard sur l'environnement et nous allons le tester à quatre niveaux différents.

00:11.850 --> 00:16.620
C'est-à-dire que nous allons jouer à un jeu. Le jeu comportera quatre niveaux de difficulté et le but

00:16.620 --> 00:18.280
devra passer ces quatre niveaux.

00:18.420 --> 00:20.640
Nous allons donc être ces quatre niveaux.

00:20.640 --> 00:27.480
Premier niveau Le premier niveau consistera à atteindre l'aéroport, puis à effectuer des allers-retours entre l'aéroport

00:27.480 --> 00:29.160
et le centre-ville.

00:29.340 --> 00:35.430
Donc, dès que nous voyons la voiture faire ces allers-retours Nous passons au niveau 1 puis au niveau 2, le niveau

00:35.450 --> 00:37.490
2 consistera toujours à effectuer ces allers-retours.

00:37.560 --> 00:43.290
Mais sur la route spécifique que nous traçons nous-mêmes, mais ça va être une route facile car c'est le niveau

00:43.290 --> 00:43.840
2.

00:43.980 --> 00:49.030
Et bien sûr, la voiture devra s’auto-conduire en restant sur cette route.

00:49.170 --> 00:53.420
Donc, ce sera une route qui va de l’aéroport au centre-ville, puis l’inverse.

00:53.420 --> 00:57.010
Et donc la voiture devra faire ces allers-retours en étant assis sur cette route.

00:57.210 --> 01:00.980
Si c'est le cas, nous passerons le niveau 2 et le niveau 3.

01:01.030 --> 01:07.410
Le niveau 3 consistera à tracer des obstacles sur la carte pour voir si la voiture parvient à les éviter et

01:07.410 --> 01:08.850
à atteindre son objectif.

01:08.910 --> 01:12.730
Aucun problème ne vous empêchera donc d’obtenir des obstacles difficiles.

01:12.930 --> 01:20.010
Et nous verrons s'il parvient à atteindre l'aéroport et le centre-ville et enfin, le niveau le plus difficile pour

01:20.010 --> 01:25.380
la voiture sera de tracer une route très difficile pour atteindre le centre-ville.

01:25.440 --> 01:28.060
Donc je ne sais pas si vous savez que ce sera une route comme un zigzag.

01:28.200 --> 01:31.720
Je ne suis pas un architecte brillant, mais je vais essayer de faire une route difficile.

01:31.950 --> 01:37.830
Donc, espérons que nous atteindrons au moins le premier niveau qui serait génial, alors espérons que nous pourrons également passer les

01:37.920 --> 01:39.190
niveaux deux et trois.

01:39.420 --> 01:42.180
Et si nous passions le niveau 4, ce serait merveilleux.

01:42.180 --> 01:44.540
Alors faisons ceci, relevons le défi.

01:44.610 --> 01:49.840
En fait, la voiture autonome va relever le défi, mais nous en sommes le cerveau.

01:49.860 --> 01:52.110
Alors disons comment ça marche.

01:52.110 --> 01:57.280
La première chose que je vais faire est de vous rappeler rapidement la carte.

01:57.330 --> 01:59.060
Donc c'est la carte.

01:59.190 --> 02:03.810
Et tout d'abord, nous allons examiner la carte. Nous examinerons la voiture autonome sans l'IA.

02:04.020 --> 02:09.540
Il s'agira simplement d'une voiture ayant ces actions aléatoires que vous avez vues au début de ce modèle.

02:09.600 --> 02:10.970
Alors, comment pouvons-nous regarder cela.

02:11.040 --> 02:15.330
Nous devons désactiver l'IA et l'activité.

02:15.570 --> 02:19.590
Nous devons simplement mettre une température égale à zéro.

02:19.620 --> 02:22.380
Rappelez-vous que ce paramètre est la température.

02:22.560 --> 02:24.240
Et pour le moment, il est égal à sept.

02:24.300 --> 02:25.830
C'est une basse température.

02:25.830 --> 02:27.280
Nous augmenterons cela par la suite.

02:27.510 --> 02:32.700
Mais si nous ne voulons pas que la voiture ait un cerveau, c’est-à-dire que si nous ne voulons pas activer

02:32.700 --> 02:36.210
l’IA, nous devons simplement régler la température à zéro et à zéro.

02:36.210 --> 02:39.980
Et la même chose ici bien sûr, c'est la vraie température dans le froid aussi.

02:39.990 --> 02:40.460
Nous y voilà.

02:40.470 --> 02:45.580
Et puis nous ne devons pas oublier de dire parce que sinon cela n'inclut pas le changement.

02:45.800 --> 02:47.120
Je suppose que maintenant nous n'en avons pas.

02:47.130 --> 02:49.210
Je vois que j'avais l'habitude de l'activer.

02:49.260 --> 02:53.180
Alors jetons un coup d’œil à la carte pour nous donner un bref rappel.

02:53.220 --> 02:55.370
Un rappel rapide sur ce que cela ressemble.

02:55.530 --> 03:01.070
Je vais donc tout sélectionner et appuyer sur Entrée.

03:01.090 --> 03:01.630
D'accord.

03:01.630 --> 03:03.840
Et il y a notre carte et il y a notre voiture.

03:03.880 --> 03:09.540
Comme vous pouvez le constater, la voiture subit des actions totalement aléatoires. Vous savez que vous devez aller à gauche

03:09.540 --> 03:16.480
pour aller tout droit vers la droite. Par conséquent, elle n’atteint pas l’aéroport, ce qui me rappelle en haut à gauche de la carte et ne

03:16.870 --> 03:17.500
l’atteint pas.

03:17.550 --> 03:18.410
Eh bien ça vient de le faire.

03:18.470 --> 03:20.230
C'est totalement aléatoire.

03:20.230 --> 03:26.680
Vous le voyez en ce moment, il se trouve à l'aéroport et il n'atteint pas l'autre objectif qui est situé au centre-ville, en bas

03:26.680 --> 03:28.220
à droite de la carte.

03:28.480 --> 03:34.030
Nous étions donc comme ici mais nous pouvons voir clairement maintenant que les actions sont totalement aléatoires.

03:34.030 --> 03:40.270
Il ne va nulle part et il n'y a vraiment pas d'intelligence artificielle mais pas de souci.

03:40.270 --> 03:42.080
Nous allons l'activer maintenant.

03:42.370 --> 03:49.480
Je vais fermer la carte puis redémarrer le noyau, redémarrer DeCarlo.

03:49.760 --> 03:52.390
Vous cliquez ici sur cet outil, puis sur Oui.

03:52.820 --> 04:00.730
Et maintenant, l'heure du spectacle, nous allons enfin mettre ce train que nous avons fait dans la voiture et activer

04:00.730 --> 04:01.350
l'IA.

04:01.700 --> 04:04.090
Je suis super excité de voir ce qui va se passer.

04:04.180 --> 04:10.730
Nous allons activer l'air maintenant et pour ce faire, nous devons augmenter la température afin de

04:10.730 --> 04:17.300
changer la température qui est remplacée à zéro par bien commençons avec sept comme nous l'avions auparavant.

04:17.450 --> 04:19.660
Alors spécifions sept ici.

04:19.670 --> 04:21.510
Très bien n'oublions pas de dire.

04:21.590 --> 04:26.870
Et maintenant, revenons à notre carte et nous pouvons maintenant l'exécuter à nouveau car nous avons redémarré

04:26.870 --> 04:27.790
le noyau.

04:27.890 --> 04:29.470
Alors disons le.

04:29.990 --> 04:31.790
Et voilà, nous avons la voiture.

04:31.790 --> 04:33.600
Et que fait-il

04:33.890 --> 04:41.180
Eh bien, il essaie de trouver son chemin en explorant sa compréhension de ce qu’il a à

04:41.180 --> 04:47.900
faire et sa volonté d’atteindre l’aéroport. Nous y allons en premier, nous atteignons merveilleux et l’objectif

04:48.140 --> 04:50.540
suivant est d’atteindre le centre-ville.

04:50.810 --> 04:56.750
Et maintenant, c’est essayer de retrouver l’aéroport qui y retourne et là encore, des merveilles qui

04:56.750 --> 04:57.450
fonctionnent.

04:57.470 --> 05:03.200
Il n’a pas fallu du temps pour explorer les leçons tirées des erreurs; vous savez que l’erreur ici est

05:03.200 --> 05:04.380
d’aller plus loin.

05:04.520 --> 05:08.770
C’est là que nous punissons la voiture en lui donnant une récompense légèrement négative.

05:08.780 --> 05:10.270
Vous connaissez son moins 0. 2

05:10.550 --> 05:16.760
Donc, il tire des leçons de cette erreur et en apprenant de cette erreur, il réussit à obtenir les récompenses

05:17.000 --> 05:18.980
positives en se rapprochant de l'objectif.

05:19.310 --> 05:21.940
Et maintenant, il comprit enfin ce qu'il devait faire.

05:21.980 --> 05:28.530
Il est certain d’atteindre l’aéroport, puis le centre-ville, puis ces allers-retours.

05:28.550 --> 05:29.970
C'est parfait.

05:29.990 --> 05:36.090
Nous avons une voiture autonome mais je ne peux m'empêcher de remarquer qu'elle ressemble à un insecte.

05:36.170 --> 05:38.510
La voiture ne semble pas vraiment sûre d'elle.

05:38.510 --> 05:40.610
Non, le mouvement n'est pas très confiant.

05:40.610 --> 05:44.570
C'est comme si votre gauche et votre droite ne bougeaient pas comme un mouvement de voiture.

05:44.660 --> 05:46.090
Cela ressemble plus à un bug.

05:46.490 --> 05:47.820
Nous allons donc résoudre ce problème.

05:47.930 --> 05:54.560
Et comme vous l'avez peut-être deviné, la solution consiste à augmenter la température car rappelez-vous que la température est le

05:54.560 --> 05:59.690
paramètre de la fonction Mac que nous pouvons augmenter pour que l'action soit renvoyée avec

05:59.690 --> 06:00.730
plus de certitude.

06:00.830 --> 06:05.630
Il est donc logique que si nous augmentons bien la température, nous pourrions éventuellement obtenir une

06:05.630 --> 06:09.750
voiture plus sûre d'elle-même, car l'IA sera plus sûre de l'action à mener.

06:10.220 --> 06:15.350
Et cela, c'est parce que l'action sera jouée avec une probabilité plus élevée.

06:15.350 --> 06:20.780
Le seul problème avec cette augmentation de la température est que rappelez-vous que l'IA explore

06:20.780 --> 06:26.380
moins les autres actions, car en augmentant la température des autres actions, nous aurons de faibles probabilités.

06:26.380 --> 06:31.760
Mais pour le moment, cela ne semble pas poser de problème, car la voiture ne semble avoir aucun problème pour atteindre

06:31.760 --> 06:32.310
ses objectifs.

06:32.420 --> 06:38.840
L’aéroport est au centre-ville, donc nous pouvons augmenter totalement la température si nous voulons que cette chose qui ressemble à

06:38.840 --> 06:41.140
un insecte ressemble à une voiture.

06:41.390 --> 06:42.620
Alors faisons ceci.

06:42.620 --> 06:45.530
Je vais fermer ça maintenant.

06:45.530 --> 06:46.370
Nous y voilà.

06:46.370 --> 06:48.310
Redémarrez le noyau à nouveau.

06:49.430 --> 06:50.590
Et appuyez sur oui.

06:50.830 --> 06:52.810
Et maintenant nous allons augmenter la température.

06:53.200 --> 06:54.090
Alors faisons ceci.

06:54.100 --> 07:02.170
Je retourne à mon dossier puis remplace sept par 100.

07:02.340 --> 07:03.410
Ensuite, nous économisons.

07:03.720 --> 07:07.890
Et maintenant, nous avons une voiture autonome, sûre d'elle-même.

07:07.890 --> 07:11.990
Donc, nous pourrions obtenir de meilleurs résultats et quelque chose qui ressemble davantage à une voiture.

07:12.270 --> 07:15.780
Prenons une carte et revenons à cela.

07:16.610 --> 07:18.900
Bon ce qui s'est passé.

07:18.920 --> 07:19.730
D'ACCORD.

07:19.830 --> 07:21.340
Cela a causé une sorte d'épuisement professionnel.

07:21.350 --> 07:22.190
Pas certain de pourquoi.

07:22.310 --> 07:25.980
Quoi qu'il en soit, nous avons maintenant quelque chose qui ressemble davantage à une voiture.

07:26.060 --> 07:28.240
Vous pouvez voir que ça va plus droit.

07:28.240 --> 07:31.190
Il ne fait pas ces mouvements rapides gauche et droite.

07:31.190 --> 07:36.410
En effet, la voiture sait désormais quelle direction prendre et chaque fois que vous savez

07:36.410 --> 07:40.720
qu'elle souhaite prendre la meilleure direction, aller à l'aéroport puis au centre-ville.

07:41.000 --> 07:44.490
Donc, clairement, nous pouvons maintenant dire que nous avons passé le niveau un.

07:44.510 --> 07:47.840
La voiture effectue ces allers-retours entre l'aéroport et le centre-ville.

07:47.990 --> 07:52.610
Nous allons donc sauver ce que je vais vous montrer comment sauver le cerveau.

07:52.610 --> 07:59.520
Nous avons juste besoin de cliquer sur ce bouton de sauvegarde et si nous regardons ce qui se passe ici.

07:59.520 --> 08:04.640
Eh bien, nous avons la courbe de ce que nous étions au début, nous pouvons observer quelques erreurs qu'il a faites.

08:04.740 --> 08:06.990
C'est donc là que la récompense est négative.

08:07.170 --> 08:14.280
Mais ensuite, il a tiré des leçons de ses erreurs et la récompense a augmenté

08:14.280 --> 08:19.100
petit à petit pour atteindre une récompense positive constante.

08:19.200 --> 08:21.640
Et c'est parce que ça a fini par explorer.

08:21.870 --> 08:23.490
C'est la phase d'expiration.

08:23.670 --> 08:26.200
Et puis, il savait juste ce qu'il devait faire.

08:26.230 --> 08:32.230
C’est là que se déroulaient ces rondes entre l’aéroport et le centre-ville sans se tromper.

08:32.640 --> 08:33.450
Alors on y va.

08:33.450 --> 08:34.470
Nous avons passé le niveau un.

08:34.470 --> 08:35.850
Toutes nos félicitations.

08:35.850 --> 08:38.170
Maintenant passons aux choses plus difficiles.

08:38.190 --> 08:40.120
Prenons les choses au prochain niveau.

08:40.140 --> 08:45.810
Essayons de passer au niveau auquel je vous rappelle que nous faisons ces allers-retours sur une route spécifique.

08:45.830 --> 08:47.060
Nous allons nous dessiner.

08:47.120 --> 08:49.170
Alors vérifions cela dans le prochain travail.

08:49.200 --> 08:50.780
Et jusque là je
