WEBVTT

00:01.050 --> 00:03.770
Bonjour et bienvenue au cours sur l'intelligence artificielle.

00:03.810 --> 00:08.280
Et aujourd'hui, nous parlons de Mark de processus décisionnels ou M. RÉ..

00:08.760 --> 00:11.120
Regardons ce que nous avons aujourd'hui.

00:11.430 --> 00:14.060
Alors la dernière fois, nous nous sommes arrêtés sur le concept de carte.

00:14.070 --> 00:19.980
Donc, comme nous avons calculé les valeurs en fonction de l'équation de Belman, nous pouvons obtenir cette carte pour notre agent

00:20.010 --> 00:21.060
dans ce labyrinthe.

00:21.240 --> 00:27.570
Et, fondamentalement, cela signifie que le point fort d'un agent commence, disons que cela commence là-bas.

00:27.570 --> 00:33.270
Il sait exactement quelles étapes à franchir pour se rendre à la ligne d'arrivée, donc ça monte juste.

00:33.270 --> 00:35.040
Bien fait.

00:35.070 --> 00:37.540
Et donc la question est que c'est ça.

00:37.590 --> 00:39.780
Est-ce vraiment aussi simple que cela?

00:39.780 --> 00:44.690
Est-ce que l'apprentissage par renforcement est vraiment ce que vous connaissez pour le manque d'un meilleur mot ennuyeux.

00:44.790 --> 00:46.420
C'est c'est oui.

00:46.440 --> 00:50.830
Une fois les calculs terminés, il ne vous reste plus qu'à les remplir.

00:51.090 --> 00:55.460
En réalité, ce n’est pas si simple.

00:55.500 --> 01:01.020
Et c’est une bonne chose, car cela rend ce cours plus intéressant pour nous et nous permet effectivement de résoudre

01:01.020 --> 01:02.610
des problèmes beaucoup plus complexes.

01:02.610 --> 01:05.460
Donc, c’est là qu’une marque de processus se prépare.

01:05.490 --> 01:07.770
Mais d'abord, nous allons parler de deux choses.

01:07.760 --> 01:11.450
Nous sommes dans la recherche déterministe par opposition à la recherche non déterministe.

01:11.700 --> 01:14.750
Parlons donc du concept de recherche déterministe.

01:14.820 --> 01:21.570
Ceci est notre agent dans le labyrinthe et la recherche déterministe signifie que si l'agent

01:21.570 --> 01:26.980
décide de monter, alors il se produira une probabilité de 100%.

01:27.030 --> 01:28.700
C'est exactement ce qui va arriver.

01:28.700 --> 01:29.740
Il n'y a pas d'autres options.

01:29.740 --> 01:33.690
Une fois que cela dit monter ou cliquez sur la flèche vers le haut, ça va monter.

01:33.690 --> 01:35.070
Il n'y a pas d'autres options.

01:35.250 --> 01:41.950
Maintenant, par contre, la recherche non déterministe est quand notre agent dit qu'il veut monter.

01:42.130 --> 01:44.430
Ils sont en réalité quelques options.

01:44.460 --> 01:48.820
Par exemple, il pourrait y avoir trois options et nous allons regarder un exemple où il

01:48.830 --> 01:53.400
y en a trois mais il n’est pas nécessaire que la limite soit de trois pour

01:53.400 --> 01:59.640
que cela puisse être différent en fonction du problème, le caractère aléatoire pourrait dans notre cas, il pourrait y avoir trois options avec

01:59.640 --> 02:01.640
une probabilité de 80% qu'il monte.

02:01.860 --> 02:07.500
Mais alors avec une chance sur 10% quand il veut monter, il ira à gauche juste parce que.

02:07.500 --> 02:11.080
Parce que c'est comme ça que l'environnement fonctionne, c'est le monde dans lequel il vit.

02:11.430 --> 02:14.840
Et avec un autre chèque sur 10% de chance, il ira bien.

02:14.880 --> 02:17.770
Et dans ce cas, il tombera dans le foyer.

02:17.850 --> 02:20.730
C'est comme ça que tout fonctionne.

02:20.760 --> 02:26.760
C’est un exemple de recherche non déterministe dans un processus stochastique et son objectif est de créer un modèle

02:26.760 --> 02:35.370
plus réaliste de ce qui pourrait réellement se produire dans un monde réel dans un type de problème du monde réel, car il est très rare que vous

02:35.370 --> 02:40.560
rencontriez de telles situations. quand vous faites quelque chose et que cela se passe exactement de

02:40.560 --> 02:41.390
cette façon.

02:41.520 --> 02:46.560
Et même si vous y réfléchissez en termes de jeux, supposons qu'un agent joue Pac-Man.

02:46.740 --> 02:51.270
Eh bien, il n’est pas toujours vrai que s’il se tient sur la place, il monte.

02:51.360 --> 02:54.260
Il obtiendra le même résultat exact à chaque fois.

02:54.460 --> 02:59.820
Eh bien, il va effectivement monter, mais dans un cas, vous ne serez pas mangé par un fantôme dans les deux cas.

02:59.820 --> 03:01.570
Il va se faire manger par un fantôme.

03:01.590 --> 03:05.970
Comme vous pouvez le constater, il y a un certain hasard à cela car cela dépend de la manière dont les fantômes se déplacent et ils ne

03:05.970 --> 03:07.350
se déplacent pas toujours de la même manière.

03:07.350 --> 03:09.370
Ils ne commencent pas toujours aux mêmes endroits.

03:09.510 --> 03:16.140
Il est donc très logique de penser qu'il y a une part d'aléa qui n'est pas

03:16.140 --> 03:21.810
sous le contrôle de l'agent, c'est-à-dire que c'est juste une façon pour nous de

03:21.810 --> 03:27.240
le présenter cela affecte l’équation de Belman et son incidence sur l’ensemble du

03:27.240 --> 03:29.010
processus d’apprentissage par renforcement.

03:29.070 --> 03:33.780
Mais dans le même temps, le hasard n’est bien sûr pas limité si vous montez, il y a 10% de chances que vous alliez à

03:33.780 --> 03:38.400
droite ou à temp et que vous alliez juste à gauche ou si vous descendez à 10% de chance que vous alliez à droite

03:38.400 --> 03:42.840
ou à gauche » Vous avez raison, il y a 10% de chances que la hausse ou la baisse soit limitée au lieu

03:42.840 --> 03:45.550
où vous vous retrouverez. Parfois, vous pourriez avoir un problème qui est exactement.

03:45.570 --> 03:47.390
Parfois, les possibilités peuvent être différentes.

03:47.430 --> 03:52.990
Parfois, le hasard peut se résumer à autre chose, il peut être résumé comme dans cet exemple.

03:52.980 --> 03:58.890
Les fantômes Pacman mangeant vous ne vous mangez pas ou cela pourrait se résumer à quelque chose de différent.

03:58.890 --> 04:05.550
Par exemple, il y a comme si l'agent jouait Doom et ensuite il y avait quelque chose comme un monstre qui va

04:05.700 --> 04:11.040
le tirer dans un cas et dans d'autres cas, il y a une probabilité que nous devrions tous

04:11.060 --> 04:14.380
nous faire tirer dessus et nous ne le serons pas.

04:14.550 --> 04:19.710
Et untel, quelque chose qui échappe au contrôle des agents est quelque chose que je ne peux pas prédire.

04:19.710 --> 04:25.740
C’est ce que nous modélisons ici dans une recherche non déterministe et c’est ici que nous avons directement

04:25.950 --> 04:32.780
approché deux nouveaux concepts: une marque de processus et / ou une marque de processus et une marque de processus

04:32.790 --> 04:34.130
de décision, examinons-les.

04:34.150 --> 04:39.080
Et vous savez combien je n'aime pas mettre de définitions et beaucoup de texte de côté.

04:39.090 --> 04:42.280
Mais dans ce cas, il est nécessaire que nous passions par là.

04:42.280 --> 04:46.220
Regardons donc un processus stochastique a une marque de propriété.

04:46.240 --> 04:51.750
Si la distribution de probabilité conditionnelle des états futurs du processus est conditionnelle et que

04:51.750 --> 04:58.200
les états passé et présent dépendent uniquement de l'état présent et non de la séquence d'événements qui l'ont précédé.

04:58.230 --> 05:00.410
Un processus avec cette propriété s'appelle un marqueur.

05:01.040 --> 05:06.470
Une définition très complexe et un peu comme si vous introduisez un peu, non seulement se contredit, mais donne l’impression

05:06.470 --> 05:11.110
que cela se contredit, alors ici, elle est conditionnelle à une présence positive qui dépend de votre

05:11.110 --> 05:11.450
argument.

05:11.480 --> 05:14.450
Mais en même temps, cela ne dépend que de l'état actuel.

05:14.510 --> 05:17.510
Alors ne vous embourbez pas trop là-dedans.

05:17.670 --> 05:23.050
Je vais le décomposer en termes simples afin qu'une marque de propriété soit lorsque vos futurs états.

05:23.060 --> 05:25.310
Donc, pas seulement votre choix, mais le tout.

05:25.310 --> 05:31.640
Votre choix et l'environnement ne feront qu'aimer les résultats de toutes les actions que vous entreprendrez dans cet environnement ne

05:31.640 --> 05:33.900
dépendront que de votre situation actuelle.

05:33.920 --> 05:35.770
Cela ne dépendra pas de la façon dont vous y êtes arrivé.

05:36.110 --> 05:36.560
Et c'est tout.

05:36.560 --> 05:40.630
C'est donc une question de public et un processus qui possède cette propriété s'appelle le processus de marché.

05:40.880 --> 05:47.570
Donc, pour donner un exemple, si votre agent est ici et s'il part, s'il décide de monter, il pourrait y

05:47.570 --> 05:48.030
aller.

05:48.040 --> 05:52.940
Dans notre cas, dans notre exemple de recherche non déterministe, il pourrait aller de gauche à droite.

05:53.000 --> 05:53.680
D'accord.

05:53.690 --> 05:58.940
C'est parce que nous avons cette ville dans notre environnement, nous avons ce caractère aléatoire dans

05:58.940 --> 05:59.710
notre environnement.

05:59.810 --> 06:01.820
Donc, n'importe laquelle de ces choses pourrait arriver.

06:01.820 --> 06:07.250
Mais la clé ici est que c'est une marque de processus parce que nous ne nous soucions pas de savoir comment vous êtes arrivé

06:07.250 --> 06:10.700
Il aurait pu venir du haut a fini ici, il aurait pu venir de la gauche et qu'ici

06:10.700 --> 06:12.370
vous pourriez venir du bas et finir ici.

06:12.380 --> 06:16.640
Il aurait pu jouer comme déplacé ici environ 100 000 fois puis arriver ici.

06:16.700 --> 06:22.490
Peu importe ce qui s'est passé auparavant, seul importe dans quel état se trouve-t-il maintenant.

06:22.520 --> 06:31.160
Et donc les probabilités d'aller à gauche ou à droite ou en haut seront toujours les mêmes s'il est dans cet

06:31.160 --> 06:32.250
état maintenant.

06:32.690 --> 06:37.530
Et donc, c'est simplement dire que peu importe ce qui s'est passé avant d'être ici maintenant.

06:37.640 --> 06:39.150
C'est l'état dans lequel vous vous trouvez.

06:39.200 --> 06:42.320
Et n'oubliez pas que cet état ne signifie pas seulement où il se trouve.

06:42.320 --> 06:48.140
L’état est l’état de l’ensemble de l’agent dans l’environnement, il y a donc des monstres à droite ou des monstres à

06:48.140 --> 06:53.030
gauche, ou vous savez, le fantôme vient du haut ou du bas, quel que soit l’état où

06:53.090 --> 06:54.530
vous vous trouvez .

06:54.560 --> 06:58.460
Peu importe comment vous y êtes arrivé, peu importe comment et comment vous en êtes venu à être dans cet

06:58.460 --> 06:58.790
état.

06:58.790 --> 07:02.990
Maintenant, ce qui va arriver dans le futur n'est déterminé que par l'état dans lequel vous vous trouvez.

07:02.990 --> 07:07.440
En plus des actions que vous allez entreprendre et bien sûr du caractère aléatoire qui s’y superpose.

07:07.460 --> 07:14.280
Donc, c'est une marque de processus et un processus de décision de marqueur ou un processus de décision de MVP ou de marqueur.

07:14.390 --> 07:20.390
Fournissez un cadre mathématique pour modéliser la prise de décision dans des situations où les résultats sont en partie aléatoires

07:20.420 --> 07:23.430
et en partie sous contrôle de la prise de décision.

07:23.570 --> 07:29.120
Si important de comprendre que la marque du processus de décision est un processus différent et

07:29.150 --> 07:32.210
marque du concept entier pour marquer du processus.

07:32.340 --> 07:34.810
Il y a comme un cadre mathématique alors.

07:34.970 --> 07:39.080
Mais en même temps, j'estimais qu'il était important pour nous de comprendre ce qu'est une

07:39.170 --> 07:45.140
marque de processus, car je pense que cela aide toujours à comprendre le processus de décision. Il existe donc une marque de

07:45.200 --> 07:46.130
processus de décision.

07:46.230 --> 07:50.950
C’est exactement ce dont nous avons discuté jusqu’à présent, de sorte que l’agent vit dans cet environnement où il

07:51.290 --> 07:56.570
a le contrôle comme lui auparavant et où il a le plein contrôle de ce qui se passe, mais qui le contrôle

07:56.570 --> 07:57.530
un peu moins.

07:57.590 --> 08:00.270
Il peut décider de monter mais il sait réellement.

08:00.290 --> 08:05.570
OK, donc si je monte il y a une chance pour les singes, je vais monter cette tentative et les chances vont à gauche et la chance

08:05.560 --> 08:06.170
ira à droite.

08:06.170 --> 08:08.930
Donc, tout n’est pas entièrement sous son contrôle.

08:08.930 --> 08:13.280
Il y a un peu de hasard dans cet environnement et c'est exactement ce que le processus

08:13.280 --> 08:18.830
de décision et le processus de décision de Markov constituent le cadre que l'agent utilisera pour comprendre ce qu'il faut faire dans

08:18.830 --> 08:19.400
cet environnement.

08:19.400 --> 08:22.400
Nous avons donc un environnement avec une toxicité quelque peu aléatoire.

08:22.550 --> 08:27.000
Et maintenant, l’agent doit choisir, par exemple, de descendre vers la gauche ou vers la droite.

08:27.370 --> 08:28.530
Il doit prendre cette décision.

08:28.520 --> 08:29.820
Il ne sait pas quoi faire.

08:30.140 --> 08:36.200
Et pour prendre cette décision, nous allons appliquer un cadre qui utilisera un processus de décision

08:36.200 --> 08:40.960
afin de décider de ce qui va se passer à l’avenir.

08:40.970 --> 08:47.600
Et donc, fondamentalement, cet environnement qui pose ce problème est référé à la marque du processus de décision, de

08:47.600 --> 08:52.820
sorte que c’est le cadre utilisé par l’agent en même temps qu’il est exploité dans

08:52.820 --> 08:55.810
un environnement de processus de décision de marché.

08:56.280 --> 09:01.190
Et donc, fondamentalement, nous avons ici deux concepts qui ont la marque de processus est la façon dont cet environnement

09:01.190 --> 09:03.740
est conçu pour que le PA effectue le travail.

09:03.770 --> 09:07.020
Ce qui se passe là où vous êtes maintenant ne dépend pas du passé.

09:07.130 --> 09:11.240
Et au même moment, nous avons la marque du processus de décision: le cadre

09:11.240 --> 09:13.630
que l'agent utilisera pour résoudre cet environnement.

09:13.970 --> 09:18.830
Et la bonne nouvelle, c’est que le processus décisionnel ou le cadre dont nous parlons

09:18.830 --> 09:24.730
ne fait qu’ajouter à la question de Belman concernant l’équation, c’est l’équation de Belman, mais un peu plus sophistiquée.

09:24.740 --> 09:26.960
Alors regardons ça.

09:27.050 --> 09:28.910
Ceci est notre équation de Belman jusqu'à présent.

09:29.030 --> 09:31.030
C'est le maximum de toutes les actions possibles.

09:31.040 --> 09:35.150
Donc, la valeur d'être dans un état est le maximum de toutes les actions possibles que vous pouvez effectuer à

09:35.150 --> 09:35.990
partir de cet état.

09:36.260 --> 09:41.930
Le maximum provient de la récompense que vous obtiendriez en prenant cette action dans cet état, plus un facteur de

09:41.930 --> 09:45.410
réduction multiplié par la valeur du prochain état, qui est aussi bon.

09:45.410 --> 09:47.390
C'est donc ce que nous avons eu jusqu'à présent.

09:47.400 --> 09:52.550
Maintenant, comme nous avons un peu d’aléatoire dans tout notre processus, cette partie va changer car nous ne

09:52.550 --> 09:57.620
savons pas vraiment quel état finira et nous ne saurons pas quel sera le meilleur choix

09:57.630 --> 10:03.680
si ce sera le cas. up ou seront laissés seront raison donc nous devons effectivement placer cela avec la valeur attendue

10:03.680 --> 10:04.960
de la prochaine date.

10:04.970 --> 10:08.810
Nous allons donc remplacer ceci afin que nous puissions nous retrouver dans trois états possibles.

10:08.810 --> 10:15.480
Et donc, nous allons remplacer cela par une certaine valeur, cet état a la valeur première.

10:15.520 --> 10:18.190
Qu'il a une vue de premier à premier.

10:18.470 --> 10:22.490
Et cet état a une valeur de nous trois Bryne.

10:22.640 --> 10:28.790
Nous allons donc maintenant multiplier par 80 le nombre d’États dans lequel nous comptons aller, car c’est ainsi

10:28.790 --> 10:33.770
que la probabilité d’atteindre cet État et la probabilité d’atteindre cet État sont de

10:33.770 --> 10:39.800
10% plus les personnes qui entrent dans cet État. juste notre valeur attendue, donc si nous prenons des

10:39.800 --> 10:46.880
statistiques si nous prenons la valeur escomptée d'entrer dans l'état dans lequel nous entrerons, elles ressemblent un peu à la moyenne.

10:47.060 --> 10:52.040
Quelle est la moyenne de ce que nous obtiendrons, puis nous la remplacerons ici.

10:52.040 --> 10:56.210
Ensuite, nous obtenons cette agression et elle saute très rapidement juste parce qu’il ya une grosse mais si vous

10:56.210 --> 10:59.930
la regardez attentivement, vous verrez la même chose dire à propos de Max ici Max ici.

10:59.960 --> 11:06.340
Ensuite, vous avez le R et le R et vous et vous avez le gamma, vous avez le gamma.

11:06.410 --> 11:08.600
Et puis enfin ici vous avez v.

11:08.630 --> 11:13.640
Donc, vous saviez exactement que c’était une recherche déterministe, vous savez dans quels états vous allez entrer.

11:13.640 --> 11:16.120
Maintenant, vous ne savez pas dans quel état vous allez entrer depuis celui de prendre V.

11:16.120 --> 11:23.300
Vous prenez la valeur attendue de l'état dans lequel vous allez entrer ou de l'état futur ou simplement, vous prenez simplement la

11:23.300 --> 11:25.920
moyenne de ce que vous allez entrer.

11:26.060 --> 11:32.450
Donc, vous savez, comme si c'était comme si, avec 30% plus 3% des chances, ce serait comme la division de ce Plus par

11:32.590 --> 11:32.900
trois.

11:32.900 --> 11:37.130
Mais dans ce cas, ce n'est pas exactement comme la moyenne.

11:37.130 --> 11:40.410
C'est une moyenne pondérée à cause des probabilités ici.

11:40.430 --> 11:45.980
Donc, ici, vous avez la probabilité que, lorsque vous êtes à ce stade, vous agissiez pour passer à l’état premier temps de la

11:46.040 --> 11:50.630
valeur de s prime et à certains de croiser tous ces nombres premiers que vous pourriez éventuellement entrer

11:50.630 --> 11:51.830
dans qui nous sommes.

11:51.830 --> 11:54.690
Donc exactement ce que nous avions trois ici un deux trois.

11:54.890 --> 11:57.330
Ajoutez-les multipliez-les, ajoutez-les.

11:57.330 --> 11:58.040
Pareil ici.

11:58.040 --> 11:58.820
Un deux trois.

11:58.820 --> 12:01.660
Multipliez-les par les probabilités et additionnez-les.

12:02.090 --> 12:05.180
Et c'est votre nouvelle équation Belman.

12:05.180 --> 12:06.440
Toutes nos félicitations.

12:06.470 --> 12:08.990
C'est ce sur quoi nous allons travailler à l'avenir.

12:09.140 --> 12:15.590
Et c'est le cadre utilisé dans les processus de décision, donc c'est le cadre qui permet de résoudre

12:15.590 --> 12:16.490
ce problème.

12:16.620 --> 12:22.670
Ces agents ont utilisé pour résoudre tout ce problème de recherche stochastique non déterministe dans lequel se produisent

12:22.670 --> 12:25.460
des événements aléatoires qu'ils ne peuvent pas contrôler.

12:25.460 --> 12:26.920
C'est donc beaucoup plus complexe.

12:26.930 --> 12:30.150
Mais comme vous pouvez le constater, nous avons progressé lentement.

12:30.290 --> 12:33.120
Maintenant, nous savons déjà ce que nous savons.

12:33.130 --> 12:35.090
Il y a des soucis à ce sujet.

12:35.090 --> 12:36.160
Nous savons à ce sujet.

12:36.170 --> 12:36.710
Nous savons ce qu'ils sont.

12:36.710 --> 12:42.500
Donc, tout ce que nous avons fait, c'est que nous venons d'introduire cette partie parce qu'il y a des

12:42.920 --> 12:49.000
probabilités impliquées dans l'action ou que les conséquences de votre action sur des causes non déterministes sont basées sur des probabilités.

12:49.220 --> 12:50.600
Et alors on y va.

12:50.600 --> 12:58.280
C'est ainsi que fonctionne un marqueur de processus de décision et l'équation sous-jacente qui le sous-tend.

12:58.330 --> 13:04.630
Encore une fois, c'est quelque chose qui ressemble davantage aux problèmes du monde réel, aux scénarios de

13:04.670 --> 13:08.690
Sinatras ou même de jeux, car tout n'est pas simple.

13:08.690 --> 13:15.880
Il y a un certain hasard parmi toutes les personnes impliquées et ne pas toujours entreprendre une action dans un certain

13:15.870 --> 13:18.810
état ne sera pas toujours le même résultat.

13:18.890 --> 13:23.150
Et c’est donc ce dont nous allons nous occuper à l’avenir et qui va rendre les

13:23.150 --> 13:24.310
choses beaucoup plus intéressantes.

13:24.380 --> 13:29.290
J'espère que cela vous enthousiasme et que vous êtes impatient de voir ce qui va suivre.

13:29.690 --> 13:35.870
Et en attendant, j'ai trouvé un papier vraiment cool pour que vous puissiez jeter un coup d'œil à cette époque.

13:35.870 --> 13:37.460
C'est un papier très appliqué.

13:37.460 --> 13:40.150
Donc, celui-ci est vraiment très intéressant à lire.

13:40.160 --> 13:46.810
C'est ce qu'on appelle une enquête sur les applications de Mark of processus de processus de décision et il a été écrit par

13:46.820 --> 13:47.970
White en 1993.

13:47.990 --> 13:56.000
Il y a le lien et je vais vous montrer des exemples où les processus de décision de Markov sont en fait utilisés pour modéliser

13:56.000 --> 13:59.560
la vie réelle de Sinatras. Je pense que cela m'a enthousiasmé.

13:59.560 --> 14:03.880
J'ai été impressionné par certains exemples d'exploitation de la population, par exemple.

14:03.880 --> 14:09.290
Alors disons que vous avez du poisson et que vous savez quelle est la population de poisson dont vous avez besoin

14:09.290 --> 14:12.910
pour décider du nombre de poissons que nous pouvons pêcher cette année et quoi.

14:13.250 --> 14:14.330
C'est donc votre état actuel.

14:14.330 --> 14:17.220
C'est l'action que vous entreprenez. Combien pouvons-nous filmer cette année?

14:17.230 --> 14:20.420
Alors, quels sont les meilleurs résultats possibles?

14:20.540 --> 14:22.100
Combien de poissons aurons-nous l'année prochaine?

14:22.160 --> 14:25.210
Combien de poissons aurons-nous l'année d'après et l'année suivante, etc.

14:25.250 --> 14:30.230
Et ce n’est pas déterministe, car ce n’est pas comme si vous le preniez à une heure et que 90%

14:30.230 --> 14:34.640
de la population l’année prochaine, vous saurez que revenir à 100% n’est pas exactement un sermon.

14:34.640 --> 14:39.590
Certains facteurs aléatoires sont hors de notre contrôle et nous devons donc comprendre ce qui va se

14:39.760 --> 14:43.640
passer, nous devons modéliser ce qui va se passer dans les cas où

14:43.860 --> 14:46.060
une décision de marché rend l'agriculture.

14:46.070 --> 14:50.250
Il y a un exemple comme quelque chose comme la récolte, combien de récoltes récoltons-nous, combien d'argent

14:50.280 --> 14:51.440
nous ne récoltons pas.

14:51.470 --> 14:58.190
Une autre que j'ai examinée dans le domaine de la finance et des investissements, dans laquelle une compagnie d’assurance doit

14:58.190 --> 15:04.990
décider quelle partie de ses fonds elle investira, quel que soit le jour, l’année ou une période donnée, et certains facteurs

15:05.020 --> 15:06.490
sont sous son contrôle.

15:06.490 --> 15:11.260
Par exemple, vous connaissez les mouvements du marché, il ne sait pas ce qui peut se passer, il doit donc en quelque

15:11.260 --> 15:12.070
sorte le modéliser.

15:12.110 --> 15:14.350
Une marque de processus de décision utilisés pour cela.

15:14.350 --> 15:16.890
Donc, ici, vous pouvez voir beaucoup, beaucoup d'exemples.

15:16.900 --> 15:20.340
Et c’est le nombre d’exemples donnés pour chacun d’entre eux.

15:20.650 --> 15:28.030
Et vous connaissez donc même des exemples sportifs pour les sports et les épidémies et l'inspection des réclamations d'assurance automobile ainsi que

15:28.090 --> 15:31.030
l'entretien et les réparations, c'est également très intéressant.

15:31.030 --> 15:31.900
Regardez ça.

15:31.930 --> 15:40.390
Juste pour vous donner une compréhension de «hé», il ne s’agit pas simplement de trucs hypothétiques du genre

15:40.390 --> 15:41.130
Matrix.

15:41.140 --> 15:45.580
C'est en fait le scénario du monde réel, donc je vais vous donner une meilleure compréhension

15:45.580 --> 15:50.410
et c'est ce dont nous avons parlé dans la vidéo promotionnelle pour les partitions ou la description du cours

15:50.410 --> 15:55.900
que nous allons vous inspirer et votre intuition pour vous donner des idées pour savoir comment utiliser l'IA dans la vie réelle.

15:55.900 --> 15:57.820
Ceci est votre opportunité.

15:57.820 --> 15:59.790
Regardez ce papier pour comprendre.

15:59.900 --> 16:02.890
OK, nous allons donc nous occuper du processus décisionnel.

16:02.890 --> 16:07.210
C’est vraiment bien ce à quoi ils ressemblent dans la vie réelle et cela pourrait éventuellement

16:07.210 --> 16:13.300
vous donner des idées sur la manière dont vous pourriez utiliser le futur pour rendre le monde meilleur, et nous en serions très

16:13.300 --> 16:13.650
heureux.

16:13.690 --> 16:18.560
Nous serions heureux si vous pouviez utiliser ce que vous avez appris dans ce cours pour améliorer le monde.

16:18.730 --> 16:20.050
C'est fantastique avec ça.

16:20.380 --> 16:23.170
J'espère donc que vous avez apprécié le tutoriel d'aujourd'hui.

16:23.170 --> 16:24.540
J'ai hâte de vous voir la prochaine fois.

16:24.610 --> 16:26.420
Et jusque-là, profitez de l'IA.