WEBVTT

00:00.580 --> 00:02.850
Bună ziua și bun venit la magazin.

00:03.040 --> 00:07.040
În regulă, acum vom implementa inteligența artificială de la zero.

00:07.040 --> 00:08.870
O să-i tăiem linia.

00:09.070 --> 00:12.550
Și în această primă secțiune bună vom importa bibliotecile.

00:12.550 --> 00:17.880
Dar, înainte de a începe cu această primă secțiune de cod, aș vrea să explic

00:17.890 --> 00:20.140
conexiunea dintre AI și harta noastră.

00:20.560 --> 00:24.000
De aceea punem în aplicare acest lucru pentru ei.

00:24.040 --> 00:27.880
Care este scopul AI nostru și unde îl vom folosi.

00:27.880 --> 00:30.160
Deci, de fapt este foarte simplu.

00:30.170 --> 00:34.900
Noi facem doar AI-ul nostru să aleagă acțiunea potrivită și de fiecare dată.

00:35.140 --> 00:42.390
În regulă, importăm clasa din fișierul nostru, astfel încât vom face acest D2 în clasă în acest fișier.

00:42.580 --> 00:51.220
Dar apoi vom importa doar pentru a selecta acțiunea potrivită pentru a juca în fiecare moment și vom selecta această acțiune exact

00:51.490 --> 00:53.070
la această linie.

00:53.080 --> 01:00.580
Acțiunea este egală cu actualizarea creierului mai puțin recompensa semnalul mai puțin semnalul va fi intrarea rețelei neuronale.

01:00.760 --> 01:05.950
Știți că este compus din cele trei semnale ale senzorilor plus orientarea și orientarea minus.

01:06.130 --> 01:09.890
Deci, aceasta este intrarea, dar apoi ieșirea este acțiunea de jucat.

01:10.030 --> 01:14.970
Și asta este doar ceea ce vom lua de la AI pe care am simțit-o pe care o vom face.

01:15.250 --> 01:16.310
Așa că ține minte.

01:16.390 --> 01:17.590
E foarte simplu.

01:17.590 --> 01:25.900
Mai întâi importăm decriminalizarea de la AI AI apoi creăm creierul obiect din clasa umană care ia ca

01:25.990 --> 01:32.110
intrări vectorii codificați pentru stările de cinci dimensiuni cele trei semnale plus orientarea

01:32.290 --> 01:33.970
plus minus orientare.

01:34.030 --> 01:36.910
Reacțiile merg la stânga mergeți drept sau mergeți la dreapta.

01:37.030 --> 01:38.470
Și apoi acest parametru gamma.

01:38.560 --> 01:42.410
Acestea sunt singurii parametri ai clasei pe care le vom face.

01:42.490 --> 01:50.140
Apoi, odată ce am creat acel obiect, vom selecta în clasa de joc acțiunea de jucat în fiecare moment.

01:50.140 --> 01:51.760
Și asta depinde de ultimul cuvânt.

01:51.940 --> 01:58.450
Iar Lusignanul, care este intrarea și care este singurul scop care face acest lucru, spune că pentru a avea o

01:58.450 --> 02:03.620
adevărată inteligență artificială care să joace acțiunile potrivite, atunci de fiecare dată când se mișcă drept

02:04.030 --> 02:08.480
în loc să aibă acțiuni aleatorii ca noi observate în tutorialul precedent.

02:08.500 --> 02:12.620
Bine, deci hai să facem asta să punem în aplicare inteligența noastră artificială.

02:12.760 --> 02:18.430
Și cum am spus că vom începe prin a importa toate bibliotecile pe care le vom folosi pentru implementare.

02:18.460 --> 02:21.160
Astfel vom avea toate instrumentele de care avem nevoie.

02:21.160 --> 02:22.790
Deci, haideți să începem cu primul.

02:22.810 --> 02:28.870
Prima este inevitabila biblioteca non-pay biblioteca non-Thai.

02:28.870 --> 02:35.270
Întotdeauna recomand să-l importați este biblioteca care ne permite să jucăm și să lucrăm cu irakienii.

02:35.620 --> 02:40.180
Și aici este doar o scurtătură mai multă comoditate atunci când dorim să folosim numărul.

02:40.590 --> 02:44.050
Bine, atunci biblioteca a doua este aleatorie.

02:44.050 --> 02:50.530
Deci, acest lucru este doar pentru că vom lua câteva mostre aleatoare din loturi diferite atunci când

02:50.530 --> 02:51.770
implementăm reluarea experienței.

02:51.940 --> 02:54.650
Deci, trebuie să importăm și această bibliotecă aleatoare.

02:54.880 --> 03:02.470
Apoi vom importa os care va fi folositoare atunci când dorim să încărcăm modelul deoarece știți odată ce modelul este gata

03:02.470 --> 03:08.710
va implementa un cod pentru a salva modelul și apoi un alt cod pentru a încărca modelul.

03:08.700 --> 03:14.140
Atunci când vrem să știți că salvați creierul și încărcați creierul ori de câte ori doriți să

03:14.140 --> 03:18.850
închideți computerul și folosim creierul care a fost instruit înainte pentru un nou experiment.

03:19.060 --> 03:20.410
Deci, asta e important.

03:20.740 --> 03:27.230
Apoi vom importa biblioteca tortei esențială.

03:27.250 --> 03:32.170
Asta pentru ca ne vom implementa reteaua neurala cu torta pe care o recomand mult mai

03:32.170 --> 03:36.670
mult decat celelalte pentru inteligenta artificiala pentru ca se poate ocupa de grafice dinamice.

03:36.670 --> 03:46.150
Deci, acolo mergem cu torce apoi de la torce vom importa torche start și sfârșitul modulul de sfârșit este cel mai esențial care

03:46.150 --> 03:51.730
este modulul care conține toate instrumentele de implementare a unor rețele neuronale.

03:51.820 --> 03:57.370
Și, bineînțeles, va exista o rețea neuronală profundă care va lua ca intrări cele trei

03:57.370 --> 04:03.910
semnale ale celor trei senzori plus orientare și orientare minus și va reveni ca ieșire acțiunea de jucat.

04:04.090 --> 04:09.220
Ei bine, pentru a reveni la valorile q ale diferitelor acțiuni și folosind un soft Max.

04:09.220 --> 04:15.970
Vom reveni la acțiune pentru a juca doar una dintre cele mai relevante pentru

04:16.000 --> 04:26.500
a realiza cardurile pentru a merge la tortură și în cea mai esențială, apoi vom da o scurtă tăiere la pachetul funcțional.

04:26.550 --> 04:29.960
De aici mergem cu pachetul funcțional de la capăt și Maggio.

04:29.970 --> 04:36.310
Deci, acest pachet funcțional conține diferitele funcții pe care le folosim atunci când implementăm o rețea neurală.

04:36.340 --> 04:42.240
Deci, de obicei, ultima funcție va fi folosirea pierderii Google, deoarece aceasta îmbunătățește convergența,

04:42.240 --> 04:46.950
iar pierderea este inclusă în acest submodul funcțional din modulul final.

04:47.190 --> 04:54.330
Și din moment ce toate acestea sunt destul de lungi, o să-i dăm o scurtătură și o vom numi pur și simplu.

04:54.460 --> 04:57.260
Apoi, doar 3 module pentru a importa stânga.

04:57.340 --> 05:05.710
Așadar, următorul este unul central, care este de până la el și îl luăm din biblioteca de

05:06.220 --> 05:12.870
tortură și apoi mergem acolo și să-i spunem în loc să torturăm atomul.

05:13.030 --> 05:15.250
Este, desigur, pentru optimizator.

05:15.340 --> 05:22.030
Vom importa unii optimizatori pentru a realiza gradul C în sensul că vom avea nevoie cu siguranță de ea

05:22.030 --> 05:25.100
și apoi vom avea nevoie să importăm autografe.

05:25.210 --> 05:28.670
Și asta numai pentru a lua clasa variabilă din regretul nostru.

05:29.170 --> 05:31.630
Deci, scopul este puțin tehnic.

05:31.630 --> 05:39.010
Practic, trebuie să importim clasa variabilă pentru a face o conversie din tensori care sunt ca mai multe matrice

05:39.010 --> 05:43.160
avansate pentru a evita tot ceea ce conține un gradient.

05:43.210 --> 05:46.640
Asa ca nu vrem sa avem doar un tensor de la sine.

05:46.660 --> 05:51.940
Vrem să punem tensorul într-o variabilă care va conține și un gradient și pentru a

05:51.940 --> 05:58.350
face acest lucru trebuie să folosim clasa variabilă pentru a converti acest tensor într-o variabilă care conține tensorul și gradientul.

05:58.520 --> 06:02.550
Deci este puțin tehnic, dar asta trebuie să facem atunci când lucrăm cu torța PI.

06:02.680 --> 06:04.830
Și facem asta datorită clasei variabile.

06:04.840 --> 06:13.220
Dar inainte de a obtine clasa variabila trebuie sa importim torche grad si

06:13.220 --> 06:26.430
sa facem o scurta taietura precum si o intalnire si apoi de la torta care se ingrasam importam Roybal Acolo mergem.

06:26.560 --> 06:31.390
Și acum avem toate bibliotecile pe care le vom folosi pentru a implementa AI.

06:31.600 --> 06:34.050
Așa că nu ne vom deranja să importăm altă bibliotecă.

06:34.060 --> 06:35.670
Avem toate instrumentele de care avem nevoie.

06:35.830 --> 06:40.000
Și acum suntem gata să creăm arhitectura rețelei neuronale.

06:40.030 --> 06:42.680
Deci, exact așa vom face în următorul tutorial.

06:42.760 --> 06:44.370
Și până atunci să vă bucurați de AI.