WEBVTT

00:00.270 --> 00:06.230
Bună ziua și bun venit la această conductă și la Torro acum trebuie să definim cele cinci variabile ale

00:06.240 --> 00:09.560
acestei funcții, care sunt cele trei convoluții și conexiunile temporale.

00:09.810 --> 00:11.100
Deci, să începem cu prima.

00:11.250 --> 00:18.690
Convoluția se aplică convoluțiilor imaginilor de intrare, astfel încât imaginile originale și acum veți vedea cum va deveni

00:18.690 --> 00:22.710
totul atât de simplu pentru a crea această convoluție.

00:22.770 --> 00:29.070
Ei bine, ceea ce trebuie să facem este să creezi un subiect de o anumită clasă și

00:29.070 --> 00:38.800
această clasă să fie luată și apoi și apoi clasele să vină la, pentru că lucrăm cu imagini 2D și acum, după cum puteți vedea, trebuie

00:38.800 --> 00:40.930
să punem mai multe argumente.

00:40.930 --> 00:43.140
Primul este în canale.

00:43.190 --> 00:45.910
Să o punem în canale.

00:45.970 --> 00:49.210
Cel de-al doilea este canalele.

00:49.330 --> 00:57.070
Al treilea este mărimea lui Kerno, iar restul dintre ele sunt delimitarea grupurilor de dilatare și părtinire.

00:57.130 --> 00:59.120
Și avem valori diferite pentru toate acestea.

00:59.260 --> 01:02.290
Deci, nu vom merge decât la ei, vom păstra valorile implicite.

01:02.470 --> 01:08.500
Dar ceea ce este important este aceste trei argumente în canale și canale și mărimea kernel-ului și așa cred eu

01:08.500 --> 01:09.740
cu ce corespund.

01:09.880 --> 01:15.730
Ei bine, pur și simplu, în general, corespund intrărilor de convoluție și toate

01:15.730 --> 01:17.900
canalele corespund rezultatului concluziei.

01:17.920 --> 01:19.940
Deci, ce va fi.

01:20.110 --> 01:24.460
Ei bine, foarte simplu, va fi numărul de canale din imaginile noastre.

01:24.610 --> 01:30.460
Și, de fapt, vom lucra cu imagini alb-negru, deoarece practic nu avem culori pentru a

01:30.460 --> 01:31.360
recunoaște monștrii.

01:31.450 --> 01:35.310
AI este capabil să recunoască monștrii în alb și negru.

01:35.440 --> 01:39.200
Deci nu vedem culorile, dacă le recunoaștem doar după forma lor.

01:39.250 --> 01:44.380
Prin urmare, vom folosi un canal, astfel încât un canal este atunci când aveți imagini alb-negru și

01:44.380 --> 01:46.820
trei canale este atunci când ați sunat imagini.

01:46.930 --> 01:51.320
Și din moment ce lucrăm cu imagini alb-negru în canale, acesta va

01:51.340 --> 01:59.730
fi egal cu cel al canalelor noastre, astfel că canalele noastre vor fi egale cu imaginile pe care doriți să le aveți în convoluția

01:59.730 --> 02:02.970
de acolo, care este rezultatul acestei constituții unu.

02:02.970 --> 02:08.820
Și, practic, acest lucru este egal cu numărul de caracteristici pe care doriți să le introduceți în imaginile originale,

02:09.240 --> 02:15.040
deoarece cine va crea o imagine pe caracteristică pe care dorim să o detectăm, deoarece știți cum funcționează.

02:15.120 --> 02:21.390
Am aplicat un detector de caracteristici pe imaginea de intrare pentru a detecta o caracteristică specifică în imaginea de intrare și, prin

02:21.390 --> 02:26.450
urmare, numărul de imagini de ieșire aici este numărul de caracteristici pe care dorim să le detectăm.

02:26.460 --> 02:30.110
Deci, acum întrebarea este câte caracteristici vrem să detectăm.

02:30.240 --> 02:38.730
Ei bine, o practică obișnuită este să începem cu 32 de detectori de caracteristici și astfel să ne conducă la 32 de procente

02:38.820 --> 02:46.170
de imagini în acest prim strat convoluțional, astfel încât intrarea să fie o imagine alb-negru o imagine reală, iar ieșirea

02:46.170 --> 02:53.010
în prima convoluție este de 32 de imagini prelucrate și prin procesare vreau să spun, desigur, că concluzia

02:53.380 --> 02:59.750
a fost aplicată imaginii de intrare pentru a obține 32 de imagini noi cu caracteristici detectate.

03:00.240 --> 03:06.990
Apoi trebuie să specificăm o dimensiune a kernelului care nu este altceva decât dimensiunile pătratului care

03:07.080 --> 03:09.450
va trece prin imaginea originală.

03:09.600 --> 03:15.350
Și în practica obișnuită folosim fie să cumpărăm două sau trei lățimi trei sau cinci cinci.

03:15.660 --> 03:22.170
Și pentru prima o să folosim un detector de cinci până la cinci caracteristici care este un detector de caracteristici care

03:22.170 --> 03:24.580
va avea cinci până la cinci motoare.

03:24.810 --> 03:29.290
Și apoi vom reduce dimensiunea acestui kernel pentru următoarele straturi convoluționale.

03:29.340 --> 03:32.320
Și vorbind despre asta este exact ceea ce vom face acum.

03:32.390 --> 03:40.860
Vom copia acest lucru pentru a defini cea de-a doua convoluție și, prin urmare, am bazat că aici și acum este foarte amuzant și

03:40.890 --> 03:43.370
foarte ușor este ca un domino.

03:43.500 --> 03:49.260
Canalul de intrare al celui de-al doilea strat convoluțional este canalul de ieșire al primei convoluții

03:49.260 --> 03:49.810
acolo.

03:49.950 --> 03:55.300
Deci, acest număr de ieșire 32 Aici este același număr de intrări 32 de aici.

03:55.420 --> 04:01.290
Și asta pentru că avem 32 de imagini în stratul convoluțional de intrare al celei de-a doua convoluții.

04:01.440 --> 04:09.830
Și astfel, a doua convoluție este aplicată la acest al doilea strat convoluțional pentru a returna un al treilea strat

04:09.830 --> 04:10.340
convoluțional.

04:10.530 --> 04:13.280
Și acum întrebarea este cât de multe imagini noi vrem.

04:13.410 --> 04:19.820
Același lucru care creează 32 de imagini noi 32 este de fapt un număr foarte comun în rețelele neuronale convoluționale dacă vă

04:19.830 --> 04:23.710
uitați la arhitecturile pe care le veți găsi 32 în multe dintre ele.

04:24.030 --> 04:29.910
Și apoi pentru dimensiunea kernelului Ei bine, trebuie să reducem dimensiunea kernelului care este dimensiunile detectorului nostru

04:29.910 --> 04:30.610
de caracteristici.

04:30.780 --> 04:37.680
Și acum vom merge de la cinci la patru sau chiar trei și apoi vom merge și mai mici.

04:37.920 --> 04:40.790
Așa că a doua noastră convoluție este gata.

04:40.830 --> 04:43.830
Este necesar ca intrările 32 să proceseze imagini.

04:43.890 --> 04:51.130
Fiecare dintr-o primă caracteristică a imaginii originale de intrare și creează 32 de imagini noi.

04:51.270 --> 04:54.990
Datorită dimensiunilor reduse ale detectorului caracteristic.

04:55.120 --> 04:57.250
Și acum, să o împingem chiar mai mult.

04:57.300 --> 05:05.450
Deci, am copiat acest lucru și am lipit-o aici pentru a crea o a treia convoluție pentru a detecta unele caracteristici.

05:05.470 --> 05:08.010
Și așa că acum sunt aceleași canale de intrare.

05:08.010 --> 05:13.800
Iată numărul de imagini de intrare din partea stângă a conexiunii deconvoluție și numărul de imagini precese

05:13.800 --> 05:17.740
care au mers în partea dreaptă a conexiunilor de convoluție anterioare.

05:17.740 --> 05:18.710
Asta e 32.

05:18.750 --> 05:20.030
Prin urmare, ne pare rău să auzim.

05:20.030 --> 05:20.990
Este perfect.

05:21.220 --> 05:25.220
Și acum întrebarea este din nou câte imagini noi vrem să detectăm.

05:25.310 --> 05:31.130
Vom lua acum 64 de imagini și, prin urmare, 64 de ieșiri.

05:31.260 --> 05:36.800
Și, desigur, acum avem o mărime a nucleului mai mic și vom lua două.

05:36.800 --> 05:42.660
Și așa este o arhitectură foarte clasică a unei convoluții acolo și este foarte eficient să ai un

05:42.660 --> 05:45.840
nivel ridicat de detectare a caracteristicilor în interiorul imaginilor.

05:46.200 --> 05:53.010
Bine, și acum, că avem cele trei convoluții ale noastre, sunt cele trei conexiuni ale convoluției noastre

05:53.010 --> 05:53.510
aici.

05:53.640 --> 05:59.970
Ei bine, acum e timpul sa ne facem conexiunile dentare pe care le reamintesc ca vom lua acest

05:59.970 --> 06:07.710
vector imens pe care il obtinem dupa ce am aplecat toate imaginile de 64 de ori 32 ori 32 din toate aceste convolutii,

06:08.160 --> 06:13.920
asa ca am aplatizat toti pixelii acestor imagini si putem un vector imens care va deveni intrarea

06:14.190 --> 06:16.590
unei noi rețele neuronale complet conectate.

06:16.860 --> 06:22.230
Și atunci trebuie să facem aceste conexiuni între primul vector uriaș și un strat ascuns

06:22.470 --> 06:27.710
și apoi o a doua conexiune completă între stratul ascuns și ieșirea din neuroni de

06:27.730 --> 06:28.270
ieșire.

06:28.320 --> 06:31.940
Fiecare dintre ele corespunde unei valori cub a acțiunilor posibile.

06:31.980 --> 06:33.960
Deci, hai să facem aceste două conexiuni.

06:33.960 --> 06:35.220
Știi cum să faci asta.

06:35.220 --> 06:37.550
Exact asta am făcut pentru autoturismul.

06:37.560 --> 06:38.800
Deci, să facem asta din nou.

06:39.000 --> 06:46.890
Ei bine, mai întâi luăm Maggio, apoi luăm clasa Lynnie pentru că din nou conexiunea pe care o creează este

06:46.920 --> 06:49.060
un obiect al clasei conducătoare.

06:49.260 --> 06:50.550
Și apoi în paranteză.

06:50.670 --> 06:58.620
Ei bine, este același pentru a pune funcțiile de intrare care este numărul acestora, apoi caracteristicile de ieșire.

06:58.850 --> 07:03.110
Și astfel, caracteristicile de intrare pentru prima conexiune completă ce va fi.

07:03.340 --> 07:10.300
Ei bine, va fi egal cu numărul de pixeli care există în această schimbare de vector imens după aplatizarea

07:10.480 --> 07:13.830
tuturor imaginilor de proces după cele trei convoluții.

07:13.830 --> 07:15.110
Și ce înseamnă acest număr.

07:15.220 --> 07:17.350
Ei bine, de fapt, există un truc aici.

07:17.380 --> 07:19.620
Acest număr este de fapt greu de obținut.

07:19.660 --> 07:22.770
De fapt, trebuie să facem o funcție pentru a calcula acest număr.

07:22.960 --> 07:25.570
Nu avem o variabilă care să ne primească acest număr.

07:25.570 --> 07:29.040
Trebuie să o calculam și, prin urmare, ce vom face acum.

07:29.150 --> 07:34.780
Și acum este foarte important să înțelegeți mentalitatea de programare pe care trebuie să o avem și să încercăm să vă

07:35.200 --> 07:40.930
aducem la dispoziție mentalitatea pe care trebuie să o gândiți acum să o faceți pentru a depăși acest obstacol pentru că prima

07:41.110 --> 07:45.690
dată când ați putea spune că nu am au acest număr de neuroni în vectorul Flaten.

07:45.730 --> 07:46.650
Ce ar trebuii să fac.

07:46.660 --> 07:47.600
Sunt blocat aici.

07:47.800 --> 07:55.720
Ei bine, nu pentru că ceea ce puteți face acum este pur și simplu introduceți orice nume aici, care va reprezenta numărul de neuroni

07:55.720 --> 08:01.690
atât de neobișnuit încât numărul neuronilor numărul de neuroni și apoi vom face pur și simplu o funcție

08:01.690 --> 08:05.130
care va reveni și acest număr de neuroni variabile.

08:05.180 --> 08:07.100
Acest număr de pixeli pe care îl căutăm.

08:07.330 --> 08:12.760
Deci, putem face în totalitate faptul că putem pune în totalitate această foarte vocal, desigur, va primi un

08:12.760 --> 08:17.090
avertisment pentru că nu există încă, dar îl vom crea ulterior cu o funcție.

08:17.350 --> 08:21.140
Și suntem în totalitate permiși să facem asta chiar dacă funcția vine ulterior.

08:21.170 --> 08:25.970
Aceasta este o gândire tipică de programare pe care trebuie să o aveți atunci când obțineți un astfel de obstacol.

08:26.020 --> 08:29.710
Ei bine, puteți face o funcție pentru a obține ceea ce vă lipsesc.

08:29.740 --> 08:32.640
Bine și apoi trăsăturile noastre și viitorul nostru.

08:32.650 --> 08:37.830
Acesta este numărul de neuroni dintr-un strat ascuns și că de data asta depinde de dvs.

08:37.870 --> 08:41.230
Asta depinde de arhitectura noii rețele pe care doriți să o creați.

08:41.230 --> 08:44.230
Și un număr bun nu ar fi un număr mic.

08:44.230 --> 08:46.960
De exemplu, 40 de neuroni ar putea fi bine.

08:46.960 --> 08:48.660
Putem încerca să creștem asta.

08:48.790 --> 08:51.280
Dacă antrenamentul nu este prea lent, puteți încerca să măriți.

08:51.340 --> 08:56.750
Poate că asta va îmbunătăți previziunile, dar să începem cu 40 poate că vom crește apoi după aceea.

08:57.130 --> 09:04.690
Bine, asta este pentru prima conexiune completă, apoi vom copia această pastă aici pentru a doua conexiune completă,

09:04.710 --> 09:09.300
care este legătura dintre stratul ascuns și stratul de ieșire.

09:09.370 --> 09:15.720
Și astfel, trăsăturile de aici devin trăsăturile exterioare ale stratului anterior, și anume 40.

09:15.790 --> 09:18.020
Deci aici putem pune 40.

09:18.190 --> 09:20.500
Acesta este, desigur, numărul de neuroni dintr-un strat.

09:20.860 --> 09:27.280
Și viitorul nostru va fi egal cu numărul de neuroni de ieșire nu ar trebui să existe rețea neurală.

09:27.340 --> 09:33.360
Și deoarece fiecare neuron de ieșire corespunde unei noi valori și unui Cuvee și răspuns la

09:33.370 --> 09:38.440
o acțiune în timp ce numărul de neuroni de ieșire aici este,

09:38.740 --> 09:47.320
desigur, numărul de acțiuni și avem o variabilă pentru aceasta, care este acțiuni de număr și, prin urmare, acolo mergem să-i felicităm.

09:47.390 --> 09:53.850
Am gasit arhitectura retelei neuronale, reteaua noastra neuronala este compusa din trei straturi convolutie

09:53.850 --> 09:55.960
si un strat ascuns.

09:56.130 --> 10:03.020
Toate acestea într-un CNN mare și acest CNN va detecta caracteristici în joc, astfel încât AI va ști unde trebuie să

10:03.020 --> 10:06.550
facă unde trebuie să meargă și unde trebuie să tragă.

10:06.900 --> 10:08.240
Atunci mergem pentru acest pas.

10:08.340 --> 10:10.720
Acesta este un prim pas foarte important făcut.

10:10.720 --> 10:16.020
Acum vom trece la pasul următor, care este, desigur, pentru a obține acest număr de neuroni care

10:16.020 --> 10:17.010
încă lipsește.

10:17.010 --> 10:21.930
De asta avem avertismentul aici și neuronii numărului de telefon, dar nu avem grijă.

10:21.960 --> 10:26.970
Acum vom face o funcție care va returna numărul de neuroni în acest vector uriaș și vom pune

10:26.970 --> 10:30.210
acel număr într-o variabilă care va numi un număr de neuroni.

10:30.270 --> 10:32.070
Deci, să facem acest lucru în următorul tutorial.

10:32.070 --> 10:33.130
Acesta este pasul nostru următor.

10:33.180 --> 10:34.790
Și până atunci să vă bucurați de AI.