WEBVTT

00:00.840 --> 00:05.380
Bună ziua și bun venit înapoi la curs și învățare profundă acum că am văzut rețelele dvs. în

00:05.440 --> 00:08.280
acțiune este timpul pentru noi pentru a afla cum au învățat.

00:08.470 --> 00:10.480
Așa că hai să intrăm în ea.

00:10.510 --> 00:16.100
Acestea sunt două abordări fundamental diferite pentru a obține un program pentru a face ceea ce doriți să facă.

00:16.240 --> 00:25.120
Una este codarea greu codificată, unde spuneți regulile specifice programului și rezultatele pe care le doriți.

00:25.120 --> 00:30.940
Și tocmai îl îndrumați pe tot parcursul și vă explicați toate opțiunile posibile cu care

00:30.940 --> 00:33.130
trebuie să se ocupe programul.

00:33.310 --> 00:41.320
Pe de altă parte, aveți rețele neuronale în care creați o facilitate pentru ca programul să poată înțelege ce

00:41.800 --> 00:43.530
trebuie să facă singur.

00:43.530 --> 00:50.080
Deci, în principiu, creați această rețea neurală, unde ați furnizat intrări, îi spuneți ceea ce doriți ca ieșiri și apoi l-ați

00:50.110 --> 00:53.050
lăsat să se gândească totul pe cont propriu.

00:53.350 --> 00:59.890
Două abordări fundamental diferite și care este ceva de reținut în timp ce trecem prin

00:59.890 --> 01:00.850
aceste tutoriale.

01:00.850 --> 01:06.180
Scopul nostru este de a crea această rețea, care apoi învață pe cont propriu.

01:06.220 --> 01:14.570
Vom evita încercarea de a pune în aplicare regulile și un bun exemplu pe care vă pot da acum este că acest lucru va veni mai

01:14.680 --> 01:18.680
departe în curs, dar este doar un exemplu foarte vizual, de exemplu.

01:18.700 --> 01:25.690
Cum distingeți între o blană de câine și pisică pe partea stângă a procesului descris în stânga pe care ați programa

01:25.690 --> 01:33.250
lucrurile cum ar fi urechile pisicilor trebuie să fie asemănătoare cu acest aspect pentru ca musturile să aibă grijă de acest tip de

01:33.250 --> 01:39.530
nas căutați acest tip de formă a feței căutați pentru aceste culori pe care le-ați descrie toate aceste lucruri

01:39.530 --> 01:45.310
și veți avea condiții ca și cum ar fi dacă urechile sunt mai proeminente decât pisica dacă

01:45.310 --> 01:49.600
urechile sunt înclinate în jos și, eventual, câine și așa mai departe.

01:49.600 --> 01:55.090
Pe de altă parte, pentru o rețea neuronală, codificați rețelele neuronale pe care le codificați arhitectura și

01:55.090 --> 02:01.030
apoi direcționați rețeaua neuronală într-un dosar cu toate aceste pisici și câini cu imagini de pisici și câini care

02:01.030 --> 02:06.580
sunt deja clasificate și le spuneți OK Te-am prins Am niște imagini de pisici și câini care merg

02:06.880 --> 02:08.860
și află ce este o pisică.

02:08.860 --> 02:10.560
Du-te și învățați ce este un câine.

02:10.600 --> 02:16.000
Și rețeaua neuronală va înțelege singură tot ce are nevoie să înțeleagă și apoi să-și coboare din nou, odată

02:16.000 --> 02:20.950
pregătită, când îi dă o nouă imagine a unei pisici sau unui câine, va putea să înțeleagă

02:20.950 --> 02:21.600
ce era.

02:21.610 --> 02:25.600
Deci, acestea sunt cele două abordări fundamentale diferite.

02:25.690 --> 02:31.090
Și astăzi vom începe încet să vedem cum funcționează această a doua abordare.

02:31.090 --> 02:31.530
In regula.

02:31.570 --> 02:33.340
Deci, să ajungem direct la asta.

02:33.400 --> 02:39.880
Aici avem o rețea neurală de bază, cu un strat care se numește rețeaua neuronală de alimentare cu un

02:39.880 --> 02:42.760
singur strat și se numește și o percepție.

02:42.760 --> 02:47.380
Acum, înainte de a începe un singur lucru pe care trebuie să-l ajustăm, este valoarea de ieșire.

02:47.380 --> 02:49.320
Acum puteți vedea că este doar un Y.

02:49.330 --> 02:51.160
Trebuie să punem o pălărie înăuntru.

02:51.190 --> 02:56.500
Iar motivul pentru care este de obicei y este valoarea reală și asta vom folosi.

02:56.500 --> 03:03.700
Deci, de ce va fi valoarea reală pe care o vedem valoarea de ieșire a realității este valoarea estimată de

03:03.700 --> 03:05.890
algoritm de către rețeaua neurală.

03:05.890 --> 03:09.220
De ce este valoarea de ieșire.

03:09.220 --> 03:11.500
Practic, aceasta este valoarea nominală pentru valoarea de ieșire.

03:11.740 --> 03:20.020
Și percepția care a fost inventată pentru prima dată în 1957 de Frank Rosenblat și întreaga sa idee a

03:20.170 --> 03:25.010
fost să creeze ceva ce poate învăța și adapta de fapt.

03:25.240 --> 03:28.010
Și la asta ne vom uita acum.

03:28.030 --> 03:30.230
Deci ne-am tras preceptul.

03:30.250 --> 03:32.070
Să vedem cum învață percepția noastră.

03:32.080 --> 03:39.130
Deci, să spunem că avem câteva valori de intrare care au fost furnizate percepției și, respectiv, în propria

03:39.130 --> 03:40.210
noastră rețea.

03:40.330 --> 03:44.190
Apoi se aplică funcția de activare.

03:44.200 --> 03:49.210
Avem o ieșire și acum vom trasa rezultatul pe o diagramă.

03:49.210 --> 03:51.830
Deci acolo este capul nostru de ieșire y.

03:51.830 --> 03:57.520
Acum, ceea ce trebuie să facem este să putem învăța că trebuie să comparăm valoarea de ieșire cu valoarea

03:57.520 --> 04:01.310
reală pe care ne dorim ca rețeaua neurală să aibă dreptate.

04:01.600 --> 04:04.520
Și aceasta este valoarea y.

04:04.810 --> 04:08.230
Și dacă o punem aici, veți vedea că există o mică diferență.

04:08.330 --> 04:13.510
Acum vom calcula o funcție numită funcția cost este calculată ca o jumătate din diferența

04:13.510 --> 04:17.200
diferenței pătrate dintre valoarea reală și valoarea de ieșire.

04:17.200 --> 04:20.500
Acum, există mai multe moduri în care puteți veni pentru funcția de clasă.

04:20.500 --> 04:23.300
Există multe funcții de cost diferite pe care le puteți utiliza.

04:23.320 --> 04:30.280
Aceasta este probabil cea mai frecvent utilizată funcție de apel și de ce este în mod specific această funcție pe care o folosim

04:30.280 --> 04:34.900
va descoperi mai jos când vorbim despre un decalaj decent, dar deocamdată vom fi de

04:34.900 --> 04:39.830
acord că aceasta este funcția de cost și în principiu ceea ce ne spune funcția de

04:40.420 --> 04:44.240
cost este care este eroarea pe care o aveți în predicția dvs.

04:44.290 --> 04:50.770
Scopul nostru este de a minimiza funcția de cost, deoarece funcția de cost este mai mică cu cât este mai

04:50.790 --> 04:51.780
aproape de y.

04:52.150 --> 04:54.430
OK, pentru că numai noi suntem de acord că să procedăm.

04:54.430 --> 05:00.760
De fapt, de aici, ceea ce se întâmplă este că există o funcție de cost și de

05:00.760 --> 05:08.950
aici se va întâmpla acum ce vom face acum după ce am comparat acum că vom alimenta această informație înapoi în rețeaua neuronală.

05:08.980 --> 05:14.170
Deci, acolo ne ducem acolo informațiile care se întorc în rețeaua neuronală și merge la greutățile

05:14.200 --> 05:15.630
și greutățile se actualizează.

05:15.700 --> 05:20.880
Practic, singurul lucru pe care avem controlul în această rețea neuronală foarte simplă sunt greutățile

05:20.900 --> 05:23.490
w 1 W2 până la W ..

05:23.980 --> 05:29.370
Scopul nostru este de a minimiza funcția de cost, astfel încât tot ce putem face este să actualizăm greutățile.

05:29.500 --> 05:33.690
Deci, actualizăm greutățile și le modificăm puțin.

05:33.940 --> 05:39.600
Și cum să aflăm exact ceea ce facem, dar deocamdată suntem de acord că avem greutățile și apoi

05:39.600 --> 05:40.320
continuăm așa.

05:40.320 --> 05:48.870
Dar aici am pus această captură de ecran a datelor doar pentru a face un singur punct foarte clar că chiar acum în tot

05:48.930 --> 05:53.990
acest experiment tot ceea ce facem acum avem de-a face cu un singur rol.

05:54.000 --> 06:00.330
Deci, avem de-a face cu un set de date dintr-un rând unde avem, de exemplu, de-a

06:00.330 --> 06:05.720
face cu cât timp o studiați ca variabila pe care o presupunem.

06:06.180 --> 06:08.230
Care este rezultatul pe care îl veți obține la un examen.

06:08.430 --> 06:13.200
Și variabilele dependente independente pe care le avem sunt câte ore ați studiat pentru cât de multe ore

06:13.200 --> 06:15.430
ați dormit și ce ați obținut la test.

06:15.460 --> 06:19.880
În mijlocul semestrului Deci, în mijlocul semestrului este un test ce procent a ajuns acolo.

06:19.880 --> 06:26.100
Deci, bazându-ne pe acele variabile, încercăm să previzualizăm ce scor veți obține pentru examen și examinați 93%

06:26.100 --> 06:28.010
care este valoarea reală.

06:28.010 --> 06:29.020
Deci de aceea.

06:29.560 --> 06:30.460
Asa de.

06:30.660 --> 06:36.720
Deci, noi hrănim aceste trei valori într-o rețea neurală pentru a doua oară acum și apoi

06:36.720 --> 06:38.980
vom compara rezultatul cu albul.

06:39.150 --> 06:40.690
Să vedem cum funcționează acest lucru.

06:40.800 --> 06:43.710
Introducem aceste valori în rețeaua neuronală.

06:43.830 --> 06:50.160
Totul este ajustat și greutățile o fac așa cum puteți vedea că din nou vom alimenta valorile din nou. Punctul aici este că

06:50.190 --> 06:55.480
ne hrănim în aceeași minge, așa că avem doar o singură rolă pe care încercăm să o facem

06:55.480 --> 06:56.370
pe un rând.

06:56.370 --> 06:59.580
Acest lucru se datorează faptului că acesta este doar un exemplu foarte simplu.

06:59.640 --> 07:01.610
Atunci vom vedea ce se întâmplă atunci când există morale.

07:01.800 --> 07:06.180
Deci, din nou, hrănim aceste rânduri în funcția noastră încrucișată.

07:06.180 --> 07:10.520
După cum puteți vedea totul se întâmplă de-a lungul acestor linii din nou.

07:10.530 --> 07:15.030
Așa cum spui de fiecare dată când pălăria noastră albă se schimbă, pentru că am modificat greutățile.

07:15.030 --> 07:20.550
Tot ce aveam a fost schimbarea funcției noastre de îmbrăcăminte schimbând din nou acest aspect, astfel încât să le hrănim pe acei.

07:20.550 --> 07:22.840
De ce a schimbat funcția de haine se schimbă.

07:22.920 --> 07:27.020
Obținem informații de feedback în greutăți, astfel încât greutățile să ajungă din nou ajustate.

07:27.030 --> 07:31.850
Ne hrănim în aceleași valori de fiecare dată când totul este ajustat se întoarce la greutăți.

07:31.860 --> 07:33.920
Și încă o dată hrănește.

07:34.020 --> 07:34.990
O.K.

07:35.730 --> 07:40.720
Și încă o dată, așa că am adaptat modul în care ne simțim în informație.

07:40.830 --> 07:41.370
Și acolo mergem.

07:41.370 --> 07:45.990
Deci, de data aceasta, pălăria albă este egală cu y funcțională încrucișată.

07:46.020 --> 07:48.410
De obicei, nu veți obține funcția de cost egală cu zero.

07:48.420 --> 07:50.720
Dar acesta este un exemplu foarte simplu.

07:50.820 --> 07:57.480
Deci, sperăm că tot ceea ce avea sens de fiecare dată când ne alimenta exact același rând, pentru că doar în

07:57.480 --> 08:01.370
acest caz ne confruntăm cu acel rând în rețeaua noastră neuronală.

08:01.400 --> 08:06.990
Ei bine, atunci greutățile primesc valorile primiți o aprovizionare validă a căilor prin care se aplică funcția de activare

08:06.990 --> 08:12.320
a funcției pe care o obținem în comparație cu Y, atunci vedem cum se schimbă funcția de cost.

08:12.430 --> 08:16.500
Feedback-ul și feed-ul pe care informațiile Bakker îl au în propria rețea și apoi ajustați

08:16.500 --> 08:17.470
din nou greutățile.

08:17.850 --> 08:21.410
Apoi repetăm ​​același proces din nou cu același rând exact.

08:21.570 --> 08:23.320
Încercăm să minimalizăm acest cost.

08:23.520 --> 08:26.860
Deci până acum am avut de-a face cu un singur rând.

08:27.030 --> 08:29.470
Să vedem ce se întâmplă atunci când aveți mai multe roluri.

08:29.490 --> 08:31.320
Deci, iată setul complet de date.

08:31.350 --> 08:38.610
Avem opt rânduri de câte ore ați dormit sau poate că aceștia sunt diferiți studenți în timpul zilei care au luat

08:38.610 --> 08:44.070
același examen cât de multe alte ore au studiat câte ore au dormit înainte ca examenul

08:44.070 --> 08:47.300
să ajungă la test și rezultatul final al testului.

08:47.490 --> 08:52.720
Și după cum puteți vedea aici în stânga, am opt astfel de percepții.

08:53.100 --> 08:55.950
Ele sunt aceeași percepție, deci este și importantă.

08:56.010 --> 09:02.600
Tocmai am înmulțit-o sau mi-a plăcut duplicat de opt ori doar ca să putem.

09:03.330 --> 09:04.310
Concepția este asta.

09:04.320 --> 09:10.380
Dar lucrul important aici este aceeasi retea neurala pe care o vom hrani intr-o singura retea Samual.

09:10.380 --> 09:11.650
Hai să mergem să începem.

09:11.650 --> 09:20.550
Deci, un aeroport, după cum veți auzi, ar fi menționat faptul că un aeropar este atunci când trecem printr-un întreg set de

09:20.610 --> 09:27.410
date și ne instruim rețeaua neurală în toate aceste roluri, astfel încât aceste liste să fie.

09:27.420 --> 09:34.410
Deci, este primul nostru rând și există De ce a avut pentru primul rând un al doilea rol, de aceea am avut pentru a

09:34.410 --> 09:35.260
doua rundă.

09:35.280 --> 09:39.590
Deci, din nou, este alimentat de fiecare dată în aceeași rețea neurală.

09:39.600 --> 09:45.070
Tocmai le-am copiat de mai multe ori, astfel încât să vedem cum se întâmplă acest lucru.

09:45.090 --> 09:52.320
Apoi din nou, din moment ce se întâmplă din nou, acesta este rândul al treilea al patrulea rând este capul nostru alb pentru al patrulea rând și așa

09:52.320 --> 09:53.010
mai departe.

09:53.010 --> 09:56.580
În principiu, vom obține aceleași valori și pentru celelalte patru rânduri rămase.

09:56.580 --> 10:03.440
Deci, de fiecare dată când ne hrănim într-un rând în rețeaua noastră neuronală, avem de-a face cu asta.

10:03.780 --> 10:06.930
Apoi se compară cu valoarea reală.

10:06.930 --> 10:08.550
Deci, ele sunt valorile reale.

10:08.760 --> 10:11.340
Deci, pentru fiecare rolă, avem o valoare reală.

10:11.640 --> 10:18.480
Și acum, bazându-ne pe toate aceste diferențe între y hat și de ce putem calcula

10:18.480 --> 10:27.620
funcția de cost care este suma tuturor acestor diferențe pătrat între motivul și de ce și cum toate acestea sunt înjumătățite.

10:28.230 --> 10:30.360
Și este funcția noastră de cost.

10:30.360 --> 10:36.750
Și, de fapt, acum ceea ce facem după ce avem funcția de cost pe deplin revenim și actualizăm greutățile pe

10:37.170 --> 10:39.480
care le actualizăm un W 1 WTW.

10:39.510 --> 10:45.810
Și importantul lucru pe care trebuie să-l amintim aici este că toate aceste percepții toate aceste rețele neuronale este de

10:45.810 --> 10:47.340
fapt o rețea neurală.

10:47.340 --> 10:49.420
Deci nu sunt opt ​​dintre ei este doar unul.

10:49.680 --> 10:55.110
Și când actualizăm greutățile, vom actualiza greutățile în acea rețea neurală, astfel încât, practic,

10:55.110 --> 10:57.900
greutățile vor fi aceleași pentru toate rândurile.

10:57.930 --> 11:00.560
Deci nu este cazul ca fiecare rol să aibă o pondere proprie.

11:00.580 --> 11:07.320
Acum, toate rândurile împărtășesc greutățile și de aceea am analizat funcția de cost care

11:07.620 --> 11:15.270
este suma diferențelor pătrate și apoi am actualizat greutățile și acum de aici a existat o singură iterație.

11:15.270 --> 11:19.020
În continuare vom relua totul.

11:19.020 --> 11:25.440
Vom hrăni fiecare rând în rețeaua neurală pentru a afla funcția noastră de cost și a face din nou

11:25.440 --> 11:26.370
întregul proces.

11:26.370 --> 11:32.090
Așa cum am văzut anterior unde am avut doar un singur rând și am făcut totul din nou și din

11:32.140 --> 11:33.590
nou același lucru aici.

11:33.600 --> 11:38.880
Dar acum o să facem și Pedros sau 800 de rânduri sau opt mii de rânduri, cu toate acestea multe

11:38.880 --> 11:40.590
rânduri aveți în setul de date.

11:40.830 --> 11:43.700
Faceți acest proces și apoi calculați funcția de cost.

11:44.220 --> 11:51.510
Scopul aici este să minimizați funcția de cost și să obțineți imediat ce ați găsit un minut din

11:51.510 --> 12:00.210
funcția de cost care este rețeaua dvs. neuronală finală, ceea ce înseamnă că greutățile dvs. au fost ajustate și ați găsit greutățile

12:00.750 --> 12:08.550
optime pentru acest set de date pe care l-ați început instruirea dvs. și sunteți pregătit să treceți la faza de

12:08.550 --> 12:11.130
testare sau la faza de aplicare.

12:11.550 --> 12:14.920
Și întregul proces se numește propagare înapoi.

12:15.000 --> 12:21.930
Deci, unele lecturi suplimentare pe care ați putea dori să o faceți pentru funcția de cost și știu că am vorbit

12:21.930 --> 12:24.840
despre unul și că există multe altele diferite.

12:24.840 --> 12:28.690
Un articol bun este situat pe cross-validate.

12:28.740 --> 12:33.020
Se numește o listă de funcții de curs utilizate în rețelele neuronale alături de aplicații.

12:33.090 --> 12:39.840
Deci euro este acolo, dar puteți doar Google pentru acel termen de căutare exact sau frază de căutare și veți că

12:39.960 --> 12:42.150
aceasta va fi prima care apare.

12:42.150 --> 12:48.660
De fapt, avem câteva exemple bune și aplicați sau utilizați cazuri pentru diferite funcții de cost, deci dacă sunteți interesat să

12:48.660 --> 12:51.800
aflați mai multe despre funcțiile de cost Verificați acest articol.

12:51.990 --> 12:54.380
Și în această notă sper să vă bucurați de acest tutorial.

12:54.420 --> 12:56.070
Aștept cu nerăbdare să vă văd data viitoare.

12:56.070 --> 12:58.020
Până atunci se bucură de învățare profundă.