WEBVTT

00:00.630 --> 00:03.850
Bună ziua și bineveniți înapoi la cursul de inteligență artificială.

00:03.990 --> 00:09.260
În tutorialul de astăzi, începem secțiunea privind învățarea mișcătoare profundă.

00:09.420 --> 00:11.010
Deci, haideți să aruncăm o privire la ce este vorba.

00:11.010 --> 00:14.040
Anterior am vorbit despre învățare profundă.

00:14.040 --> 00:21.270
Așadar, am avut un mediu în care un agent și am avut un vector care descrie acel mediu care a fost

00:21.270 --> 00:26.310
introdus într-o rețea neuronală și la final am obținut valorile q ca ieșirile noastre.

00:26.310 --> 00:29.970
Și apoi, desigur, am aflat cum să restrângem partea de învățare.

00:29.970 --> 00:34.650
Am aflat cum sunt hotărâte acțiunile bazate pe acele valori care reprezintă o parte de acțiune.

00:34.650 --> 00:42.380
Și am vorbit despre politici de selecție a acțiunilor și despre lucruri diferite despre modul în care funcționează învățarea profundă.

00:42.420 --> 00:51.240
Dar aici conceptul cheie pentru toate acestea este cum putem obține de la acest lucru din mediul

00:51.240 --> 00:54.450
real și statele către rețeaua neuronală.

00:54.480 --> 00:56.190
Ei bine, tranziția este aici.

00:56.220 --> 01:02.250
Vectorii de intrare, astfel încât Lehre de intrare a rețelei noastre neuronale și este un vector.

01:02.250 --> 01:06.570
Deci, ceea ce ne uităm este în regulă, așa că de fapt ne îndreptăm spre curbă.

01:06.600 --> 01:08.830
Nu este termenul corect în care nu ne uităm la nimic.

01:08.940 --> 01:12.330
Agentul are în principiu această informație.

01:12.330 --> 01:18.490
Deci, mediul înconjoară această informație spunând OK că agentul pe care îl aveți în prezent în această

01:18.560 --> 01:26.160
stare este descris de sector în acest exemplu simplificat descris de acest vector X-1 de 1 x 2 din 2, deci coordonatele

01:26.160 --> 01:31.410
dvs. sunt 1 2 și aceasta este întreaga dumneavoastră stare într-un mediu mai complex.

01:31.410 --> 01:37.920
Declarația și toate celelalte lucruri pe care agentul le poate observa, dar punctul aici este că este folosit

01:37.920 --> 01:39.040
ca vector.

01:39.240 --> 01:45.750
Și lucrul este că acest lucru nu se întâmplă în viața reală în viața reală, cu excepția sistemelor GPS și a altor astfel

01:45.780 --> 01:46.470
de lucruri.

01:46.530 --> 01:51.830
Dar în viața reală ceea ce folosim de cele mai multe ori când ne folosim simțurile, folosim ochii chiar și în GPS.

01:51.930 --> 01:53.670
Nu este încorporată în creierul nostru.

01:53.670 --> 01:56.420
Nu ne spune coordonatele prin creierul nostru.

01:56.430 --> 02:02.880
Deci, încă ne mai folosim ochii să ne uităm la GPS și să înțelegem ce se întâmplă acolo.

02:02.910 --> 02:09.620
Și așa este un fel de înșelăciune pentru ca AI să poată obține informații despre mediu ca vector.

02:09.620 --> 02:12.030
Este prea simplu, nu funcționează în realitate.

02:12.030 --> 02:17.040
Nu așa lucrăm noi ca oamenii și, în cele din urmă, dorim să creăm inteligență artificială, care

02:17.340 --> 02:23.310
poate funcționa într-o manieră similară cu cea a oamenilor, care este pe măsură ce poate să facă aceleași provocări ca și oamenii.

02:23.320 --> 02:28.740
Și așa în lumea umană nu avem că noi nu avem că nu avem aceste coordonate sau alte

02:28.740 --> 02:33.870
tipuri de vectori care ne sunt transmise, care explică starea în care suntem în acel mediu.

02:33.870 --> 02:37.350
Așa că trebuie să eliminăm acest lucru pentru a deveni mai realist.

02:37.410 --> 02:42.180
Și apoi ce putem înlocui cu ceea ce vedem sau ce facem ca om pentru a obține informații.

02:42.180 --> 02:46.860
Ei bine, de cele mai multe ori vedem desigur toate simțurile noastre, dar majoritatea

02:46.860 --> 02:51.300
informațiilor pe care le primim despre lumea din jurul nostru vin din vedere.

02:51.510 --> 02:59.340
Și de aceea vom schimba acea săgeată mică pe care am avut-o într-o întreagă rețea neuronală

02:59.340 --> 03:00.090
convoluțională.

03:00.090 --> 03:02.700
Deci asta este de la Onix.

03:02.700 --> 03:08.400
În al doilea rând, avem Larry convulsie și de aceea este important să fii destul de confortabil cu evoluția rețelelor

03:08.460 --> 03:13.290
neuronale condiționate și cum te descurci dacă ai făcut legătura cu ODP și ar trebui să

03:13.350 --> 03:14.910
te simți confortabil cu asta.

03:14.930 --> 03:20.490
Sau puteți doar să aruncați o privire la următorul număr doi, unde avem câteva tutoriale de intuiție foarte bune.

03:20.670 --> 03:26.160
Deci, aici avem operația convoluțională care se întâmplă, așa că vom privi în realitate acest lucru ca

03:26.160 --> 03:27.330
pe o imagine.

03:27.330 --> 03:31.350
Deci aceasta este o imagine a mediului Net.

03:31.350 --> 03:33.990
Și așa agentul se uită de fapt la mediul înconjurător.

03:33.990 --> 03:39.870
Deci, în cazul ăsta, nu că ar fi ca și cum ar arăta de acolo, arăta așa.

03:39.930 --> 03:44.710
Să spunem că joacă acest lucru pe un computer și poate vedea acest mediu și, prin urmare,

03:44.760 --> 03:48.480
el poate vedea cum ar fi locul în care această figură reprezintă agentul.

03:48.480 --> 03:53.340
Puteți vedea întregul său în virale sau orice ar vedea un om dacă este un labirint real, iar omul ar vedea

03:53.340 --> 03:54.270
labirintul din interior.

03:54.270 --> 03:56.480
Și așa agentul ar trebui să poată face exact același lucru.

03:56.700 --> 04:03.000
Deci, ceea ce spune el este făcut, trece printr-o bâzâitură de rău că te duci un fel de nebun

04:03.030 --> 04:10.140
trăgând un picior care merge acolo, aplatizându-te din nou, poți afla mai multe despre aceste părți diferite ale convoluției o rețea

04:10.140 --> 04:12.680
neurală în anexă și apoi ofițerii aplatizate.

04:12.690 --> 04:19.950
Apoi avem intrări care intră în rețeaua neuronală și aceasta este o modalitate mai realistă deoarece

04:19.950 --> 04:29.010
agentul trebuie să utilizeze site-urile lor și trebuie să proceseze imagini pe care mediul le furnizează agentului la fel cum

04:29.400 --> 04:31.590
omul ar procesa imagini.

04:31.590 --> 04:37.410
Și frumusețea acestui lucru nu este doar faptul că este mai realistă și este un fel de mai mult ca o nuanță.

04:37.410 --> 04:43.280
Vârsta este de fapt mai mult ca un om, dar ne permite să procesăm medii mult mai complexe.

04:43.380 --> 04:49.050
De exemplu, acesta este modul în care putem juca Doom sau alte jocuri de

04:49.050 --> 04:55.980
acest gen, pentru că în loc să obținem doar un vector de informație pe care cineva ar fi creat-o

04:56.080 --> 05:02.230
pentru noi în acest mediu, putem să conectăm inteligența artificială la orice mediu care, este și.

05:02.430 --> 05:08.280
Ca om când joci acest joc poți vedea exact această imagine și exact asta

05:08.760 --> 05:12.450
ar vedea acum rețeaua neurală artificială sau agentul.

05:12.540 --> 05:17.580
Deci, în această parte a cursului, când veți examina practicanții Tournelles, agentul va vedea de fapt

05:17.580 --> 05:22.890
această imagine exactă pe care o va vedea pixelilor că vor obține această imagine exactă plină

05:22.890 --> 05:28.410
de pixeli ai acestei persoane, cu această față cu acest procent cu tot ceea ce vedem aici este

05:28.410 --> 05:30.710
exact ceea ce va vedea agentul.

05:30.870 --> 05:37.470
Apoi va trebui să-l discecteze prin trăgând îngrășământ și apoi să intră într-o plasă neuronală.

05:37.650 --> 05:42.150
Și inutil să spun că rețelele neuronale sunt de fapt mult mai complexe decât asta, deci să o înlocuim cu ceva de

05:42.150 --> 05:42.780
genul asta.

05:42.780 --> 05:44.480
Acest lucru nu este mult mai complex.

05:44.520 --> 05:49.350
Acest lucru pare puțin mai complex, dar, în realitate, rețelele neuronale vor lucra și vor crea,

05:49.380 --> 05:54.140
dacă veți fi destul de interesante și vor fi mult mai complexe decât acestea.

05:54.150 --> 05:59.910
Dar, după cum puteți vedea deja aici, chiar dacă aveți doar cinci intrări și un fel de două lucruri devin mult mai

05:59.970 --> 06:04.380
complexe și aici puteți vedea că avem multe alte acțiuni pe care agentul le poate lua.

06:04.380 --> 06:10.850
Deci, în jocul doom rândul său, la stânga și la dreapta uita-te în jos uita-te la Ron reîncărca împușcat.

06:10.890 --> 06:16.290
Sau știți că toate acele acțiuni diferite care sunt posibile la prima persoană ar trebui să fie asemănătoare.

06:16.290 --> 06:19.430
Și, în plus, nu trebuie să fie că poți.

06:19.430 --> 06:23.190
Puteți atinge acest agent într-un alt tip de joc.

06:23.190 --> 06:29.940
Aceasta este frumusețea pe care o realizează atunci că poate să opereze acum orice fel de mediu pe care îl atașați pentru

06:29.940 --> 06:34.260
că, atâta timp cât există o reprezentare vizuală a mediului din acel mediu,

06:34.680 --> 06:39.940
el a primit deja întreaga infrastructură pe care întreaga structură este gata să o proceseze acea.

06:39.960 --> 06:43.980
Deci asta este tot ceea ce înseamnă învățarea profundă a CULE-ului convoluțional.

06:43.980 --> 06:51.120
Așa că luăm chiar până la următoarea etapă în care adăugăm convulsii în Lares sau în convulsivi Lares

06:51.120 --> 06:58.980
în creierul nostru agenți acum și o facem și mai complexă și, prin urmare, ne putem plictisi cu posibilitatea de a

06:58.980 --> 07:01.260
rezolva și mai complexe provocări.

07:01.410 --> 07:06.720
Asa ca sper ca esti foarte incantat de faptul ca asta va fi intr-o sectiune epica si vom crea

07:06.720 --> 07:10.460
cateva lucruri uimitoare si nu pot astepta sa te vad in urmatorul tutorial.

07:10.480 --> 07:12.130
Și până atunci să vă bucurați de AI.