WEBVTT

00:00.640 --> 00:02.940
Ciao e bentornati al corso di deep learning.

00:02.970 --> 00:09.120
Oggi parliamo di un indizio che viene rettificato nelle vostre unità e questo è un ulteriore

00:09.120 --> 00:12.180
passo in aggiunta al nostro passo di convoluzione.

00:12.180 --> 00:16.140
Quindi non è un grande passo separato, è un piccolo passo nel primo passo essere fondamentalmente.

00:16.290 --> 00:18.230
E cosa sta succedendo qui.

00:18.240 --> 00:24.090
Bene, abbiamo la nostra immagine di input che abbiamo tutto convoluzionale lì di cui abbiamo discusso

00:24.090 --> 00:26.080
e quindi in aggiunta applicheremo.

00:26.400 --> 00:27.190
Aspettalo.

00:27.240 --> 00:36.720
La nostra funzione di raddrizzatore preferita e hai familiarità con la funzione di raddrizzatore della sezione precedente sulle reti

00:36.750 --> 00:47.400
neurali artificiali e nel nostro Così a volte autori o istruttori separano la convoluzione e dirigono il fuoco come due passaggi

00:47.430 --> 00:54.030
separati nei nostri esempi che li considereranno come il giusto un grande passo

00:54.030 --> 00:57.060
per la seconda evoluzione quindi il raddrizzatore.

00:57.270 --> 01:03.750
E il motivo per cui applichiamo il raddrizzatore è perché vuoi aumentare la non-linearità nella nostra

01:03.780 --> 01:13.410
immagine o nella nostra rete e nella nostra rete neurale commerciale e il nostro fuoco agisce come quel filtro o accesso a quella funzione

01:13.440 --> 01:19.200
che si interrompe e tu La ragione per cui vogliamo aumentare la non linearità

01:19.440 --> 01:25.950
nella nostra rete è perché le immagini stesse sono altamente non lineari specialmente se stai riconoscendo

01:26.010 --> 01:32.790
oggetti diversi uno accanto all'altro o solo sullo sfondo e cose del genere come l'immagine avrà molti

01:33.180 --> 01:38.050
elementi non lineari e la transizione tra pixel adiacenti è spesso non lineare.

01:38.040 --> 01:41.280
Questo lo sai perché i suoi confini sono diversi colori è diverso.

01:41.460 --> 01:46.020
Ci sono diversi elementi nelle tue immagini e, allo stesso tempo, quando

01:46.020 --> 01:52.410
applichiamo un'operazione matematica come la convoluzione che conosci e che esegui questa funzione di rilevamento per

01:52.710 --> 01:59.710
creare le nostre mappe delle funzionalità, rischiamo di creare qualcosa di lineare e quindi dobbiamo rompere la narrativa.

01:59.970 --> 02:05.960
Quindi diamo un'occhiata a un esempio qui è un'immagine e l'immagine originale.

02:05.970 --> 02:13.220
Ora quando applichiamo un rilevatore di rilevamento di funzionalità a questa immagine otteniamo qualcosa di simile.

02:13.290 --> 02:16.230
Quindi puoi vedere qui che il nero è negativo Il bianco è anche un valore positivo.

02:16.230 --> 02:22.980
Quando si applica un rilevatore di caratteristiche a un'immagine simile che non ha solo zero e uno ma ha molti valori

02:22.980 --> 02:28.890
diversi e si applica come abbiamo visto in precedenza, il Texas può avere valori negativi in ​​sé stessi

02:29.070 --> 02:30.920
a volte si ottengono valori negativi.

02:31.080 --> 02:34.670
E qui i neri sono negativi quelli bianchi sono positivi.

02:34.800 --> 02:45.240
E ciò che fa una funzione unitaria lineare rettificata è che rimuove tutti i diritti neri in qualsiasi cosa sotto zero

02:45.240 --> 02:46.490
e diventa zero.

02:46.560 --> 02:49.160
E così da questo si trasforma in questo diritto.

02:49.290 --> 02:57.990
E quindi è piuttosto difficile capire quale sia esattamente il vantaggio in termini di rottura

02:58.050 --> 02:58.910
della linearità.

02:59.400 --> 03:01.050
Proverò a spiegare.

03:01.080 --> 03:07.740
Proverò a mostrare un esempio su questa immagine, ma alla fine è un concetto molto matematico e

03:07.740 --> 03:12.480
dovrei fare un sacco di matematica per spiegare veramente cosa sta succedendo.

03:12.480 --> 03:13.800
Ma proviamo diamo un'occhiata.

03:13.800 --> 03:16.800
Quindi per esempio diamo un'occhiata a questo.

03:16.860 --> 03:17.580
Questo edificio qui.

03:17.580 --> 03:18.070
Destra.

03:18.090 --> 03:20.150
Quindi questo è un edificio a sé stante.

03:20.730 --> 03:22.400
Quindi puoi vedere questa ombra.

03:22.440 --> 03:29.010
Questa parte nera quest'ombra qui bene, vedi che è bianco il riflesso della luce e poi è un

03:29.010 --> 03:33.160
grigio e poi diventa più scuro e poi diventa più scuro.

03:33.240 --> 03:35.860
Quindi e quando lo tiriamo fuori, prendiamo quella macchia nera.

03:35.860 --> 03:38.220
Quindi pensaci in termini di linearità.

03:38.250 --> 03:43.700
Quindi sembra che quando vai dal bianco al grigio il prossimo passo sia nero.

03:43.740 --> 03:50.970
Il prossimo è nero, è una progressione lineare dal chiaro al buio e quindi è

03:50.970 --> 03:53.490
una specie di situazione lineare.

03:53.490 --> 03:56.560
Quando togli il nero, rompi la linearità.

03:56.670 --> 03:57.800
Proviamo un altro

03:58.050 --> 03:59.110
Diamo un'occhiata qui

03:59.220 --> 04:01.980
E allo stesso tempo è ancora lo stesso edificio vero.

04:01.980 --> 04:08.320
Non è che non è come te o come ti piace, non è che stai mescolando due edifici l'uno con l'altro,

04:08.550 --> 04:09.810
ma questo è secondario.

04:09.810 --> 04:11.940
Il punto principale è rompere la linearità.

04:12.210 --> 04:13.590
Quindi diamo un'occhiata qui stessa cosa.

04:13.590 --> 04:19.480
Quindi vedi bianco grigio nero grigio bianco.

04:19.590 --> 04:22.520
E quando lo interrompi non hai più ragione.

04:22.530 --> 04:29.600
Non hai quella progressione la progressione graduale che hai appena come un brusco cambiamento.

04:29.730 --> 04:33.540
E questo aiuta a introdurre la non-linearità nella tua immagine.

04:33.540 --> 04:42.540
Quindi è una spiegazione molto approssimativa molto simile a una spiegazione su o sulle dita piuttosto che tecnica, ma si spera che

04:42.690 --> 04:47.370
ti aiuti a capire un po 'meglio di cosa stiamo parlando qui.

04:47.370 --> 04:54.870
Quindi qui di nuovo puoi vedere che il grigio bianco è un esempio migliore anche per il brillante più scuro più scuro più scuro e più scuro

04:54.980 --> 04:55.680
più scuro.

04:55.680 --> 05:04.460
Quindi questa parte sembra che sia più sottile di come la rompi in quel modo, quindi questa è una spiegazione molto approssimativa.

05:04.480 --> 05:08.570
Non è assolutamente perfetto ma almeno ti dà un'idea di cosa sta succedendo.

05:08.800 --> 05:14.120
Ma se vuoi saperne di più c'è una buona carta, come sempre c'è sempre un giornale.

05:14.200 --> 05:20.370
Questo è dal corpo CCJ dell'Università della California e si chiama Understanding reti neurali

05:20.380 --> 05:22.980
convoluzionali che hanno un modello matematico.

05:23.200 --> 05:28.840
E fondamentalmente sono le risposte alle domande e devi solo guardare il primo.

05:28.840 --> 05:33.820
E la domanda è perché non è essenziale una funzione di attivazione non lineare all'uscita

05:33.820 --> 05:36.130
del filtro di tutti gli strati intermedi.

05:36.220 --> 05:44.280
Quindi questo tipo di spiegazioni è un po 'più dettagliata sia in termini di intuizione che per lo più in termini di matematica.

05:44.320 --> 05:47.970
Questo è un documento interessante in cui è possibile ottenere ulteriori informazioni aggiuntive su questo argomento.

05:48.100 --> 05:53.360
E se vuoi davvero approfondire ed esplorare alcune cose interessanti qui.

05:53.360 --> 05:55.690
Poi c'è un altro articolo a cui potresti essere interessato.

05:55.690 --> 06:01.720
Si chiama scavare più a fondo nel rettificatore superando le prestazioni a livello umano sull'immagine

06:01.720 --> 06:02.830
e quella classificazione.

06:02.920 --> 06:09.190
E qui l'autore sta pettinando i capelli e altri da Microsoft Research.

06:09.400 --> 06:17.630
Propongono un diverso tipo di funzione dell'unità più snella rettificata.

06:17.650 --> 06:21.830
Propongono la funzione parametrica rettificata che vedi qui a destra.

06:22.030 --> 06:26.740
E sostengono che offre risultati migliori senza sacrificare le prestazioni.

06:26.740 --> 06:30.200
Letture così interessanti se vuoi approfondire questo argomento.

06:30.490 --> 06:32.020
E questo è tutto per oggi.

06:32.280 --> 06:38.380
In realtà il tuo livello è piuttosto semplice, quindi per la regolazione basta applicare la funzione del raddrizzatore e non vedo l'ora di vederti

06:38.380 --> 06:39.230
la prossima volta.

06:39.250 --> 06:40.770
Fino ad allora piace imparare.
