WEBVTT

00:00.270 --> 00:02.640
Ciao e bentornati al corso di deep learning.

00:02.730 --> 00:05.140
Va bene oggi stiamo parlando della funzione di attivazione.

00:05.190 --> 00:07.010
Entriamo subito.

00:07.020 --> 00:11.910
Quindi questo è il punto in cui abbiamo interrotto in precedenza, abbiamo parlato della struttura di un neurone.

00:12.030 --> 00:16.770
Quindi è nel mezzo che sappiamo che ha alcuni valori di input che entrano ha dei

00:17.130 --> 00:23.370
pesi, quindi aggiunge il modo di calcolare il modo in cui alcuni di questi input e quindi applica la funzione di

00:23.370 --> 00:24.690
attivazione nel passaggio 3.

00:24.750 --> 00:30.090
quindi è quello di cui stiamo parlando oggi stiamo parlando del valore che verrà passato.

00:30.090 --> 00:32.850
Trasmette il segnale al prossimo anno e

00:32.850 --> 00:35.970
Quindi stiamo parlando della funzione di attivazione che viene applicata.

00:36.390 --> 00:39.270
Quindi quali opzioni abbiamo per la funzione di attivazione.

00:39.270 --> 00:43.400
Bene, esamineremo quattro diversi tipi di funzioni di attivazione tra cui è possibile scegliere.

00:43.410 --> 00:47.400
Ovviamente ci sono più tipi diversi di funzione di attivazione, ma questi sono quelli

00:47.400 --> 00:50.390
predominanti di cui sentirai parlare e che useremo in questo corso.

00:50.400 --> 00:53.060
Quindi ecco la funzione di soglia.

00:53.070 --> 00:54.300
Questo è quello che sembra.

00:54.300 --> 00:59.600
Quindi sull'asse x hai pesato alcuni degli input sull'asse y.

00:59.610 --> 01:07.320
Hai appena conosciuto i valori da 0 a 1 e fondamentalmente le funzioni di soglia sono molto

01:07.330 --> 01:14.700
semplici tipo una funzione in cui se il valore è inferiore a zero allora il libero.

01:14.730 --> 01:16.680
Grazie ssion passa a zero.

01:16.890 --> 01:22.940
Se il valore è maggiore di zero o uguale a zero, la funzione di soglia sfiora un 1.

01:22.940 --> 01:26.910
Quindi in pratica è un po 'come si, nessun tipo di funzione.

01:26.940 --> 01:29.130
Molto molto semplice.

01:29.130 --> 01:33.500
Molto simile al tipo di funzione rigido o sì o no.

01:33.540 --> 01:35.000
Nessuna altra opzione

01:35.040 --> 01:35.510
Quindi eccoti.

01:35.510 --> 01:36.210
Ecco come funziona

01:36.210 --> 01:37.440
Funzione molto semplice

01:37.440 --> 01:40.020
Passiamo a qualcosa di un po 'più complesso.

01:40.020 --> 01:48.420
Ora questa formula sigmoidea formula molto interessante che abbiamo qui vedrai solo ora c'è una divisione per

01:48.420 --> 01:49.940
uno più ciascuno.

01:49.950 --> 01:58.450
Il potere di meno X mentre in questo caso ovviamente X è il valore delle somme del modo in cui somma.

01:58.590 --> 02:00.540
E quindi sì.

02:00.570 --> 02:02.600
Quindi questo è ciò che assomiglia al sigmoide.

02:02.610 --> 02:06.510
È una funzione che viene utilizzata nella regressione logistica.

02:06.510 --> 02:09.470
Se ti ricordi dal corso di apprendimento automatico.

02:09.540 --> 02:12.000
Quindi, ciò che è buono di questa funzione è che è liscia.

02:12.060 --> 02:14.880
A differenza della funzione virtuale.

02:14.970 --> 02:21.720
Questo non ha quei punti nella sua curva e quindi è solo una graduale e graduale progressione.

02:21.720 --> 02:26.340
Quindi qualsiasi cosa sotto lo zero è come gocce sopra lo zero.

02:26.340 --> 02:35.220
Agisce approssimativamente verso uno e questa funzione sigmoide è molto utile nel livello di output finale di

02:35.220 --> 02:35.590
Lehren.

02:35.610 --> 02:38.900
Soprattutto quando stai cercando di prevedere le probabilità.

02:38.910 --> 02:40.820
E lo vedremo durante il corso.

02:41.190 --> 02:47.370
E poi abbiamo la funzione di raddrizzatore di funzione del raddrizzatore anche se ha un

02:47.370 --> 02:55.090
nodo è una delle funzioni più popolari per le reti neurali artificiali quindi va fino a zero è zero.

02:55.110 --> 03:02.460
il corso lo vedremo in altri tutorial di intuizione e vedremo anche come usiamo questa funzione nella parte pratica del corso

03:02.460 --> 03:07.140
e Da ora in poi commenterò un po 'di più in alcune diapositive.

03:07.140 --> 03:13.020
E poi da lì gradualmente progredisce man mano che aumenta anche il valore di input e vedremo

03:13.020 --> 03:13.590
che durante

03:13.590 --> 03:18.970
Quindi ricorda che la funzione di fuoco diretto è una delle funzioni più utilizzate nelle reti neurali artificiali.

03:19.020 --> 03:22.770
E finalmente abbiamo un'altra funzione che probabilmente sentirai.

03:22.830 --> 03:25.220
È la funzione tangente iperbolica.

03:25.260 --> 03:32.760
È molto simile alla funzione sigmoide, ma qui la funzione tangente iperbolica scende sotto lo zero, quindi i valori

03:32.760 --> 03:39.510
vanno da 0 a 1 o circa 2 1 e vanno da zero a meno 1 sull'altro lato.

03:39.750 --> 03:42.360
E ciò può essere utile in alcune applicazioni.

03:42.390 --> 03:48.060
Quindi non entreremo troppo in profondità in ognuna di queste funzioni. Volevo solo informarti su di

03:48.060 --> 03:51.680
loro in modo da sapere come sono e come vengono chiamati.

03:51.780 --> 03:59.690
Se desideri ottenere qualche lettura aggiuntiva, dai un'occhiata a questo articolo di un lotto di 75 anni.

03:59.820 --> 04:05.630
Hai un sacco chiamato Deep Sparse rettifica reti neurali 2000 carta.

04:05.790 --> 04:14.700
E lì scoprirai esattamente perché la funzione del raddrizzatore è una funzione così preziosa per la

04:14.970 --> 04:16.300
sua popolarità.

04:16.350 --> 04:20.640
Ma tuttavia per ora non abbiamo davvero bisogno di sapere tutte queste cose.

04:20.650 --> 04:24.240
Per ora inizieremo ad applicarli che inizi a usarli sempre di più.

04:24.270 --> 04:31.290
Quindi, quando ti senti a tuo agio con il lato pratico delle cose, allora puoi andare e riferirti a questo articolo

04:31.290 --> 04:37.140
e poi sarai in grado di immergerti in quella conoscenza molto più rapidamente e avrà molto più senso.

04:37.370 --> 04:42.000
Ma tieni a mente che quando sei pronto quando senti di essere pronto, allora puoi andare

04:42.120 --> 04:45.060
a cercare documenti e ottenere da loro alcune preziose conoscenze.

04:45.540 --> 04:53.070
Quindi, per ricapitolare rapidamente, abbiamo la funzione di attivazione della soglia che fa così la funzione di attivazione

04:53.100 --> 04:55.360
sigmoidea che assomiglia a questo.

04:55.680 --> 05:01.770
Abbiamo la funzione di raddrizzatore e abbiamo la funzione di tangente iperbolica e ora finiamo

05:01.770 --> 05:09.000
questo tutorial Facciamo velocemente qualche esercizio quindi basta fare due esercizi rapidi per aiutare quella conoscenza ad affondare.

05:09.000 --> 05:09.150
&nbsp;

05:09.150 --> 05:15.140
Quindi, per prima cosa, abbiamo qui un esempio di una rete neurale di un solo neurone e quella del

05:15.160 --> 05:16.030
livello di output.

05:16.140 --> 05:22.620
E la domanda sta assumendo che la tua variabile dipendente sia binaria. Quindi è 0 o 1 quale funzione

05:22.620 --> 05:23.780
di soglia useresti.

05:23.790 --> 05:31.980
Quindi, da quelli che abbiamo discusso abbiamo una funzione di soglia della funzione sigmoide della funzione

05:31.980 --> 05:39.480
raddrizzatore e abbiamo la funzione tangente iperbolica nella sua forma di rotolo che potreste essere

05:39.480 --> 05:43.450
in grado di usare per una variabile binaria.

05:43.950 --> 05:44.410
OK.

05:44.490 --> 05:49.360
Quindi le risposte qui sono due opzioni con cui possiamo affrontare questo.

05:49.380 --> 05:55.790
Quindi una è la funzione di attivazione della soglia perché sappiamo che è compresa tra 0 e 1 e ci dà 0

05:55.800 --> 06:00.090
ombrelli Anderson e quindi altrimenti ti dà una volta sola può darti due valori.

06:00.090 --> 06:10.020
Si adatta perfettamente a questo requisito perfettamente e quindi potresti dire che y è uguale alla funzione di soglia del

06:10.020 --> 06:13.770
tuo dominio per alcuni e questo è tutto.

06:14.010 --> 06:18.450
E nel secondo caso che è possibile utilizzare è la funzione di attivazione sigmoide.

06:18.450 --> 06:21.710
In realtà è anche tra 0 e 1 proprio quello di cui abbiamo bisogno.

06:21.750 --> 06:29.940
Ma allo stesso tempo vuoi che tu abbia solo un diritto, quindi non sei esattamente ciò di cui

06:29.940 --> 06:37.530
abbiamo bisogno, ma in questo caso potresti usarlo come la probabilità che Y sia sì o no.

06:37.530 --> 06:46.170
Quindi vogliamo che Y sia 0 1, ma invece diremo che la funzione di sigma di attivazione Simoun ci

06:46.170 --> 06:51.860
dice se ci dirà della probabilità che Y sia uguale a 1.

06:51.870 --> 06:59.130
Quindi, più ci si avvicina alla cima, più è probabile che questo sia effettivamente uno o un sì piuttosto

06:59.160 --> 07:00.300
che un no.

07:00.750 --> 07:04.700
E sì, questo è molto simile all'approccio alla regressione logistica.

07:04.920 --> 07:07.570
E quelli sono solo due esempi.

07:07.650 --> 07:09.610
Se hai una variabile binaria.

07:10.120 --> 07:12.810
Ora diamo un'occhiata ad un'altra applicazione pratica.

07:12.810 --> 07:17.190
Diamo un'occhiata a come si comporterebbe tutto questo se avessimo in tutto naturale come questo.

07:17.430 --> 07:20.960
Quindi nel primo strato abbiamo alcuni input.

07:20.980 --> 07:26.060
Vengono inviati al nostro primo livello nascosto e quindi viene applicata una funzione di attivazione.

07:26.070 --> 07:31.380
E di solito quello che applicheresti qui e quello che vedrai in tutta Scorsese applicherà una funzione di

07:31.410 --> 07:34.510
attivazione del raddrizzatore in modo che assomigli a qualcosa del genere.

07:34.530 --> 07:40.980
di uscita dove verrà applicata la funzione di attivazione del sigmoide e quello sarebbe il nostro output finale.

07:40.980 --> 07:46.820
Applichiamo la funzione di attivazione del raddrizzatore e quindi da lì i segnali verrebbero passati allo strato

07:46.830 --> 07:51.270
E questo potrebbe predire una probabilità, per esempio, quindi questa combinazione sarà

07:51.600 --> 07:58.640
abbastanza comune dove nei livelli nascosti applichiamo la funzione di raddrizzatore e quindi emettiamo lì applichiamo la funzione sigmoide.

07:58.890 --> 07:59.850
Quindi eccoci.

07:59.850 --> 08:05.040
Spero che questo tutorial ti sia piaciuto ora sei abbastanza esperto in quattro diversi tipi di

08:05.040 --> 08:11.130
funzioni di attivazione e avrai delle mani sull'esperienza pratica con loro durante questo corso che le useranno dappertutto

08:11.220 --> 08:15.900
in modo da conoscerle abbastanza intimamente e dovresti essere abbastanza a tuo agio con

08:15.900 --> 08:16.310
loro.

08:16.530 --> 08:22.230
Ma per ora questa è la consapevolezza che hai bisogno di progredire e capire cosa sta per accadere più

08:22.250 --> 08:23.600
avanti in questo corso.

08:23.940 --> 08:26.940
E su quella nota non vedo l'ora di vederti la prossima volta.

08:26.940 --> 08:28.560
Fino ad allora piace imparare.
