WEBVTT

00:00.360 --> 00:06.480
Ciao e bentornati al corso sull'apprendimento approfondito questo è un tutorial aggiuntivo per parlare delle

00:06.480 --> 00:08.670
funzioni di entropia morbida e incrociata.

00:08.670 --> 00:15.320
Non è necessario al 100 percento per poter passare attraverso tutte le parti che abbiamo attraversato nella parte

00:15.330 --> 00:21.510
principale di questa sezione in cui stiamo parlando delle reti neurali convoluzionali ma allo stesso tempo pensavo

00:21.510 --> 00:26.580
che sarebbe stato una buona aggiunta al tuo bagaglio di conoscenze e abilità.

00:26.580 --> 00:30.840
Quindi andiamo avanti e scavare in queste funzioni.

00:30.840 --> 00:37.530
abbiamo qui è la conclusione di una rete neurale che abbiamo costruito nella parte principale della sezione

00:37.530 --> 00:44.210
e poi alla fine si aprono alcune probabilità per zero punti novanta cinque per un cane 0.

00:44.220 --> 00:48.000
Quindi, iniziare con quello che 05 cinque o 5 per cento per un gatto.

00:48.060 --> 00:53.250
Dato che la foto a sinistra come input Questo è dopo che il treno è stato

00:53.260 --> 00:57.210
condotto, in realtà è in esecuzione e sta classificando una determinata immagine.

00:57.360 --> 01:00.850
E quindi la domanda qui è come mai questi due valori si sommano a uno.

01:00.900 --> 01:06.750
Perché per quanto sappiamo da tutto ciò che ho imparato sulle reti neurali artificiali non

01:06.750 --> 01:11.600
c'è nulla da dire che questi due neuroni finali siano collegati tra loro.

01:11.730 --> 01:16.590
Quindi, come fanno a sapere qual è il valore della stiva, ciascuno di loro sa qual è

01:16.590 --> 01:17.310
il valore dell'altro.

01:17.400 --> 01:20.140
E come avrebbero saputo aggiungere i loro valori fino a uno.

01:20.340 --> 01:22.060
Bene, la risposta è che non lo farebbero.

01:22.260 --> 01:28.500
Nella versione classica della nostra rete neurale artificiale e l'unico modo in cui lo fanno è perché

01:28.710 --> 01:33.960
introduciamo una funzione speciale chiamata soft max function per aiutarci ad uscire dalla situazione.

01:33.960 --> 01:40.890
Quindi normalmente quello che succederebbe è che i neuroni del cane e del gatto avrebbero qualsiasi tipo di valori reali

01:41.490 --> 01:44.940
che non devono essere, non devono essere aggiunti a uno.

01:45.180 --> 01:51.900
Ma poi applicheremo la funzione soft max che è scritta lì sopra e che porterebbe

01:51.900 --> 01:58.430
questi valori tra 0 e 1 e li farebbe aggiungere a 1 e 3 PPTA.

01:59.250 --> 02:04.320
La funzione soft max o la funzione esponenziale normalizzata è una generalizzazione della funzione logistica

02:04.350 --> 02:11.640
che cita unquote squash ha un vettore dimensionale k di valori reali arbitrari in un vettore dimensionale k di valori reali

02:11.640 --> 02:15.320
nell'intervallo da zero a uno che sommano fino a 1.

02:15.330 --> 02:17.620
Quindi in pratica fa esattamente quello che vogliamo.

02:17.670 --> 02:22.700
Porta questi valori tra 0 e 1 e fa in modo che aggiungano fino a 1.

02:22.960 --> 02:27.780
E il modo in cui funziona è che il modo in cui ciò è possibile è che, in fondo,

02:27.780 --> 02:29.970
siamo qui, puoi vedere che c'è una somma.

02:29.970 --> 02:38.100
l'esponente e lo mette nella potenza di Zed e lo aggiunge in modo che uno sia un due in tutte le classi.

02:38.100 --> 02:38.830
Quindi prende

02:38.850 --> 02:39.990
Tutti questi valori.

02:39.990 --> 02:44.400
E così ecco che la tua normalizzazione sta accadendo proprio lì.

02:44.400 --> 02:51.300
Ecco come funziona la funzione Saucebox e ha senso introdurre la funzione soft next in

02:51.600 --> 02:59.490
reti neurali convoluzionali perché sarebbe strano se tu avessi una possibile classe di un cane e un

02:59.490 --> 03:05.140
gatto e per la classe di cani avresti la possibilità dell'80 percento .

03:05.160 --> 03:08.660
E per gli artigli del gatto hai avuto un buon 45 percento.

03:08.670 --> 03:14.430
e questo è quello che troverete per la maggior parte del tempo nelle reti convoluzionali e neurali.

03:14.430 --> 03:19.760
Non ha proprio senso e quindi è molto meglio quando si introduce la funzione soft next

03:19.770 --> 03:26.010
Ora l'altra cosa è che la funzione soft max viene di pari passo con qualcosa chiamata la funzione entropia di

03:26.100 --> 03:29.040
Cross ed è una cosa molto utile per noi.

03:29.050 --> 03:30.610
Diamo prima un'occhiata alla formula.

03:30.660 --> 03:33.090
Questo è come appare la funzione cross entry.

03:33.090 --> 03:38.910
In realtà utilizzeremo un calcolo diverso che utilizzerà questa rappresentazione del secolo, ma i risultati

03:39.060 --> 03:40.670
sono sostanzialmente gli stessi.

03:40.670 --> 03:42.300
Questo è solo più facile da calcolare.

03:42.570 --> 03:49.220
E quello che so potrebbe sembrare molto estraneo a qualsiasi cosa in questo momento solo formule sul tuo schermo, ma ci

03:49.850 --> 03:54.300
saranno alcune letture aggiuntive raccomandate alla fine di questa sezione quindi non preoccuparti se

03:54.600 --> 03:56.380
non stai raccogliendo in matematica.

03:56.380 --> 03:58.350
Come se non avessimo spiegato la matematica in questo momento.

03:58.350 --> 04:03.630
Ma il punto qui è che ciò che è attraverso l'entropia è ben al di là della funzione di entropia.

04:03.630 --> 04:11.870
Ricorda come in precedenza nelle reti neurali artificiali avessimo una funzione chiamata funzione della freccia quadrata media che

04:11.880 --> 04:17.760
abbiamo usato come funzione di costo per valutare la nostra prestazione naturale.

04:17.760 --> 04:23.750
E il nostro obiettivo era ridurre al minimo il MSE al fine di ottimizzare le prestazioni della nostra rete.

04:23.940 --> 04:31.830
Bene, questa era la nostra funzione di costo, quindi in reti neuronali convoluzionali possiamo ancora utilizzare MSE, ma un'opzione

04:31.830 --> 04:38.070
migliore nelle reti neuronali convoluzionali dopo aver applicato la funzione soft max risulta essere la

04:38.070 --> 04:39.840
funzione di entropia incrociata.

04:39.840 --> 04:46.080
E nelle reti neurali convoluzionali quando si applicano le funzioni di cross-entry non a costo chiamato più la funzione

04:46.080 --> 04:49.450
di costo è chiamata l'ultima funzione e sono molto simili.

04:49.470 --> 04:55.520
Sono solo alcune differenze terminologiche e un po 'diverse e su cosa significano.

04:55.530 --> 04:58.430
Ma a tutti gli effetti è praticamente la stessa cosa.

04:58.450 --> 05:07.530
che l'ultima funzione è di nuovo qualcosa che vogliamo minimizzare al fine di massimizzare le prestazioni della nostra rete.

05:07.530 --> 05:09.670
E quello che succede è

05:09.690 --> 05:15.260
Quindi diamo un'occhiata a un rapido esempio su come questa funzione può essere applicata.

05:15.260 --> 05:19.260
Quindi diciamo che inseriamo un'immagine di un cane nella nostra rete.

05:19.650 --> 05:26.160
Il valore previsto per il cane è 0. 9 e questo è l'allenamento, quindi sappiamo che conosciamo l'etichetta

05:26.160 --> 05:27.330
che è un cane.

05:27.330 --> 05:34.140
Quindi il valore predittivo 0. 9 il valore prigged per cat è 0. 1 quindi qui abbiamo l'etichetta quindi sappiamo che

05:34.140 --> 05:37.810
è un cane perché questo è l'allenamento 0 1 per cani o per gatto.

05:37.980 --> 05:47.600
E quindi in questo caso è necessario utilizzare è necessario collegare questi numeri nella formula per l'entropia incrociata.

05:47.810 --> 05:53.340
Quindi come lo fai sono i valori a sinistra che vanno al segnale verbale.

05:53.420 --> 05:58.940
Quello che si trova sotto il logaritmo nella parte destra ei valori da destra andrebbero

05:58.940 --> 06:04.340
in P e quindi è importante ricordare quale va lì perché se si sbagliano non

06:04.340 --> 06:09.620
si vuole prendere un logaritmo per tutto me dal valore zero o passando da 1.

06:09.620 --> 06:11.660
Quindi vuoi solo collegarli.

06:11.720 --> 06:14.520
Assicurati di collegarli nelle posizioni corrette.

06:14.840 --> 06:17.030
E poi in pratica lo aggiungi.

06:17.030 --> 06:22.370
make renderebbe più logico ciò che è Cross entropy e sarà meno così.

06:22.370 --> 06:28.130
Ecco come funziona il cross-entry e in questo momento vedremo un esempio specifico passo passo

06:28.130 --> 06:32.360
di applicare questa funzione nella vita reale e Ill tipo di

06:32.360 --> 06:39.290
Il mio obiettivo in questa fatica è di renderti più a tuo agio nel secolo cruciale perché può

06:39.320 --> 06:43.840
sembrare molto contorto e non è possibile fare giochi di parole.

06:43.850 --> 06:50.870
Come le reti neurali convoluzionali, può sembrare molto complesso e spaventoso, ma non lo è.

06:50.870 --> 06:51.650
Questo è il punto.

06:51.650 --> 06:54.090
Quindi andiamo avanti e applichiamo solo così sappiamo che non è spaventoso.

06:54.080 --> 06:56.350
Quindi ecco tutto questo.

06:56.360 --> 07:01.790
E anche questo spiegherà perché lo stiamo facendo perché stiamo esaminando diverse funzioni di causa.

07:01.790 --> 07:06.650
Quindi una rete neurale una rete neurale diciamo che abbiamo due reti neurali e poi

07:06.650 --> 07:11.960
passiamo l'immagine di un cane e sappiamo che questo è un cane e non un gatto.

07:12.200 --> 07:18.620
E poi abbiamo un'altra immagine il nostro gatto questa volta un animale ed è un gatto non un cane e qui abbiamo un che

07:19.040 --> 07:22.490
stiamo guardando un buco che in realtà è un cane non un gatto.

07:22.490 --> 07:24.280
Se guardi molto da vicino.

07:24.320 --> 07:28.440
Quindi vogliamo vedere che cosa avrebbero previsto le nostre reti neurali nel primo caso.

07:28.460 --> 07:36.110
90% 10% gatto corretto nessun numero di rete al 60% di cane Il 40% di gatto continua a peggiorare.

07:36.110 --> 07:38.230
Rete neurale 1 cane al

07:38.270 --> 07:40.030
Ma corretto.

07:40.280 --> 07:46.040
Seconda opzione prima rete neurale 10 percento cat dog 90 percento cat.

07:46.040 --> 07:47.300
Corretta.

07:47.300 --> 07:53.560
Sapete che il numero al 30 percento del cane è il 70 percento del gatto peggiore, ma comunque corretto.

07:53.570 --> 08:01.460
E poi finalmente la rete neurale nella rete di anni vecchia immagine ha ottenuto il 40% di cane 60% di

08:01.870 --> 08:08.270
gatto errato numero di rete neurale al 10% di cane e 90% di gatto errato e peggio.

08:08.270 --> 08:15.380
le persone della rete si sbagliavano nell'ultima attraverso tutte e tre le immagini, la rete neurale superava la rete neurale.

08:15.620 --> 08:18.870
Quindi la chiave qui è che anche se entrambe

08:18.890 --> 08:27.010
Quindi, anche nell'ultimo caso è stato proprio il caso in cui ha dato al cane una probabilità del 40% rispetto alla rete neurale di

08:27.030 --> 08:32.330
dare al cane solo una probabilità del 10% o una rete neurale che superi le

08:33.200 --> 08:35.310
prestazioni rispetto alla rete neurale 2.

08:35.520 --> 08:41.780
E così ora vedremo le funzioni che possono misurare le prestazioni che abbiamo parlato

08:41.780 --> 08:42.800
della valutazione.

08:43.040 --> 08:48.090
Quindi mettiamoli in una tabella in modo che la rete neurale 1 abbia il numero sbagliato.

08:48.350 --> 08:49.430
Quindi questo è il numero dell'immagine.

08:49.550 --> 08:51.140
E poi per l'immagine che hai.

08:51.140 --> 08:54.010
Che cosa ha previsto il 90 percento di scimpanzè e gatto.

08:54.110 --> 09:00.550
Quindi c'è il cappello di Marable e poi hai il valore reale in modo che il gatto corretto del cane non sia corretto.

09:00.560 --> 09:07.460
Stessa cosa per l'immagine numero due e la stessa cosa per un minimo di tre e lo stesso per la rete neurale numero

09:07.460 --> 09:07.720
due.

09:07.750 --> 09:11.060
Quindi Dog 60 percento ha mantenuto il 40 percento nella prima immagine.

09:11.060 --> 09:13.800
Questo è quello che ha predetto che Crotons era un cane non un gatto.

09:13.820 --> 09:14.820
E così via.

09:15.200 --> 09:18.050
E così ora vediamo quali errori possiamo effettivamente ottenere.

09:18.050 --> 09:24.940
Quindi quali errori possiamo calcolare per stimare le prestazioni e monitorare le prestazioni delle nostre reti.

09:24.950 --> 09:28.480
Quindi un tipo di errore è chiamato errore di classificazione.

09:28.640 --> 09:33.990
E questo è fondamentalmente solo chiedendo se hai capito bene o no.

09:34.010 --> 09:36.940
Indipendentemente dalle probabilità, è appena arrivato.

09:36.950 --> 09:37.970
O hai capito bene.

09:37.970 --> 09:44.790
Quindi in entrambi i casi, per entrambe le reti neurali, ognuno di loro ne ha ottenuto uno.

09:44.810 --> 09:46.330
Quindi è così che ti sbagli.

09:46.340 --> 09:48.460
Quindi hanno sbagliato uno su tre.

09:48.470 --> 09:54.960
Quindi il 33% di errore per la rete 1 e il 30% di errore per la rete neurale.

09:55.100 --> 09:59.750
Come base da questo punto di vista entrambe le reti neurali si comportano allo stesso livello, ma sappiamo che non

09:59.750 --> 10:00.250
è vero.

10:00.260 --> 10:04.400
Sappiamo che la rete neurale Ikhwan sta sovraperformando la rete neurale.

10:05.120 --> 10:10.850
Ecco perché un errore di classificazione non è una buona misura specialmente per gli scopi di errore quadratico medio

10:11.810 --> 10:17.960
di propagazione posteriore diverso e dal modo in cui ho fatto questi calcoli in Excel, non volevo annoiarvi con loro

10:17.960 --> 10:22.010
ma Tony può semplicemente sedersi e fateli su un foglio o in Excel.

10:22.010 --> 10:28.760
Questi sono calcoli molto semplici, basti semplicemente prendere la somma degli errori al quadrato e

10:28.760 --> 10:35.010
quindi basta prendere la media tra le tue osservazioni e questo è praticamente tutto.

10:35.060 --> 10:43.320
Quindi per la rete neurale si ottiene il 25 percento per la rete neurale 2 si ottiene un tasso di errore del 71 percento in modo

10:43.330 --> 10:45.930
da poter vedere che questo è più preciso.

10:45.940 --> 10:50.380
Ci sta dicendo che quasi uno ha un tasso di errore molto più basso della tua rete.

10:51.150 --> 10:52.970
E poi attraversare di nuovo l'entropia.

10:52.990 --> 10:57.250
Abbiamo visto che la formula è anche possibile calcolare questo è in realtà ancora più facile da calcolare rispetto

10:57.250 --> 11:04.780
all'errore quadrato medio L'area trasversale attraverso l'entropia fornisce il 38% per la rete neurale 1 e 1. 6 per la rete neurale 2.

11:04.780 --> 11:05.350
0

11:05.500 --> 11:08.180
Quindi puoi vedere i risultati sono un po 'diversi.

11:08.350 --> 11:16.510
Quando li guardi in quel modo, quando lo guardi, conosci l'area minigonna e l'entropia incrociata e la domanda del perché

11:16.510 --> 11:26.350
dovresti usare l'entropia incrociata sopra significa che l'errore quadrato non riguarda solo il tipo di numeri che dicono, ma tutti questi i calcoli erano

11:26.350 --> 11:32.030
solo per dimostrarti che questo è tutto ciò che è tutto fattibile puoi semplicemente

11:32.050 --> 11:34.680
farlo su un foglio, non è così.

11:34.780 --> 11:37.890
Non è una matematica molto intensa.

11:37.890 --> 11:41.130
Queste sono cose semplici piuttosto semplici.

11:41.200 --> 11:47.680
Ma la domanda sul perché dovresti usare significa causare entropia significa che c'è una domanda molto buona

11:47.680 --> 11:48.250
da chiedere.

11:48.250 --> 11:58.530
Sono contento che tu abbia chiesto che la risposta sia come se ci fossero diversi vantaggi dell'entropia incrociata rispetto all'errore

11:58.540 --> 12:01.430
quadratico medio che non sono ovvi.

12:01.450 --> 12:07.160
E quindi parlerò di un paio, ma poi ti farò sapere dove puoi scoprire di più.

12:07.160 --> 12:18.550
Quindi uno di questi è che se per esempio il tuo all'inizio della propagazione della schiena il tuo valore di output è

12:18.550 --> 12:22.260
molto molto molto molto piccolo molto piccolo.

12:22.360 --> 12:25.680
Quindi è molto più piccolo del valore effettivo che vuoi.

12:25.750 --> 12:32.920
Quindi, all'inizio, il gradiente nel tuo mondo fantastico e dignitoso sarà molto basso e non

12:32.920 --> 12:33.840
sarai abbastanza.

12:33.850 --> 12:40.630
È molto difficile per la rete neurale iniziare effettivamente a fare qualcosa e iniziare a muoversi e iniziare

12:40.630 --> 12:45.010
a regolare quei pesi e avviare Movistar realmente andando nella giusta direzione.

12:45.130 --> 12:50.920
Considerando che quando si utilizza qualcosa come l'entropia della croce perché ha quel logaritmo al suo interno,

12:51.400 --> 12:57.310
in realtà aiuta la rete a valutare anche una piccola area come quella e fare qualcosa al riguardo.

12:57.310 --> 12:58.520
Ecco come pensarci.

12:58.520 --> 13:03.260
Quindi diciamo che di nuovo questo è molto in e in un approccio molto intuitivo.

13:03.410 --> 13:08.830
Ci sarà un collegamento con la matematica e potrai ricavare queste cose attraverso la matematica in modo

13:08.830 --> 13:11.260
più dettagliato ma con un approccio molto intuitivo.

13:11.260 --> 13:16.030
Diciamo che sei come il tuo risultato che vuoi.

13:16.030 --> 13:22.810
È uno e adesso sei a un milionesimo di uno.

13:22.870 --> 13:23.140
Destra.

13:23.170 --> 13:30.790
A $ 0. 00 o ce n'è uno e poi migliorerai la prossima volta che migliorerai il tuo

13:30.790 --> 13:32.680
risultato da un milionesimo a un millesimo.

13:32.860 --> 13:39.330
E in termini di se calcoli l'errore al quadrato devi semplicemente sottrarre l'uno dall'altro.

13:39.610 --> 13:44.980
O fondamentalmente in ogni caso sei Kalka in un quadrato e vedrai che gli errori al quadrato

13:44.980 --> 13:48.210
quando confronti un caso rispetto all'altro non è cambiato molto.

13:48.220 --> 13:51.940
Non hai migliorato la tua rete tanto quando guardi il quadrato medio lì.

13:52.120 --> 13:58.750
Ma se stai guardando l'entropia della croce perché stai facendo un logaritmo e poi lo paragoni

13:58.750 --> 14:01.090
a dividersi l'uno con l'altro.

14:01.390 --> 14:09.390
Vedrai che hai effettivamente migliorato la tua rete in modo significativo, in modo che il salto da un milione a 1000 in

14:09.460 --> 14:12.810
termini di errore medio al quadrato sia molto basso.

14:12.820 --> 14:15.710
Sarà insignificante e non lo sarà.

14:15.790 --> 14:22.270
Non guiderà il processo di aumento gradiente o la propagazione della schiena nella giusta direzione.

14:22.340 --> 14:28.180
Tutto ciò sarà guidato nella giusta direzione, ma sarà come una guida molto lenta,

14:28.540 --> 14:34.960
non avrà abbastanza potenza, mentre se attraversi l'entropia attraverso l'entropia capirai che anche se si tratta

14:34.960 --> 14:42.220
di regolazioni molto piccole che solo tu sai fare un piccolo cambiamento in termini assoluti in termini relativi

14:42.220 --> 14:43.770
è un enorme miglioramento.

14:43.870 --> 14:46.110
E stiamo decisamente andando nella giusta direzione.

14:46.110 --> 14:54.820
Continuiamo così in modo tale che l'entropia incrociata aiuterà la tua rete neurale a raggiungere lo stato ottimale

14:54.820 --> 15:01.090
e sarà un modo migliore per raggiungere la rete neuronale in modo ottimale.

15:01.090 --> 15:08.260
Ma tieni presente che questo funziona solo quando attraverso l'entropia è solo il metodo preferito solo per la classificazione.

15:08.260 --> 15:14.200
Quindi, se stai parlando di cose come la regressione come quella che abbiamo avuto nelle reti neurali artificiali, allora preferiresti

15:14.230 --> 15:20.770
andare con me e quadrare l'errore mentre l'entropia incrociata è meglio per la classificazione e di nuovo ha a che fare con

15:20.770 --> 15:26.200
il fatto che stiamo usando soft la prossima funzione quindi è una sorta di spiegazione intuitiva di ciò

15:26.200 --> 15:31.690
che è un buon posto per imparare un po 'di più sul fatto che, se sei veramente interessato

15:31.690 --> 15:34.740
a sapere perché stiamo usando l'errore quadratico medio contro croce.

15:35.200 --> 15:43.160
Google, un video di Geoffrey Hinton chiama la funzione soft max output e lui lo spiega molto bene e

15:43.160 --> 15:48.760
tu sai che è il padrino del deep learning che può comunque spiegarlo meglio.

15:48.890 --> 15:51.680
E comunque, qualsiasi video di Geoffrey Hinton è d'oro.

15:51.680 --> 15:55.590
Ha solo un enorme talento per spiegare le cose comunque.

15:55.610 --> 16:01.310
Ecco, questo è un po 'morbido contro croce e spero che ti dia una specie di comprensione intuitiva di quello che

16:01.310 --> 16:02.110
sta succedendo qui.

16:02.120 --> 16:08.030
Ma ancora più importante è che non sei scoraggiato dal termine entropia incrociata perché il titolo lo menzionerà nelle

16:08.030 --> 16:11.280
storie pratiche e volevo assicurarmi di essere preparato per quello.

16:11.280 --> 16:15.740
Ed è solo un altro modo per calcolare la tua ultima funzione.

16:15.740 --> 16:21.830
e quindi alle reti neurali convoluzionali e viene di pari passo con la funzione soft max.

16:21.860 --> 16:28.180
E un altro modo di ottimizzare la tua rete, che è specificamente adattato ai problemi di classificazione

16:28.280 --> 16:35.480
Quindi una lettura aggiuntiva se desideri una leggera introduzione nell'entropia incrociata se sei interessato al concentrato un

16:35.480 --> 16:37.170
po 'di più, naturalmente.

16:37.250 --> 16:43.370
Un buon articolo da verificare si chiama introduzione amichevole alla perdita di entropia incrociata di

16:44.180 --> 16:45.280
Rob DePietro 2016.

16:45.350 --> 16:46.860
Ecco il link sottostante.

16:47.150 --> 16:54.350
Molto molto bello molto morbido e niente matematica super complessa.

16:54.440 --> 16:59.660
ti daremo un buona panoramica di una cross entry come da un punto di vista introduttivo.

16:59.660 --> 17:04.910
Buone analogie buoni esempi usando analogie di macchine e guardi macchine e parla di informazioni e

17:04.910 --> 17:10.730
bit e restrizioni e sai come decodificherai questo intero Unico che è così è un buon articolo da

17:10.820 --> 17:11.680
dare un'occhiata e

17:11.900 --> 17:18.590
Se vuoi scavare nella matematica pesante come quello che vedi qui, dai un'occhiata a un articolo di

17:18.680 --> 17:25.180
o un blog su come implementare una rete neurale anche Intermezzo in termini di utilizzo è

17:25.220 --> 17:27.410
come una cosa intermedia come una.

17:27.550 --> 17:28.910
Intermittenza in.

17:28.990 --> 17:35.690
quando vai a un teatro e hai una pausa tra la prima parte e la seconda parte.

17:35.690 --> 17:36.290
Sai come

17:36.350 --> 17:40.820
Quindi perché è come passare attraverso tutti questi passaggi e poi è come e poi

17:40.820 --> 17:42.210
dice che devo spiegarlo prima.

17:42.470 --> 17:44.080
E sì, ecco perché si chiama intermezzo.

17:44.090 --> 17:51.620
Nessun altro motivo per quanto comprendo gli articoli di Peter Rolands 2016, quindi entrambi sono

17:51.620 --> 17:52.470
abbastanza recenti.

17:52.580 --> 18:00.150
E sai, guarda questo se vuoi scavare nella matematica dietro l'entropia di Kross dietro il morbido Max e l'entropia

18:00.150 --> 18:02.600
incrociata in questo articolo in realtà.

18:02.930 --> 18:03.790
Quindi eccoci.

18:03.860 --> 18:07.360
Questo è tutto ciò che c'è da fare per questi due.

18:07.370 --> 18:12.780
Spero di essere riuscito ad aggiungere ulteriore chiarezza e buona fortuna a questo.

18:12.830 --> 18:16.970
Sarà divertente e godrà dei tutorial pratici.

18:16.970 --> 18:18.070
Ci vediamo la prossima volta.

18:18.080 --> 18:19.700
Fino ad allora piace imparare.
