WEBVTT

00:00.640 --> 00:02.940
Cześć i witamy z powrotem na kursie głębokiego uczenia się.

00:02.970 --> 00:09.120
Dzisiaj mówimy o wskazówce, która jest prostowana w twoich jednostkach i jest to dodatkowy

00:09.120 --> 00:12.180
krok na szczycie naszego kroku splotu.

00:12.180 --> 00:16.140
Więc to nie jest oddzielny duży krok, to mały krok w pierwszym kroku.

00:16.290 --> 00:18.230
I co tu się dzieje.

00:18.240 --> 00:24.090
Mamy nasz obraz wejściowy, który wszyscy mamy splot, o którym mówiliśmy, a

00:24.090 --> 00:26.080
następnie będziemy go stosować.

00:26.400 --> 00:27.190
Czekaj na to.

00:27.240 --> 00:36.720
Nasza ulubiona funkcja prostownika i znasz funkcję prostownika z poprzedniej sekcji na temat sztucznych sieci

00:36.750 --> 00:47.400
neuronowych iw naszych Czasami autorzy lub instruktorzy dzielą splot i bezpośredni ogień jako dwa osobne kroki w

00:47.430 --> 00:54.030
naszych przykładach, które uznają je za słuszne jeden duży krok dla

00:54.030 --> 00:57.060
drugiej ewolucji, potem prostownik.

00:57.270 --> 01:03.750
Powodem, dla którego stosujemy prostownik, jest to, że chcemy zwiększyć nieliniowość w naszym obrazie lub

01:03.780 --> 01:13.410
w naszej sieci i naszej komercyjnej sieci neuronowej, a nasz ogień działa jako ten filtr lub dostęp do tej funkcji, która rozpada

01:13.440 --> 01:19.200
się, a ty, arion i powodem, dla którego chcemy zwiększyć nieliniowość w

01:19.440 --> 01:25.950
naszej sieci, jest to, że same obrazy są wysoce nieliniowe, zwłaszcza jeśli rozpoznajesz różne obiekty

01:26.010 --> 01:32.790
obok siebie lub tylko na tle i takie tam, jak obraz będzie miał wiele nieliniowych

01:33.180 --> 01:38.050
elementów a przejście między pikselami sąsiadującymi pikselami jest często nieliniowe.

01:38.040 --> 01:41.280
To wiesz, ponieważ jego granice różnią się od siebie kolorami.

01:41.460 --> 01:46.020
Na twoich obrazach są różne elementy, ale w tym

01:46.020 --> 01:52.410
samym czasie, gdy stosujemy matematyczną operację, taką jak splot, który znasz i uruchamiasz wykrywanie

01:52.710 --> 01:59.710
cech, aby stworzyć nasze mapy funkcji, ryzykujemy, że stworzymy coś liniowego i dlatego musimy zerwać narracja.

01:59.970 --> 02:05.960
Spójrzmy więc na przykład na obraz i oryginalny obraz.

02:05.970 --> 02:13.220
Teraz, gdy zastosujemy detektor wykrywania cech tego obrazu, otrzymujemy coś takiego.

02:13.290 --> 02:16.230
Więc widać tutaj, że czarny to negatywny biały, to także wartość dodatnia.

02:16.230 --> 02:22.980
Kiedy zastosujesz wykrywacz obiektów do podobnego obrazu, który ma nie tylko zera i jedynek, ale ma wiele

02:22.980 --> 02:28.890
różnych wartości i aplikujesz, jak widzieliśmy wcześniej, Texas może mieć ujemne wartości w sobie,

02:29.070 --> 02:30.920
czasami otrzymasz wartości ujemne.

02:31.080 --> 02:34.670
A tutaj czarne są negatywne, białe są pozytywne.

02:34.800 --> 02:45.240
A funkcja wyprostowanej jednostki liniowej usuwa wszystkie czarne prawa w czymkolwiek poniżej zera, a następnie zamienia się

02:45.240 --> 02:46.490
w zero.

02:46.560 --> 02:49.160
I z tego wynika to prawo.

02:49.290 --> 02:57.990
I tak trudno jest zobaczyć, jaka jest dokładnie korzyść pod względem zerwania

02:58.050 --> 02:58.910
liniowości.

02:59.400 --> 03:01.050
Spróbuję wyjaśnić.

03:01.080 --> 03:07.740
Spróbuję pokazać przykład na tym obrazie, ale pod koniec dnia jest to bardzo matematyczna koncepcja i

03:07.740 --> 03:12.480
musiałaby przejść wiele matematyki, aby naprawdę wyjaśnić, co się dzieje.

03:12.480 --> 03:13.800
Ale spróbujmy, popatrzmy.

03:13.800 --> 03:16.800
A więc na przykład spójrzmy na to.

03:16.860 --> 03:17.580
Ten budynek tutaj.

03:17.580 --> 03:18.070
Dobrze.

03:18.090 --> 03:20.150
Więc to jest budynek sam w sobie.

03:20.730 --> 03:22.400
Wtedy możesz zobaczyć ten cień.

03:22.440 --> 03:29.010
Ta czarna część tego cienia tutaj dobrze widzi, że to białe odbicie światła, a potem jest szara, a

03:29.010 --> 03:33.160
potem robi się ciemniejsza, a potem znowu robi się ciemniejsza.

03:33.240 --> 03:35.860
Tak więc, kiedy ją wyciągamy, wyciągamy tę czarną plamę.

03:35.860 --> 03:38.220
Pomyśl o tym w kategoriach liniowości właściwej.

03:38.250 --> 03:43.700
Wygląda na to, że kiedy przejdziesz od białego do szarego, następny krok będzie czarny.

03:43.740 --> 03:50.970
Prawo do następnego jest czarne, jest to liniowy postęp od jasnego do ciemnego i dlatego

03:50.970 --> 03:53.490
jest to sytuacja liniowa.

03:53.490 --> 03:56.560
Kiedy wyjmiesz czarny, przełamiesz liniowość.

03:56.670 --> 03:57.800
Spróbujmy innego.

03:58.050 --> 03:59.110
Spójrzmy tutaj.

03:59.220 --> 04:01.980
A jednocześnie wciąż ten sam budynek jest właściwy.

04:01.980 --> 04:08.320
Nie chodzi o to, że ty lub twoja nie lubicie mieszania dwóch budynków ze sobą, ale

04:08.550 --> 04:09.810
to jest drugorzędne.

04:09.810 --> 04:11.940
Głównym punktem jest zerwanie liniowości.

04:12.210 --> 04:13.590
Spójrzmy więc na to samo.

04:13.590 --> 04:19.480
Więc widzisz biały szary czarny szary biały.

04:19.590 --> 04:22.520
A kiedy to rozwiążesz, już tego nie masz.

04:22.530 --> 04:29.600
Nie masz tego progresywnego progresu, który po prostu masz jak nagłą zmianę.

04:29.730 --> 04:33.540
Pomaga to wprowadzić nieliniowość w obrazie.

04:33.540 --> 04:42.540
Jest to bardzo szorstkie wytłumaczenie, bardzo podobne do wyjaśnienia na palcach, a nie techniczne, ale mam nadzieję, że

04:42.690 --> 04:47.370
pomaga to lepiej zrozumieć, o czym tu mówimy.

04:47.370 --> 04:54.870
Więc tutaj znowu widzisz biały szary jest lepszym przykładem nawet do jasnego ciemniejszego ciemniejszego ciemniejszego i ciemniejszego

04:54.980 --> 04:55.680
ciemniejszego.

04:55.680 --> 05:04.460
Tak więc ta część wygląda na cieńszą, niż to rozbijasz, więc jest to bardzo szorstkie wyjaśnienie.

05:04.480 --> 05:08.570
Nie jest absolutnie doskonały, ale przynajmniej daje ci wyobrażenie o tym, co się dzieje.

05:08.800 --> 05:14.120
Ale jeśli chcesz dowiedzieć się więcej, masz dobry papier, ponieważ zawsze jest papier.

05:14.200 --> 05:20.370
Ten jest przez korpus CCJ z University of California i nazywa się Zrozumienie splotowych sieci

05:20.380 --> 05:22.980
neuronowych, które mają model matematyczny.

05:23.200 --> 05:28.840
I w gruncie rzeczy to On odpowiada na pytania i musisz po prostu spojrzeć na pierwszą.

05:28.840 --> 05:33.820
Pytanie brzmi, dlaczego nie jest niezbędna nieliniowa funkcja aktywacji na wyjściu

05:33.820 --> 05:36.130
filtra wszystkich warstw pośrednich.

05:36.220 --> 05:44.280
Taki rodzaj wyjaśnia to nieco bardziej szczegółowo zarówno pod względem intuicji, jak i głównie w zakresie matematyki.

05:44.320 --> 05:47.970
To interesujący artykuł, w którym można uzyskać dodatkowe informacje na ten temat.

05:48.100 --> 05:53.360
A jeśli naprawdę chcesz zagłębić się i odkryć kilka fajnych rzeczy tutaj.

05:53.360 --> 05:55.690
Jest jeszcze inny artykuł, który może Cię zainteresować.

05:55.690 --> 06:01.720
Nazywa się to zagłębianiem się w prostownik przekraczający poziom ludzki na obrazie i

06:01.720 --> 06:02.830
tej klasyfikacji.

06:02.920 --> 06:09.190
I tutaj autor przeczesuje włosy i inne z Microsoft Research.

06:09.400 --> 06:17.630
Proponują inny rodzaj rektyfikowanej funkcji jednostki szczuplejszej.

06:17.650 --> 06:21.830
Proponują parametrycznie wyprostowaną funkcję, którą widzicie tutaj po prawej stronie.

06:22.030 --> 06:26.740
Twierdzą, że zapewnia lepsze wyniki bez obniżania wydajności.

06:26.740 --> 06:30.200
Tak interesująca lektura, jeśli chcesz trochę pogłębić ten temat.

06:30.490 --> 06:32.020
I to wszystko na dzisiaj.

06:32.280 --> 06:38.380
Naprawdę, warstwa jest dość prosta, więc do regulacji wystarczy zastosowanie funkcji prostownika i czekam na ciebie

06:38.380 --> 06:39.230
następnym razem.

06:39.250 --> 06:40.770
Do tego czasu cieszcie się nauką.
