WEBVTT

00:00.390 --> 00:03.060
Hola y bienvenidos al curso de aprendizaje profundo.

00:03.120 --> 00:06.010
Así que hemos aprendido bastante en esta sección del curso.

00:06.030 --> 00:08.390
Vamos a resumir de lo que hemos hablado.

00:08.580 --> 00:09.920
Muy bien, así que aquí vamos.

00:10.110 --> 00:16.230
Comenzamos con una imagen de entrada a la que aplicamos múltiples detectores de funciones diferentes o también

00:16.230 --> 00:19.100
llamados filtros para crear estos mapas de características.

00:19.140 --> 00:21.530
Y esto comprende nuestra guarida convolucional.

00:21.630 --> 00:28.910
unidad linear de rectuación o rectificación para eliminar cualquier claridad o aumentar la no linealidad en nuestras imágenes.

00:28.980 --> 00:32.050
Luego, además de ese crucial Lehre, aplicamos la

00:32.060 --> 00:36.970
Luego aplicamos una guarida de puesta en común a nuestra guarida convolucional.

00:36.990 --> 00:44.910
Entonces, desde cada mapa de características, creamos un mapa de funciones extraído y, básicamente, la extracción de Lehre tiene

00:44.910 --> 00:45.840
muchas ventajas.

00:45.840 --> 00:54.150
El objetivo principal de tirar Lair es asegurarse de que tenemos invariantes espaciales especiales en nuestras

00:54.330 --> 00:54.690
imágenes.

00:54.690 --> 01:01.890
Así que, básicamente, si algo se inclina o gira o es un poco diferente al escenario ideal, entonces aún

01:01.890 --> 01:07.210
podemos retomar esa característica, además de tirar reduce significativamente el tamaño de nuestras imágenes.

01:07.260 --> 01:15.360
También la agrupación ayuda a evitar cualquier tipo de sobreajuste de nuestros datos o el modelo general de los datos, ya que

01:15.360 --> 01:18.220
simplemente elimina una gran cantidad de esos datos.

01:18.450 --> 01:24.300
Pero al mismo tiempo, la agrupación conserva las principales características que buscamos solo porque la forma en que se usaron las instrucciones

01:24.330 --> 01:26.720
y la puesta en común fue la agrupación máxima.

01:26.970 --> 01:35.760
Luego aplanamos todas las imágenes agrupadas en un vector largo o columna de todos estos valores y lo pusimos en

01:35.760 --> 01:40.140
una red neuronal artificial y eso fue un aplanamiento gradual.

01:40.140 --> 01:46.770
tenemos esta última capa final completamente conectada de Lehre que realiza la votación hacia las clases que estamos buscando

01:46.920 --> 01:53.700
y luego todo esto está entrenado a través de un proceso de propagación hacia adelante y de propagación hacia atrás.

01:53.910 --> 02:00.630
Y el Paso 4 es una red neuronal artificial totalmente conectada donde todas estas características se procesan a través

02:00.720 --> 02:02.550
de una red y luego

02:02.580 --> 02:09.730
Muchas porciones de iteraciones y en parques, y al final tenemos una red neuronal muy bien definida.

02:09.920 --> 02:10.470
Y.

02:10.730 --> 02:14.850
Otra cosa importante es que no solo se entrenan los pesos en la parte de trabajo

02:15.180 --> 02:22.590
de las neuronas artificiales, sino que también los detectores de funciones se entrenan y se ajustan en ese mismo proceso decente de ingredientes y eso nos permite obtener

02:22.590 --> 02:23.930
los mejores mapas de características.

02:23.940 --> 02:31.110
al final obtenemos una red neuronal convolucional completamente entrenada que puede reconocer imágenes y clasificarlas.

02:31.110 --> 02:31.700
Y

02:31.770 --> 02:32.360
Entonces ahí vamos

02:32.370 --> 02:35.480
Así es como funcionan las redes neuronales convolucionales.

02:35.730 --> 02:42.220
Y ahora debe sentirse totalmente cómodo con este concepto y listo para continuar con las aplicaciones prácticas.

02:42.330 --> 02:51.370
Si desea leer un poco más, hay un excelente blog de L. RE. para disolver a partir de 2016.

02:51.450 --> 02:53.400
Puedes ver el enlace arriba en la parte inferior.

02:53.400 --> 02:58.360
Así que el blog se llama Los Nueve documentos de aprendizaje profundo que necesita saber sobre la comprensión de la tercera

02:58.440 --> 02:59.180
parte de CNN.

02:59.310 --> 03:04.860
Y este blog en realidad le da una breve descripción de nueve CNN diferentes que han

03:04.860 --> 03:10.590
sido creadas por personas como usted y Licken y otros que luego puede continuar y estudiar más.

03:10.590 --> 03:18.000
Así que habrá muchas cosas nuevas que serán totalmente nuevas para ti y que tendrás que entender, pero solo ten en

03:18.000 --> 03:23.880
cuenta este blog, estos nueve documentos en mente e incluso si no estás listo para revisar en

03:23.880 --> 03:29.220
este momento, tal vez después de los tutoriales prácticos, después de hacer un poco de

03:29.490 --> 03:36.180
capacitación adicional en el aprendizaje profundo, puede hacer referencia a estos trabajos y, a ser posible, creo que obtendrá

03:36.180 --> 03:41.360
mucho valor al observar las redes neuronales de otras personas y cómo estructuran .

03:41.550 --> 03:46.620
redes neuronales porque las redes neuronales y las redes neuronales convolucionales no son la excepción.

03:46.620 --> 03:51.870
Puede haber redes ilusorias que te ayuden a comprender cuáles son las mejores prácticas y

03:51.870 --> 03:57.900
por qué las personas hicieron ciertas cosas de cierta manera y eso te ayudará con tu arquitectura de

03:58.020 --> 04:05.670
Son como un desafío de arquitectura, tienes que idear una idea y luego estructurarla y luego ajustarla y

04:05.670 --> 04:11.780
modificarla para obtener el mejor diseño posible y el mejor rendimiento posible y óptimo.

04:11.790 --> 04:12.490
Entonces ahí vamos

04:12.510 --> 04:13.430
Ésos somos nosotros por hoy.

04:13.420 --> 04:17.720
Espero que hayan disfrutado el tutorial de hoy y toda esta sección y espero verlos la próxima vez.

04:17.730 --> 04:19.440
Hasta entonces disfruta del aprendizaje profundo.