WEBVTT

00:00.480 --> 00:03.150
مرحبًا بكم ومرحبًا بكم مرة أخرى في الدورة التدريبية حول التعلم العميق اليوم.

00:03.150 --> 00:08.730
نحن نتحدث عن Max pooling ولدينا بعض الشرائح المثيرة للغاية القادمة وحتى مفاجأة خاصة

00:08.730 --> 00:10.800
في نهاية البرنامج التعليمي.

00:10.800 --> 00:12.260
اذا هيا بنا نبدأ.

00:12.270 --> 00:15.780
السؤال الأول هو ما هو التجميع ولماذا نحتاج إليه؟

00:15.810 --> 00:18.540
حسنًا ، للإجابة على هذا السؤال ، دعونا نلقي نظرة على هذه الصور.

00:18.540 --> 00:20.640
في هذه الصور الثلاث ، لدينا فهد.

00:20.640 --> 00:23.580
في الواقع ، إنه نفس الفهد بالضبط في الصورة الأولى.

00:23.580 --> 00:26.130
تم وضع الصورة بشكل صحيح.

00:26.220 --> 00:27.900
الفهد ينظر إليك مباشرة.

00:27.900 --> 00:32.490
في الصورة الثانية ، تم تدويرها قليلاً والصورة الثالثة مضغوطة قليلاً.

00:32.490 --> 00:39.960
والشيء هنا هو أننا نريد أن تكون الشبكة العصبية قادرة على التعرف على الفهد في كل واحدة

00:39.960 --> 00:41.190
من هذه الصور.

00:41.190 --> 00:43.170
في الحقيقة ، هذا مجرد فهد واحد.

00:43.170 --> 00:45.030
ماذا لو كان لدينا الكثير من الفهود المختلفة؟

00:45.030 --> 00:45.960
هذا هو الفهد.

00:45.960 --> 00:47.160
هذا هو الفهد.

00:47.160 --> 00:48.480
ها هو فهد آخر.

00:48.510 --> 00:51.420
ها هو فهد ، ها هو فهد وها هو فهد.

00:51.420 --> 00:55.860
ونريد أن تتعرف الشبكة العصبية على كل هذه الفهود على أنها فهود.

00:55.980 --> 01:01.710
وكيف يمكنها فعل ذلك إذا كانوا جميعًا ينظرون في اتجاهات مختلفة؟

01:01.710 --> 01:04.050
كلهم في أجزاء مختلفة من الصورة.

01:04.050 --> 01:06.990
إنهم مثل وجوههم موضوعة في أجزاء مختلفة من الصورة.

01:06.990 --> 01:10.560
شخص ما على الجانب الأيمن ، شخص ما في الزاوية اليسرى ، شخص ما في المنتصف.

01:10.860 --> 01:12.390
كلهم مختلفون بعض الشيء.

01:12.480 --> 01:16.110
الملمس مختلف قليلاً ، والإضاءة مختلفة قليلاً.

01:16.110 --> 01:17.340
هناك الكثير من الاختلافات الصغيرة.

01:17.340 --> 01:23.130
وبالتالي ، إذا كانت الشبكة العصبية تبحث عن ميزة معينة بالضبط ، على سبيل

01:23.130 --> 01:31.740
المثال ، فإن السمة المميزة للفهد هي الدموع التي على وجهها تنطلق من العيون أو الظلال التي تبدو مثل الدموع ،

01:31.740 --> 01:36.090
والملمس ، والنمط الذي هو تنطلق من عينيه إلى الأسفل.

01:36.090 --> 01:37.740
إنه بحجم أنفه.

01:37.740 --> 01:38.430
يبدو مثل الدموع.

01:38.430 --> 01:40.680
هذه سمة مميزة للفهد.

01:40.680 --> 01:48.600
ولكن إذا كانت تبحث عن هذه الميزة ، التي تعلمتها من بعض الفهود في مكان محدد أو في شكل أو شكل

01:48.600 --> 01:53.190
أو نسيج دقيق ، فلن تجد هذه الفهود الأخرى أبدًا.

01:53.190 --> 02:01.380
لذلك علينا التأكد من أن شبكتنا العصبية لها خاصية تسمى الثبات المكاني ، مما يعني أنها

02:01.380 --> 02:10.320
لا تهتم بمكان وجود الميزات ، وليس بقدر ما هو جزء من الصورة ، لأننا التقطنا نوعًا ما هذا في الاعتبار

02:10.320 --> 02:16.560
مع خريطتنا ، مع موقعنا ، مع الطبقة التلافيفية.

02:16.560 --> 02:23.340
لكن ليس من الضروري أن تهتم إذا كانت الميزات مائلة قليلاً ، أو إذا كانت الميزات مختلفة قليلاً في النسيج

02:23.340 --> 02:30.150
، أو إذا كانت الميزات أقرب قليلاً ، أو إذا كانت الميزات متباعدة قليلاً بالنسبة لبعضها البعض.

02:30.150 --> 02:37.200
لذلك إذا كانت الميزة نفسها مشوهة بعض الشيء ، يجب أن تتمتع شبكتنا العصبية بمستوى معين من المرونة لتظل

02:37.200 --> 02:42.120
قادرة على العثور على هذه الميزة ، وهذا هو ما يدور حوله التجميع.

02:42.510 --> 02:44.880
لذلك دعونا نلقي نظرة على كيفية عمل التجميع.

02:44.880 --> 02:46.080
ها هي خريطتنا المميزة.

02:46.080 --> 02:52.470
لقد قمنا بالفعل بالالتفاف وأكملنا هذا الجزء ونحن الآن نعمل مع الطبقة التلافيفية.

02:52.500 --> 02:53.820
الآن سنقوم بتطبيق التجميع.

02:53.820 --> 02:54.600
فكيف يعمل؟

02:54.600 --> 02:56.280
سنقوم بتطبيق أقصى تجمع.

02:56.550 --> 03:01.140
هناك عدة أنواع مختلفة من التجميع يمكن تطبيقها وهي تعني التجميع ، والتجميع الأقصى ، وبعض التجميعات

03:01.140 --> 03:03.360
وسنعلق عليها في نهاية هذا البرنامج التعليمي.

03:03.360 --> 03:05.010
لكن في الوقت الحالي نحن فقط نطبق أقصى تجميع.

03:05.010 --> 03:12.240
لذلك نأخذ مربعًا من 2 × 2 بكسل على هذا النحو ، ومرة أخرى ، لا يجب أن يكون 2 × 2.

03:12.270 --> 03:13.470
يمكنك اختيار أي حجم للصندوق.

03:13.470 --> 03:18.360
ومرة أخرى ، سنعلق على ذلك قرب نهاية التجربة وتضعه في أعلى الزاوية

03:18.360 --> 03:21.840
اليسرى وستجد القيمة القصوى في هذا المربع.

03:21.840 --> 03:26.100
وبعد ذلك تقوم بتسجيل تلك القيمة فقط وتتجاهل الثلاثة الأخرى.

03:26.100 --> 03:30.420
إذن في صندوقك لديك أربع قيم ، تتجاهل ثلاثة فقط ، وتحتفظ بواحد فقط كحد أقصى ، وهو

03:30.420 --> 03:31.530
واحد في هذه الحالة.

03:31.530 --> 03:36.000
ثم تقوم بتحريك الصندوق الخاص بك إلى اليمين بخطوة ، تقوم بتحديد الخطوة مرة أخرى.

03:36.000 --> 03:41.010
لذلك نختار خطوة من خطوتين ، وهذا ما تختاره عادة.

03:41.010 --> 03:42.780
يمكنك تحديد خطوة واحدة ، يمكنك الاختيار.

03:42.780 --> 03:44.310
لذلك هناك مربعات متداخلة.

03:44.310 --> 03:48.090
يمكنك تحديد أي نوع من الخطوات التي تريدها ، حتى ثلاث خطوات إذا أردت.

03:48.600 --> 03:52.290
لكننا نختار خطوة من خطوتين هنا ، وهذا هو الشائع الاستخدام.

03:52.290 --> 03:53.850
ثم كرر العملية.

03:53.850 --> 03:55.770
يمكنك تسجيل الحد الأقصى هنا.

03:55.770 --> 03:59.880
إذا تجاوزت الأمر ولم يكن الأمر مهمًا ، فما عليك سوى الاستمرار في فعل ما تفعله.

03:59.880 --> 04:07.230
إذن ما زلت تسجل الحد الأقصى هنا ، صفر هنا ، والحد الأقصى هو أربعة هنا ، والحد الأقصى هو اثنان

04:07.230 --> 04:10.740
هنا ، والحد الأقصى هو 10102 ثم واحد.

04:11.190 --> 04:13.920
لذا كما ترون ، حدثت بعض الأشياء.

04:13.920 --> 04:18.360
بادئ ذي بدء ، ما زلنا قادرين على الحفاظ على الميزات ، أليس كذلك؟

04:18.930 --> 04:23.670
العدد الأقصى الذي يمثلونه لأننا نعرف كيف تعمل طبقة الالتفاف.

04:23.670 --> 04:28.590
نحن نعلم أن الأرقام الكبيرة أو القصوى في خريطة المعالم الخاصة بك تمثل المكان

04:28.590 --> 04:31.410
الذي عثرت فيه بالفعل على أقرب تشابه للميزة.

04:31.410 --> 04:38.190
ولكن من خلال تجميع هذه الميزات ، فإننا أولاً وقبل كل شيء ، نتخلص من 75٪ من المعلومات.

04:38.190 --> 04:46.170
هذه ليست الميزة التي ليست هي الأشياء المهمة التي نبحث عنها لأننا نتجاهل ثلاثة بيكسلات

04:46.170 --> 04:51.240
من أصل أربعة ، لذلك نحن نحتفظ بنسبة 25٪ فقط.

04:51.240 --> 04:59.880
وبعد ذلك أيضًا لأننا نأخذ الحد الأقصى من وحدات البكسل أو القيم التي نأخذها.

05:00.480 --> 05:04.080
لذلك نحن نتحمل مسؤولية أي تشويه.

05:04.080 --> 05:11.880
على سبيل المثال ، صورتان فيهما ، على سبيل المثال ، دموع الفهد على عينيه.

05:12.060 --> 05:15.480
في صورة واحدة هناك قليلا إلى اليسار أو قليلا إلى اليسار.

05:15.480 --> 05:16.080
وواحدة أخرى.

05:16.080 --> 05:21.330
هناك القليل وهناك كيف من المفترض أن يكونوا أو كيف نحب إذا أخذنا أحدهما كأساس ثم الآخر

05:21.330 --> 05:26.490
هناك والذي يدور إلى اليسار ، فإن الميزة المجمعة ستكون هي نفسها تمامًا.

05:26.490 --> 05:30.360
لذلك يمكنك أن ترى هنا ما إذا كنا نتحدث عن الغشاشين أم لا.

05:30.360 --> 05:34.110
لنفترض إذن أن هذا هو الأربعة وهذا هو المكان الذي كان فيه هنا.

05:34.110 --> 05:35.970
ثم إذا تم استدارة قليلا.

05:35.970 --> 05:41.010
على سبيل المثال ، انتهى الأمر بالأربعة هنا ، ثم عندما نقوم بالتجميع ، سنستمر في الحصول على

05:41.010 --> 05:42.690
نفس خريطة الميزات المجمعة.

05:42.960 --> 05:46.140
وهذا نوع من المبدأ الكامن وراءه.

05:46.410 --> 05:51.930
إنه تفسير تقريبي للغاية ، مرة أخرى ، تفسير بديهي ، ولكن هذه هي نقطة التجميع

05:51.930 --> 06:00.210
التي ما زلنا قادرين على الحفاظ على الميزات ، علاوة على ذلك ، حساب احتمالها المكاني أو التركيبي أو أي نوع

06:00.210 --> 06:02.130
آخر من التشوهات.

06:02.130 --> 06:05.730
بالإضافة إلى كل ذلك ، نحن بصدد تقليل الحجم.

06:05.730 --> 06:07.290
لذلك هناك فائدة أخرى.

06:07.290 --> 06:12.900
لذا فنحن نحافظ على الميزات ، ونقدم الثوابت المكانية ، ونقلص الحجم

06:12.900 --> 06:19.470
بنسبة 75٪ ، وهو حجم ضخم ، وهو ما سيساعدنا حقًا فيما يتعلق بالمعالجة.

06:19.470 --> 06:25.050
علاوة على ذلك ، هناك فائدة أخرى للتجميع وهي تقليل عدد المعلمات.

06:25.050 --> 06:27.750
لذا فإننا نخفض مرة أخرى بنسبة 75٪.

06:27.750 --> 06:32.370
نحن نعمل على تقليل عدد المعلمات التي ستدخل في طبقاتنا النهائية للشبكة العصبية

06:32.370 --> 06:35.160
، وبالتالي فإننا نمنع التخصيص الزائد.

06:35.160 --> 06:41.100
إنها ميزة مهمة جدًا للتجميع أننا نزيل المعلومات.

06:41.100 --> 06:42.510
وهذا أمر جيد.

06:42.510 --> 06:50.610
هذا أمر جيد لأنه بهذه الطريقة لن يكون نموذجنا قادرًا على احتواء تلك المعلومات لأنه على وجه الخصوص لأن هذه

06:50.610 --> 06:52.620
المعلومات ليست ذات صلة.

06:52.620 --> 06:57.060
تذكر ، كما في البداية التي كنا نتحدث عنها حتى بالنسبة لنا كبشر ، من المهم

06:57.060 --> 07:02.370
أن نرى الميزات بالضبط بدلاً من كل هذه الضوضاء الأخرى التي تأتي إلى أعيننا.

07:02.550 --> 07:04.440
حسنًا ، نفس الشيء بالنسبة للشبكات العصبية.

07:04.440 --> 07:12.090
إنهم من خلال تجاهل المعلومات غير الضرورية غير المهمة ، فنحن نساعد في منع فرط التجهيز.

07:12.240 --> 07:12.990
حتى يذهبوا.

07:12.990 --> 07:14.520
هذا هو ما هو التجمع.

07:14.520 --> 07:18.720
والسؤال هنا بالطبع لماذا؟

07:18.720 --> 07:19.800
لماذا ماكس بولنج ، صحيح.

07:19.800 --> 07:25.020
هناك الكثير من الأنواع المختلفة للتجميع ولماذا حاولت منفرجًا معرفة سبب وجود الكثير من كل هذه

07:25.020 --> 07:26.520
الأشياء بحجم 2 × 2 بكسل.

07:26.520 --> 07:33.900
وفي هذه الملاحظة ، أود أن أقدم لكم هذه الورقة البحثية الرائعة المسماة تقييم عمليات التجميع

07:33.900 --> 07:40.890
في البنى التلافيفية للتعرف على الأشياء من قبل دومينيك شيرير من جامعة بون.

07:40.890 --> 07:47.460
هناك الرابط ، والجميل في هذه الورقة أنها بسيطة جدًا ومباشرة جدًا.

07:47.460 --> 07:51.480
لذا ، إذا لم تقرأ ورقة بحث من قبل ، فما الذي ترغب في تجربته؟

07:51.480 --> 07:53.760
إنه مكان مدهش كبداية.

07:53.760 --> 07:56.790
إنها قصيرة جدًا ، عشر صفحات فقط ، سهلة القراءة جدًا.

07:56.790 --> 08:02.610
بالإضافة إلى ذلك ، الميزة الإضافية هي أننا الآن بعد أن ناقشنا الالتفاف والتجميع ، ستكون

08:02.610 --> 08:05.880
مرتاحًا تمامًا لكل ما يتحدثون عنه في هذه الورقة.

08:05.880 --> 08:09.360
وهذه طريقة رائعة لتعزيز معرفتك.

08:09.360 --> 08:11.550
لذلك أوصي بشدة بمراجعة هذه الورقة.

08:11.700 --> 08:17.520
سأستغرق 20 دقيقة لقراءته ويمكنك حتى تخطي الجزء الثاني ، والذي يسمى العمل ذي الصلة.

08:17.520 --> 08:19.800
إذا شعرت بقليل من الاحتمال أو الاغتراب.

08:19.800 --> 08:20.970
فقط لا تقرأ هذا الجزء.

08:20.970 --> 08:23.610
فقط انتقل مباشرة من الجزء الأول إلى الجزء الثالث.

08:23.610 --> 08:29.670
وشيء واحد تحتاج لمعرفته حول هذه الورقة ، يتحدثون عن مفهوم يسمى أخذ العينات الفرعية حيث أخذ العينات

08:30.300 --> 08:33.150
الفرعية هو في الأساس متوسط التجميع.

08:33.150 --> 08:37.320
لذا تذكر كيف أننا هنا كنا نأخذ أقصى ما في الأمر.

08:37.320 --> 08:39.870
إذن في المربع ، كنا نأخذ القيمة القصوى.

08:39.870 --> 08:42.990
هناك مفهوم يسمى يعني التجميع أو بعض التجميع.

08:42.990 --> 08:46.740
بعض التجميع هل أنت فقط بعض هذه القيم يصل متوسط التجميع أو يعني التجميع؟

08:46.740 --> 08:53.850
تأخذ متوسط القيمة من كل هذه والعينات الفرعية يشبه نوعًا ما تعميم تجميع المتوسط.

08:53.850 --> 09:00.780
إنه نوع من المقاربة المعممة لأخذ متوسط هذه القيم.

09:00.780 --> 09:05.250
ويمكنك قراءة المزيد عنها في الصحيفة ، ولكن بخلاف ذلك ، فكر في الأمر على أنه متوسط تجميع عندما

09:05.250 --> 09:06.390
تقرأ تلك الورقة.

09:06.720 --> 09:09.690
ومن هنا يمكنك الحصول على بعض المعلومات الإضافية حول هذا الموضوع.

09:09.690 --> 09:12.270
والآن دعونا نلخص نوعًا ما من أين وصلنا؟

09:12.270 --> 09:14.070
إذن هناك صورة المدخلات لدينا.

09:14.610 --> 09:18.870
ثم طبقنا عملية الالتواء ونحصل على طبقة الالتواء.

09:18.870 --> 09:24.090
والآن على كل من خرائط المعالم التي حصلنا عليها ، قمنا بتطبيق طبقة التجميع.

09:24.090 --> 09:30.330
لذلك ، لقد قمنا بهاتين الخطوتين الالتفاف والتجميع ، والآن سنقوم بشيء ممتع

09:30.330 --> 09:31.920
للغاية ، شيء مثير.

09:31.920 --> 09:34.380
سنقوم بتجربة هذا.

09:34.380 --> 09:44.550
هذه لقطة شاشة أخذتها من أداة أنشأها آدم هارلي من الخلف عندما كان في جامعة رايرسون لعلوم الكمبيوتر والآن هو في

09:44.550 --> 09:50.910
جامعة كارنيجي ميلون ، على ما أعتقد ، يحضر الدكتوراه وأداة رائعة.

09:50.910 --> 09:52.410
لذلك دعونا نفتح.

09:52.410 --> 09:54.090
دعنا نلقي نظرة حتى تتمكن من العثور عليها.

09:54.090 --> 09:55.680
لا يمكنك العثور عليه بالفعل من خلال Google.

09:55.680 --> 09:57.450
عليك أن تعرف URL.

09:57.450 --> 09:59.370
من الصعب العثور عليه.

09:59.480 --> 10:01.010
من خلال Google لأنه لا يوجد نص هنا.

10:01.160 --> 10:03.950
SC حسنًا ، فقط عنوان URL هذا.

10:04.130 --> 10:08.270
CS Dot Ryerson Dossier ثم هذه الأشياء في النهاية.

10:08.270 --> 10:11.930
وهذا هو بالضبط ما نفعله.

10:11.930 --> 10:12.620
لكن تخيل.

10:12.620 --> 10:14.330
لذلك هنا تحتاج إلى رسم رقم.

10:14.330 --> 10:21.290
لنفترض أنني رسمت الرقم أربعة وستضع هذه الأداة الرقم أربعة هنا.

10:21.290 --> 10:24.080
هذه صورتك في خطوتنا الأولى.

10:24.080 --> 10:26.990
ثم هذه هي خطوة الالتفاف ، أليس كذلك؟

10:26.990 --> 10:28.130
وهذه هي خطوة التجميع.

10:28.130 --> 10:30.320
وبالمناسبة ، فإن التجميع أيضًا يسمى الاختزال.

10:30.320 --> 10:33.350
لذا فإن التجميع والاختزال هما نفس الأشياء.

10:33.860 --> 10:39.050
حتى تتمكن من رؤية الالتفاف المطبق ، ثم التجميع المطبق ويمكنك أن ترى كيف يعمل بالضبط.

10:39.050 --> 10:44.330
لذا يمكنك أن ترى أي نوع من التلافيفات التي طبقتها أو نوع المرشحات التي طبقتها ، كيف

10:44.330 --> 10:44.780
تبدو.

10:44.780 --> 10:50.570
يمكنك معرفة الميزات التي تبحث عنها ثم يتم تطبيقها ، وتجميعها ، وبالتالي فهي تقلل الحجم.

10:50.570 --> 10:53.300
ويمكنك أن ترى هنا أن هذا مهم ، أليس كذلك؟

10:53.300 --> 11:01.700
لذلك يمكنك أن ترى أن هذه هي الصورة المعنية وهذه هي الصورة المجمعة ولا يزال بإمكانك رؤية نفس الميزات.

11:01.700 --> 11:04.210
إنها مجرد معلومات أقل ، ولكن نفس الميزات ، أليس كذلك؟

11:04.220 --> 11:05.750
الميزات محفوظة.

11:05.750 --> 11:07.160
هذا هو الجزء المهم.

11:08.150 --> 11:13.370
علاوة على ذلك ، إذا كنت تعلم ، إذا كانت أربعة لدينا تشبه إلى حد ما نوعًا ما يشبه الدوران قليلاً إلى

11:13.370 --> 11:16.790
الجانب ، فستظل قادرة على التقاط طبقات مجمعة متشابهة جدًا.

11:16.790 --> 11:18.500
وبعد ذلك أصبح لدينا المزيد من الطبقات.

11:18.500 --> 11:19.730
لم نتحدث عن ذلك بعد.

11:19.730 --> 11:27.380
إذن ، هناك طبقة تلافيفية أخرى هنا لن تكون لدينا في الواقع ، ومن ثم لديها طبقة تجمع أخرى ، لكنها

11:27.380 --> 11:30.700
في الأساس مجرد تكرار نفس العملية.

11:30.710 --> 11:36.110
وبعد ذلك ، هذا ما سنتحدث عنه بشكل أكبر في الدورة التدريبية وهو الحصول على الطبقات المتصلة

11:36.110 --> 11:39.800
بالكامل وما إلى ذلك ، ولكن يمكنك بالتأكيد اللعب بهذا الأمر.

11:39.800 --> 11:47.720
لذا إذا حذفت ما يعجبك ، إذا رسمت سبعة ، فسترى أنها تخبرك بالفعل أن التخمين هو أن هذا هو

11:47.720 --> 11:52.730
سبعة والتخمين الثاني ، الاحتمال الثاني هو ثلاثة.

11:52.730 --> 11:56.360
حتى تتمكن من رسم بعض الأشياء الصعبة ومعرفة ما إذا كان يمكن التقاطها.

11:56.360 --> 12:01.100
لنفترض أنه إذا رسمت شيئًا يشبه الصفر ، لكنه ليس صفرًا نهائيًا ، فهل

12:01.100 --> 12:03.620
يلتقطه الآن هذه المرة لم يلتقطه.

12:03.620 --> 12:06.080
يبدو أن الرقم تسعة في الصورة.

12:06.080 --> 12:08.270
ماذا لو كنت مثل الانتهاء من هذا القبيل؟

12:08.270 --> 12:14.390
الآن يعتقد أنه صفر أو تسعة ويمكنك أن ترى هناك ما يضيء الصفر أو التسعة.

12:14.390 --> 12:16.220
لكننا سنتحدث عن هذا الجزء في الأسفل.

12:16.460 --> 12:17.270
لنقم بواحدة أخرى.

12:17.300 --> 12:19.760
دعنا نقول مثل ثمانية.

12:19.760 --> 12:25.820
أعتقد أن الثمانيات صعبة جدًا لأن هذا التقط الآن ثمانية ، لذلك يمكنك أن ترى أن هذا يتحول إلى ثمانية.

12:25.820 --> 12:28.850
ثم بعد ذلك يتوقف عن التعرف عليه.

12:28.850 --> 12:31.970
التوقفات منطقية بالنسبة لنا نحن البشر ، أليس كذلك؟

12:31.970 --> 12:38.540
هذه الميزات التي تعمل معها ، لكنها في نفس الوقت تدرك بشكل صحيح أنها ثمانية.

12:38.750 --> 12:40.460
نعم ، بالتأكيد العب بهذا الأمر.

12:40.460 --> 12:43.430
يمكنك رسم وجه مبتسم ، انظر ماذا سيحدث بعد ذلك.

12:43.940 --> 12:49.810
يبدو الأمر وكأنه ثلاثة إلى هذه الأداة ، لأنه من الواضح أن الأداة مدربة فقط على أرقام

12:49.810 --> 12:50.860
من 0 إلى 9.

12:50.860 --> 12:55.870
لذلك يجب أن يتعرف على شيء ما هناك ويتعرف على ثلاثة.

12:56.830 --> 13:02.110
يبدو الأمر كما في الحياة عندما ترى شيئًا مثل نوع من الفاكهة لم تره

13:02.140 --> 13:05.830
من قبل ، مثل تفاحة كاسترد أو شيء من هذا القبيل.

13:05.830 --> 13:12.250
وتعتقد أنها مثلها مثل الكمثرى لأنك لم ترها بالفعل من قبل.

13:12.250 --> 13:13.930
أنت لا تعرف ما تصنفه على أنه.

13:13.930 --> 13:14.590
نفس الشيء هنا.

13:14.590 --> 13:17.590
لذلك لم يتدرب بالفعل على الوجوه المبتسمة.

13:17.590 --> 13:19.270
ولهذا السبب تعتقد أنها شجرة.

13:19.450 --> 13:20.200
إنها ثلاثة.

13:20.200 --> 13:20.860
لذا ها أنت ذا.

13:20.860 --> 13:22.600
إنها أداة قوية جدًا وقوية.

13:22.600 --> 13:25.190
سيكون من المفيد لك أن تتلاعب بها.

13:25.190 --> 13:32.950
وفي الواقع ، عندما تضع الماوس فوق بكسل بكسل ، فإنه يوضح لك المكان الذي كان يقوم فيه كاشف الميزات

13:32.950 --> 13:37.390
بالتقاط هذا البكسل حتى تتمكن من رؤية مصدر هذه البكسل.

13:37.390 --> 13:44.410
وأيضًا يمكنك أن ترى كيف كان الفلتر نوعًا ما مثل المرور عبر الصورة ، بالضبط كيف تحدثنا في الدورة.

13:44.410 --> 13:51.430
وهنا يمكنك أن ترى التجميع ، يمكنك أن ترى أن التجميع يتم مع

13:51.430 --> 13:56.950
التجميع بحجم مربع صغير من اثنين في اثنين.

13:56.950 --> 14:03.670
ويمكنك أن ترى أنها خطوة من خطوتين أيضًا ، تمامًا كما ناقشنا في البرنامج التعليمي اليوم.

14:03.670 --> 14:09.130
لذا ها نحن نلعب مع ذلك وآمل أن تكون قد استمتعت بجلسة اليوم.

14:09.130 --> 14:10.450
أتطلع إلى رؤيتك في المرة القادمة.

14:10.450 --> 14:12.580
وحتى ذلك الحين ، استمتع بالتعلم العميق.