WEBVTT

00:00.300 --> 00:05.790
مرحبًا بكم ومرحبًا بكم مرة أخرى في الدورة التدريبية الخاصة بالتعلم العميق اليوم ، سنبدأ اليوم في إطلاق الشبكات العصبية التلافيفية

00:05.790 --> 00:06.840
سيكون أمرًا مثيرًا.

00:06.840 --> 00:08.340
دعونا نتعمق فيه مباشرة.

00:08.340 --> 00:10.350
سنبدأ بصورة.

00:10.620 --> 00:12.690
ماذا ترى عندما تنظر إلى هذه الصورة؟

00:13.440 --> 00:17.610
هل ترى شخصًا ينظر إليك أم ترى شخصًا يتطلع إلى اليمين؟

00:18.000 --> 00:21.570
يمكنك أن ترى أن عقلك يكافح.

00:21.570 --> 00:23.970
إنه يكافح من أجل التكيف.

00:23.970 --> 00:27.330
إذا نظرت إلى الجانب الأيمن من الصورة ، ما عليك سوى إلقاء نظرة على الحد الأيمن منها.

00:27.330 --> 00:29.040
سترى شخصًا يتطلع إلى اليمين.

00:29.040 --> 00:32.970
إذا نظرت إلى الحد الأيسر للصورة ، فسترى شخصًا ينظر إليك.

00:33.540 --> 00:42.690
وهذا يثبت فقط أن ما يبحث عنه دماغنا عندما نرى الأشياء هو ميزات تعتمد على الميزات التي يراها ، اعتمادًا

00:42.690 --> 00:48.480
على الميزات التي تعالجها ، يمكنك تصنيف الأشياء بطرق معينة.

00:48.480 --> 00:53.760
لذلك عندما تنظر إلى الجانب الأيمن من الصورة ، ترى سمات معينة لشخص ينظر

00:53.760 --> 00:59.850
إلى اليمين لأنها أقرب إلى مركز تركيزك ، وبالتالي يصنف عقلك على أنه شخص ينظر إلى

00:59.850 --> 01:00.720
اليمين.

01:00.720 --> 01:06.750
عندما تنظر إلى الجانب الأيسر من الصورة ، ترى المزيد من ميزات الشخص الذي ينظر إليك ، وبالتالي

01:06.750 --> 01:09.270
يصنفه عقلك على هذا النحو.

01:09.270 --> 01:10.740
لذلك دعونا نلقي نظرة على واحدة أخرى.

01:10.980 --> 01:12.720
هذه صورة مشهورة جدا.

01:12.720 --> 01:15.810
ربما تكون قد شاهدته بالفعل ، لكن ماذا ترى هنا؟

01:16.590 --> 01:23.640
لذلك سيقول بعض الناس إنهم يرون سيدة شابة ترتدي فستانًا وتنظر بعيدًا.

01:23.640 --> 01:29.760
سيقول بعض الناس إنهم يرون سيدة عجوز ترتدي وشاحًا على رأسها وتنظر إلى أسفل.

01:29.970 --> 01:34.200
لذلك سأقوم بتوضيح هذه الميزات وسترى أنها ستصبح واضحة جدًا.

01:34.200 --> 01:37.440
إذن هذا هو وجه الشابة التي تنظر بعيدًا.

01:37.440 --> 01:40.290
إنها تنظر إلى المسافة مثل معطفها.

01:40.290 --> 01:43.380
هذا شعرها ، هذه ريشتها الصغيرة في شعرها.

01:43.380 --> 01:48.900
ومن ناحية أخرى ، هذا رأس السيدة العجوز ينظر إلى الأسفل.

01:48.900 --> 01:52.080
هذا أنفها ، هذا فمها ، هذا ذقنها.

01:52.080 --> 01:53.490
هذا هو الوشاح على رأسها.

01:53.490 --> 01:55.500
وهي تنظر إلى الأسفل.

01:55.500 --> 01:57.840
لذا ، كما ترون ، اثنان في واحد.

01:57.840 --> 02:04.890
واعتمادًا على الميزات التي يلتقطها عقلك ، سيتحول بين تصنيف كل صورة على أنها واحدة

02:04.890 --> 02:06.090
أو أخرى.

02:06.660 --> 02:13.740
أقدم واحدة من هذه الأوهام المسجلة في العمل المطبوع هي هذه.

02:13.740 --> 02:15.150
إنها البطة أو الأرنب.

02:15.150 --> 02:16.860
هل هذه بطة أم هذا أرنب؟

02:16.860 --> 02:17.970
مثال آخر.

02:18.150 --> 02:24.630
والآن سأريكم صورة ستتم فقط لثانية واحدة ، فقط انظروا إليها وشاهدوا ما هي المشاعر أو أي

02:24.660 --> 02:28.350
نوع من الخبرة ، التجربة البصرية التي تمرون بها.

02:28.890 --> 02:30.930
فماذا ترى؟

02:30.970 --> 02:37.590
هل تشعر بأنك لست بالدوار قليلاً ، ولكنك مبهور قليلاً ، مثل أن عقلك يحاول أن يفهم ما هو

02:37.590 --> 02:43.680
عليه ، ما هو عليه ، إنه يحاول القفز بين عينيها ، عينيها العلوية والسفلية.

02:43.680 --> 02:51.750
وهذا هو المثال الكلاسيكي عندما تكون هناك ميزات معينة حيث يمكن أن يكون هذا ، يمكن أن يكون كذلك ، لكن عقلك

02:51.750 --> 02:53.640
لا يستطيع أن يقرر.

02:53.850 --> 02:58.590
ولأن كلاهما يبدو معقولًا ونعم.

02:58.590 --> 03:04.800
إذن كل هذه الأمثلة توضح لنا بشكل أساسي كيف يعمل الدماغ ، وأنه يعالج ميزات معينة

03:04.800 --> 03:10.770
على صورة أو على أي شيء تراه في الحياة الواقعية ، ويصنف ذلك على هذا النحو.

03:10.770 --> 03:16.030
وربما تكون في مواقف عندما تنظر من فوق كتفك بسرعة وترى شيئًا وتعتقد

03:16.030 --> 03:22.740
أنه ، لا أعرف ، إنه مثل كرة ، أ ، ولكن تبين أنها قطة أو تعتقد أنها إنها سيارة ، لكن اتضح

03:22.740 --> 03:25.440
أنها ظل وأشياء من هذا القبيل.

03:25.440 --> 03:29.580
هذا لأنه ليس لديك الوقت الكافي لمعالجة هذه الميزات أو ليس لديك ميزات كافية لتصنيف

03:29.580 --> 03:30.930
الأشياء على هذا النحو.

03:30.930 --> 03:38.490
وهذا بالنسبة لي ، هذا مثير جدًا للاهتمام لأن ما سنفعله مع الشبكات العصبية ، مع الشبكات العصبية

03:38.490 --> 03:40.710
التلافيفية ، مشابه جدًا.

03:40.710 --> 03:46.020
وستجد أن الطريقة التي ستتعامل بها أجهزة الكمبيوتر مع الصور ستكون مشابهة للغاية

03:46.020 --> 03:48.120
للطريقة التي نعالج بها الصور.

03:48.120 --> 03:53.520
لذلك من المهم جدًا أن نفهم وأن نتذكر نوعًا ما هذه الأشياء بأن هذه هي الطريقة التي نقوم بها.

03:53.520 --> 03:58.350
وسأقوم بإخراج هذه السيدة من شاشاتك لأنها ربما تخيفك بالفعل الآن.

03:58.350 --> 04:00.870
إذن هذا شيء مختلف.

04:00.870 --> 04:06.900
هذه تجربة ، تجربة أجريت على أجهزة الكمبيوتر ، على الشبكات العصبية التلافيفية.

04:06.900 --> 04:10.710
لذلك نحن نتحرك الآن ببطء من البشر إلى أجهزة الكمبيوتر.

04:11.190 --> 04:14.310
وهذه الشريحة مأخوذة من حديث لجيفري هينتون.

04:15.090 --> 04:21.600
وهنا لديك بشكل أساسي يصف تجربة قام بها على بعض الشبكات العصبية التلافيفية

04:21.750 --> 04:23.820
التي قام بتدريبها.

04:24.210 --> 04:29.490
هنا ترون ثلاث صور وسنقوم بالمرور عليها من اليسار إلى اليمين ونرى كيف ستصنفهم

04:29.490 --> 04:31.560
ثم نرى كيف يصنفهم الكمبيوتر.

04:31.560 --> 04:34.260
إذن على اليسار ، ما رأيك في هذا؟

04:35.340 --> 04:37.590
ربما قلت الفهد وستكون على حق.

04:37.590 --> 04:38.790
وهذا ما قاله الكمبيوتر.

04:38.790 --> 04:43.860
لذا وعلى الفور ، فورًا ، سنتعلم كيف نقرأ هذه الصور ، لأنه إذا كنت تريد

04:43.860 --> 04:51.690
التعمق في الشبكات العصبية التلافيفية ، فلا يقصد التورية ، إذا كنت ستبدأ في تعلم المزيد و المزيد عنها واستخدامها

04:51.690 --> 04:53.850
، سترى الكثير منها.

04:53.850 --> 04:57.000
لذلك رأيت الناس يقرؤونها بشكل غير صحيح.

04:57.000 --> 04:58.830
حتى هنا في القمة.

04:59.620 --> 05:01.320
القاعدة هي ما هي عليه في الواقع.

05:01.320 --> 05:04.770
إذن هذه هي التسمية الصحيحة الفعلية للصورة.

05:04.770 --> 05:10.950
هذا هو ملصق الصورة ، بغض النظر عن أي معالجة ورؤية الكمبيوتر.

05:11.520 --> 05:19.440
ثم ها هي التخمينات الأربعة أو الخمسة الأولى في بعض الأحيان من تخمينات الخوارزمية ، ويتم إعطاؤهم

05:19.440 --> 05:20.550
الاحتمال.

05:20.550 --> 05:26.370
هكذا قال الكمبيوتر ، أو قالت الشبكة العصبية إن Cheetah Leopard أو Snow Leopard أو القط المصري يمكن أن يكون

05:26.370 --> 05:29.040
واحدًا من الأربعة وأن الفهد لديه أعلى الأصوات.

05:29.040 --> 05:34.650
وخلال هذا الجزء من الدورة ، سوف تفهم ما تعنيه هذه الأصوات وكيف يتم اشتقاقها.

05:34.650 --> 05:36.420
لكن في الوقت الحالي ، الأمر بديهي جدًا ، أليس كذلك؟

05:36.420 --> 05:41.970
إذاً فهو فهد في الواقع ، وقد خمنت الشبكة العصبية بشكل صحيح ، وقالت باحتمالية عالية

05:41.970 --> 05:44.100
، حوالي 95 ، 99٪ ، إنها فهد.

05:45.780 --> 05:47.370
ثم الثاني ، ما رأيك؟

05:47.370 --> 05:51.030
هل هذا هو هذا القطار السريع.

05:51.030 --> 05:57.960
وتمكنت الشبكة العصبية من التمييز بين القطار السريع ، وعربة الركاب ، وقطار الأنفاق ، والقاطرة الكهربائية.

05:57.960 --> 05:58.920
هذه هي أفضل الخيارات.

05:58.920 --> 06:00.360
بالطبع ، كان لديها العديد من الخيارات.

06:00.360 --> 06:07.170
تتعلم هذه الشبكات العصبية التمييز ليس فقط بين أربع فئات من عشرات وآلاف الفئات

06:07.170 --> 06:08.670
في نفس الوقت.

06:08.670 --> 06:10.650
هذه هي الخيارات الأربعة التي اختارها.

06:10.650 --> 06:12.720
وهذا قطار سريع وقطار سريع.

06:12.720 --> 06:18.450
إذاً ما رأيك في الخيار الأخير هو ، جدًا ، هناك خياران هناك.

06:18.460 --> 06:20.040
ليس من الواضح ما هو عليه.

06:20.040 --> 06:21.390
يمكن أن يكون مقلاة.

06:21.390 --> 06:22.740
يمكن أن تكون عدسة مكبرة.

06:22.740 --> 06:27.000
يمكن أن يكون مقصًا.

06:27.000 --> 06:31.500
قد يقول البعض ، حسنًا ، قالت الشبكة العصبية إنه كان مقصًا ، لكن يمكنك أن ترى كيف يمكنك

06:31.500 --> 06:32.460
أن تخطئ هنا.

06:32.460 --> 06:35.250
بادئ ذي بدء ، إنها ليست صورة واضحة للغاية.

06:35.250 --> 06:41.700
ويمكنك أيضًا أن ترى أن الاحتمالات ليست بهذا الوضوح هنا.

06:41.700 --> 06:46.200
لذلك كانت الشبكة العصبية مرتبكة بعض الشيء ، وغير حاسمة بعض الشيء ، تمامًا كما نحن.

06:46.200 --> 06:50.910
لذلك قال المقص مع أعلى احتمال ، ولكن بعد ذلك كان له لمعان يدوي ، والذي

06:50.910 --> 06:55.650
كان في الواقع ليس بعيدًا جدًا في المركز الثاني وسماعة طبيب مقلاة.

06:55.650 --> 07:01.380
لذلك يمكنك أن ترى أن المقص كان أول تخمين له ، لكن الخيار الصحيح كان رقم اثنين ولهذا السبب تم تمييزه

07:01.380 --> 07:02.850
باللون الأحمر.

07:03.060 --> 07:03.930
لذا ها نحن ذا.

07:03.930 --> 07:06.960
هذا ما تستطيع الشبكات العصبية فعله بالفعل.

07:06.960 --> 07:08.820
وهذه في الواقع شريحة قديمة.

07:08.820 --> 07:10.530
كان هذا قبل عدة سنوات.

07:10.530 --> 07:11.760
الآن هم أفضل.

07:11.760 --> 07:16.080
وسترى أنه من التطبيق العملي سوف تقومان بالترميز معًا.

07:16.080 --> 07:16.670
البركة على.

07:16.680 --> 07:21.150
لكن دعونا الآن نحاول أن نفهم بشكل أفضل نوع الشبكات التي هي في الواقع شبكات عصبية

07:21.150 --> 07:23.730
تلافيفية ولماذا تكتسب شعبية كبيرة؟

07:23.730 --> 07:25.710
وهم في الواقع يكتسبون شعبية.

07:25.710 --> 07:31.050
لذلك يمكنك أن ترى هنا مقارنة Google Trends التي أجريتها بالأمس فقط.

07:31.620 --> 07:39.360
هنا يمكنك أن ترى أن الشبكات العصبية التلافيفية تسيطر حتى على الشبكات العصبية الاصطناعية.

07:39.360 --> 07:47.880
زيادة هائلة وسيواصلون السير بهذه الطريقة لأنه مجال مهم للغاية حيث تحدث كل

07:47.880 --> 07:52.440
الأشياء ، مثل السيارات ذاتية القيادة.

07:52.440 --> 07:57.840
كيف يتعرفون على الأشخاص على الطريق ، وكيف يتعرفون على إشارات التوقف وأشياء من هذا القبيل؟

07:57.840 --> 08:04.860
كيف يمكن لفيسبوك كيف يمكن للفيسبوك أن يميز الصور أو الأشخاص في الصور؟

08:04.860 --> 08:11.820
وليس فقط مثل ، تذكر منذ سنوات سابقة أنه كان عليك وضع علامة على الأشخاص بنفسك ، ثم كان يتعرف على الوجوه ، وكان

08:11.820 --> 08:16.680
عليك إضافتها ، ثم إضافة الأسماء ، والآن يتعرف فقط على الوجوه ويضيف الأسماء

08:16.680 --> 08:18.240
في نفس الوقت.

08:18.330 --> 08:23.540
حسنًا ، هذا ما تستطيع الشبكات العصبية التلافيفية القيام به.

08:23.550 --> 08:32.280
وبالحديث عن Facebook ، إذا كان جيفري هينتون هو الأب الروحي للشبكات العصبية الاصطناعية والتعلم

08:32.280 --> 08:38.910
العميق ، فإن Yann LeCun هو جد الشبكات العصبية التلافيفية.

08:38.910 --> 08:45.450
Yann LeCun هو تلميذ لدى Geoffrey Hinton ، وفي الواقع ، يمكنك هنا رؤيتهم معًا.

08:45.450 --> 08:51.180
ويقوم جيفري هينتون الآن بدور رائد في التعلم العميق في Google.

08:51.210 --> 08:56.730
Yann LeCun هو مدير أبحاث الذكاء الاصطناعي على Facebook وأستاذ في جامعة نيويورك.

08:56.730 --> 09:00.030
ببطء شديد ، نحن أحب هذا الجزء من الدورة التدريبية.

09:00.030 --> 09:07.380
ببطء نقوم ببناء هذا الاسم ، هذه الأسماء أو هذا النوع من الصور لمحات الأشخاص الذين يقودون

09:07.380 --> 09:09.120
هذا المجال.

09:09.120 --> 09:14.340
وبعد ذلك في الجزئين التاليين ، سنتعرف على المزيد من المعلومات.

09:14.340 --> 09:20.160
وسيكون لدينا كل هذه المافيا ، كما يسمون أنفسهم ، أو يان ليكون يسميهم المافيا أو مؤامرة التعلم

09:20.160 --> 09:21.030
العميق.

09:21.030 --> 09:23.640
وستتعلم المزيد عن كيفية تطور هذا المجال بأكمله.

09:23.640 --> 09:27.150
ونعم ، هؤلاء فقط أناس عظماء ورائعون.

09:27.150 --> 09:33.900
وهكذا ، قدم Yann LeCun في الثمانينيات والتسعينيات مساهمات كبيرة في مجال الشبكات

09:33.900 --> 09:36.180
العصبية التلافيفية.

09:36.180 --> 09:44.310
وكما سنرى خلال هذه الدورة ، فقد تمكنت من تطوير أو مساعدة العالم على تطوير

09:44.310 --> 09:46.350
شيء قوي للغاية.

09:46.350 --> 09:52.620
إذن بالانتقال إلى كيفية عمل الشبكات العصبية التلافيفية ، لديك مدخلات.

09:52.620 --> 09:54.210
الأمر بسيط للغاية ، ومباشر جدًا.

09:54.210 --> 09:56.070
إذن لديك صورة إدخال.

09:56.070 --> 09:59.160
يمر عبر شبكة عصبية تلافيفية ويكون لديك ناتج.

09:59.250 --> 09:59.730
مع التسمية.

09:59.730 --> 10:06.520
لذلك يصنف تلك الصورة على أنها شيء مثل الفهد أو القطار السريع أو أي شيء آخر.

10:06.540 --> 10:10.320
الآن نوعًا ما مثل الخوض في مزيد من التفاصيل.

10:10.710 --> 10:18.840
على سبيل المثال ، يمكنك بعد تدريب الشبكة العصبية على صور معينة ، أو على بعض الصور المصنفة أو الصور

10:18.840 --> 10:25.530
المصنفة التي تم تصنيفها مسبقًا بعد ذلك ، يمكنك تقديمها ، دعنا نقول أن الشبكة العصبية

10:25.530 --> 10:30.270
قد تم تدريبها للتعرف على تعابير الوجه والعواطف .

10:30.270 --> 10:37.470
يمكنك إعطاء وجه شخص مبتسم ، ليس فقط وجهًا ، مثل رسم وجه كهذا ، ولكن وجهًا حقيقيًا

10:37.470 --> 10:39.240
لشخص مبتسم.

10:39.240 --> 10:44.790
وسيخبرك أن هذا الشخص سعيد ويمكنك أن تعطيه وجه شخص عابس.

10:44.820 --> 10:46.650
سيخبرك أن الشخص حزين.

10:47.190 --> 10:48.480
يمكنه التعرف على هذه المشاعر.

10:48.480 --> 10:53.250
وكما ترون ، هذا بالفعل قوي جدًا من حيث العديد من التطبيقات المختلفة.

10:53.250 --> 11:00.450
فقط من هذا المثال الوحيد الذي يمكنك التفكير فيه على الفور وفي كلتا الحالتين ، سوف يمنحك احتمالًا.

11:00.450 --> 11:10.200
لذلك لن يقول 100٪ أن الشخص سعيد أو حزين ، سيكون 99 أو 98 أو ربما 80٪ عندما لا يكون واضحًا

11:10.200 --> 11:11.670
ما يحدث.

11:11.670 --> 11:17.370
ومثلما نحن على حق ، في بعض الأحيان يمكننا أن نخطئ في الأشياء على أنها ليست كذلك ، أو في بعض الأحيان يمكننا

11:17.370 --> 11:17.880
ذلك.

11:18.690 --> 11:24.660
في بعض الأحيان يكون من غير الواضح ما إذا كان الشخص يبتسم أو يعبس أو ما إذا كان كلبًا

11:24.660 --> 11:27.750
أو قطة ، أو قطارًا أو قطارًا سريعًا.

11:28.200 --> 11:28.360
الصحيح.

11:28.410 --> 11:33.240
في بعض الأحيان ، لم يكن لدينا ميزات كافية ، وكلها تنخفض إلى الميزات لأن هذه هي الطريقة

11:33.240 --> 11:38.310
التي نعالج بها المعلومات المرئية كما رأينا من بداية هذا البرنامج التعليمي.

11:38.310 --> 11:44.040
إذن ، كيف يمكن للشبكة العصبية ، كيف يمكن للشبكة العصبية التعرف على هذه الميزات؟

11:44.040 --> 11:48.690
حسنًا ، كل شيء يبدأ من المستوى الأساسي الذي لديك.

11:48.690 --> 11:50.670
لنفترض أن لديك صورة ، لديك صورتان.

11:50.760 --> 11:56.280
واحد هو صورة بالأبيض والأسود 2 × 2 بكسل ، والآخر صورة ملونة من 2 × 2 بكسل.

11:56.280 --> 12:04.620
حسنًا ، تستفيد الشبكات العصبية من حقيقة أن الصورة بالأبيض والأسود عبارة عن مصفوفة ثنائية الأبعاد.

12:04.620 --> 12:09.560
إذن الطريقة التي نراها الآن على اليسار هي مجرد تمثيل مرئي ، أليس كذلك؟

12:09.600 --> 12:13.530
لذا فهي نوع من الصور ولأغراض التبسيط فهي مجرد صورة اثنين في اثنين.

12:13.890 --> 12:18.870
لكن في مصطلحات الكمبيوتر ، إنها في الواقع مصفوفة ثنائية الأبعاد مع كل واحدة

12:18.870 --> 12:22.080
من تلك البكسلات التي لها قيمة بين صفر و 255.

12:22.080 --> 12:27.540
إذن ، ثمانية ثمانية بتات من المعلومات مرفوعة إلى اثنين أس ثمانية تساوي 256.

12:27.540 --> 12:30.240
إذن ، القيم من 0 إلى 255.

12:30.240 --> 12:32.010
وهذه هي شدة اللون.

12:32.010 --> 12:33.450
وفي هذه الحالة يكون اللون أبيض.

12:33.450 --> 12:38.550
لذا سيكون الصفر بكسلًا أسود بالكامل ، و 255 بكسل أبيض بالكامل.

12:38.550 --> 12:44.370
وبينهما ، لديك نطاق التدرج الرمادي للخيارات الممكنة لهذا البكسل.

12:44.370 --> 12:49.920
وبناءً على هذه المعلومات ، يمكن لأجهزة الكمبيوتر بعد ذلك العمل مع الصورة.

12:49.920 --> 12:55.080
وهذا يشبه إلى حد ما نقطة البداية ، أي أن أي صورة لها تمثيل

12:55.080 --> 13:03.150
رقمي ، ولها شكل رقمي ، وهذه مجرد آحاد وأصفار تشكل رقمًا من 0 إلى 255 لكل بكسل.

13:03.150 --> 13:04.170
وهذا ما يعمل من أجله الكمبيوتر.

13:04.170 --> 13:08.340
إذا لم يعمل في الواقع مع الألوان أو أي شيء ، يعمل مع الآحاد والأصفار

13:08.340 --> 13:12.390
، في نهاية اليوم ، فهذا يشبه نوعًا ما أساس كل شيء.

13:13.140 --> 13:17.040
وفي صورة ملونة ، إنها في الواقع مصفوفة ثلاثية الأبعاد.

13:17.040 --> 13:21.810
لديك بكسل أزرق وطبقة زرقاء وطبقة خضراء وطبقة حمراء.

13:21.810 --> 13:29.700
وبهذا المعنى ، أربعة غيغابايت من الأحمر والأخضر والأزرق وكل لون من هذه الألوان له حدته الخاصة.

13:29.700 --> 13:36.870
إذن ، يحتوي البكسل بشكل أساسي على ثلاث أو ثلاث قيم مخصصة له.

13:36.870 --> 13:40.620
كل واحد منهم يقع بين صفر و 256 ، 255.

13:41.160 --> 13:49.440
وبالتالي ، يمكنك معرفة ما هي هذه الصورة ، ما لون هذا البكسل بالضبط من خلال الجمع بين هذه القيم

13:49.440 --> 13:50.220
الثلاث.

13:50.220 --> 13:52.860
ومرة أخرى ، ستعمل أجهزة الكمبيوتر مع ذلك.

13:53.280 --> 13:55.710
إذن هذا هو أساس كل شيء.

13:55.710 --> 13:58.440
هذه هي القناة الحمراء ، القناة الخضراء ، القناة الزرقاء.

13:59.310 --> 14:07.110
وأخيرًا ، دعنا نلقي نظرة ، على سبيل المثال ، على مثال ، مثال تافه جدًا لوجه مبتسم في مصطلحات

14:07.110 --> 14:16.080
الكمبيوتر ، إذا قمنا بتبسيط الأشياء حقًا بدلاً من الحصول على من 0 إلى 255 ، بدلاً من الحصول على هذه القيم

14:16.080 --> 14:20.850
فقط بحيث يمكننا فهم الأشياء بشكل أفضل وفهم المفاهيم

14:20.850 --> 14:26.700
حقًا ، سنقول أن الصفر هو أبيض ، والآخر أسود ، أليس كذلك؟

14:26.700 --> 14:30.630
لذلك سنقوم فقط بتبسيط الأمور إلى أقصى الحدود.

14:30.630 --> 14:33.780
وسترى أن تلك الصورة يمكن تمثيلها على هذا النحو.

14:33.780 --> 14:38.910
لذا السبب وراء طرحنا هذا هو أننا سنذهب إلى جميع دروس الحدس لدينا ، وسنقوم

14:38.910 --> 14:43.950
ببناء صور مثل هذه ، وهي بسيطة جدًا ، ولكن في نفس الوقت ، ثم كل هذه المفاهيم

14:43.950 --> 14:50.460
يمكن أن يترجم مرة أخرى إلى نطاق من 0 إلى 256 من القيم ، وكل شيء ينطبق بنفس الطريقة هناك.

14:50.460 --> 14:54.840
والخطوات التي سنمر بها مع هذه الصور هي الخطوة الأولى الالتفاف.

14:54.840 --> 14:56.760
الخطوة الثانية ، أقصى تجمع.

14:56.760 --> 14:59.000
الخطوة الثالثة ، التسطيح ورقم الخطوة.

14:59.160 --> 15:00.330
أو اتصال كامل.

15:00.330 --> 15:06.780
ويمكنني أن أتخيل أنه ربما لا تعني أي من هذه الكلمات الكثير بالنسبة لك في الوقت الحالي

15:06.780 --> 15:13.890
، ولكن في نهاية هذا القسم من الدورة التدريبية ، ستفهمهم بتفصيل كبير وما يفعلونه بالضبط.

15:13.890 --> 15:15.920
لذلك سنبدأ في البرنامج التعليمي التالي.

15:15.930 --> 15:23.430
في الوقت الحالي ، القراءة الإضافية التي قد ترغب في النظر فيها هي ورقة بحثية أصلية من Lacunes

15:23.640 --> 15:27.840
أدت إلى ظهور الشبكات العصبية التلافيفية.

15:28.050 --> 15:31.380
إنه يسمى التعلم القائم على التدرج المطبق على التعرف على المستندات.

15:31.650 --> 15:34.470
ربما تكون قد شاهدت هذه الصورة قبل أن تطفو حول الإنترنت.

15:34.470 --> 15:35.700
إنه من تلك الورقة.

15:35.700 --> 15:42.150
لذا ، إذا كنت تريد العودة إلى بدايات كيفية حدوث كل شيء ، ومن أين أتى كل شيء ، فهذه هي الورقة التي يجب النظر

15:42.150 --> 15:46.230
فيها وأنا أتطلع إلى رؤيتك في البرنامج التعليمي التالي.

15:46.230 --> 15:48.450
حتى ذلك الحين ، استمتع بالتعلم العميق.