WEBVTT

00:00.330 --> 00:02.850
مرحبًا ومرحبًا بكم في برنامج Python التعليمي هذا.

00:03.000 --> 00:08.220
حسنًا ، سنقوم الآن بعمل الوظيفة الأمامية التي ستنشر إشارات خرج دماغنا

00:08.220 --> 00:13.530
إلى جسم الذكاء الاصطناعي بحيث يلعب الإجراء الصحيح للوصول إلى السترة.

00:13.530 --> 00:17.160
لكن لا يوجد عمل صحيح حتى الآن لأنه لا يوجد تدريب حتى الآن.

00:17.160 --> 00:23.160
لم ندرب العين بعد ، ولكن هذا بالضبط ما سنفعله في الجزء الثاني من خلال تطبيق التعلم التلافيفي

00:23.160 --> 00:29.670
العميق ، والذي بالمناسبة ، سأعيد تسمية تدريب الذكاء الاصطناعي بالتعلم التلافيفي العميق.

00:29.670 --> 00:35.220
لكن في الوقت الحالي ، نحتاج إلى إعادة توجيه الإشارة من الطبقة الخارجة من الدماغ إلى الجسم.

00:35.220 --> 00:39.960
وهذا بالضبط ما سنفعله بهذه الوظيفة الأمامية ، وهي الوظيفة الأخيرة

00:39.960 --> 00:40.590
لجسمنا.

00:41.170 --> 00:42.460
لذلك دعونا نفعل هذا.

00:42.610 --> 00:45.640
نبدأ مع جيف فورد.

00:46.150 --> 00:50.020
ووفقًا لك ، ما الحجة التي ستتخذها؟

00:50.050 --> 00:53.050
حسنًا ، سيستغرق الأمر ، بالطبع ، الذات الأولى.

00:53.050 --> 00:54.940
ثم هل هناك واحد آخر؟

00:54.970 --> 00:56.680
حسنًا ، نعم ، هناك.

00:56.680 --> 00:58.030
وماذا سيكون؟

00:58.060 --> 01:04.510
حسنًا ، بطبيعة الحال ، نريد إعادة توجيه إشارة خرج الدماغ إلى الجسم ، وبالتالي فإن الإدخال

01:04.510 --> 01:07.270
سيكون إشارة الإخراج للدماغ.

01:07.540 --> 01:10.390
والآن نحتاج إلى تسمية إشارات الخرج هذه.

01:10.390 --> 01:14.260
ولذا سأضيف هنا الحجة المطروحة.

01:14.380 --> 01:14.860
حسنا.

01:14.860 --> 01:21.400
بحيث يتوافق ذلك مع إشارات الإخراج للدماغ بعد نشر صور الإدخال عبر الدماغ بالكامل للوصول إلى

01:21.400 --> 01:27.100
طبقة الإخراج ، وهي X هنا ، وترجع من خلال الوظيفة الأمامية للدماغ والآن سيتم إرسال

01:27.100 --> 01:32.380
إشارة الإخراج للدماغ للجسم مع هذه الوظيفة الأمامية الجديدة التي نصنعها

01:32.380 --> 01:34.750
في فئة الجسم الناعمة التالية.

01:35.260 --> 01:36.490
لذلك دعونا نفعل هذا.

01:36.490 --> 01:38.560
دعونا نضيف بعض الألوان هنا.

01:38.560 --> 01:43.870
والآن ، كما فهمت ، سنستخدم طريقة soft max لتشغيل الإجراء.

01:43.870 --> 01:49.420
وهذا يعني أن جسد أعيننا ، بعد تلقي إشارات الإخراج من الدماغ ، سيلعب الإجراءات باستخدام

01:49.420 --> 01:51.230
تقنية soft max.

01:51.250 --> 01:56.310
لذا فإن ما يتعين علينا فعله الآن هو بالضبط نفس ما فعلناه للسيارة ذاتية القيادة.

01:56.320 --> 01:59.310
سنحصل على توزيع الاحتمالات.

01:59.320 --> 02:05.730
هذه هي الخطوة الأولى ، وبعد ذلك سنقوم بأخذ عينة من الإجراء وفقًا لتوزيع الاحتمالات هذا.

02:05.740 --> 02:11.440
إذن ما يمكننا فعله الآن هو الحصول على ملف السيارة ذاتية القيادة ونسخ ولصق ما طبقناه لوظيفة

02:11.440 --> 02:14.560
الإجراء المحدد في السيارة ذاتية القيادة.

02:14.560 --> 02:15.610
لكن دعونا نفعل ذلك مرة أخرى.

02:15.610 --> 02:19.390
ستكون ممارسة جيدة وفي الواقع يمكنك محاولة كتابتها قبلي.

02:20.020 --> 02:20.250
تمام.

02:20.260 --> 02:23.620
أولًا ، ما سنفعله هو الحصول على الاحتمالات.

02:23.620 --> 02:29.500
لذلك أذكر أن هذا هو توزيع للاحتمالات لكل من قيم Q ، والتي تعتمد على المدخلات

02:29.500 --> 02:31.720
والصورة وكل إجراء.

02:31.720 --> 02:38.050
إذن لدينا قيمة Q واحدة لكل من الإجراءات الستة أو السبعة الممكنة ، وبالتالي نحصل على توزيع

02:38.050 --> 02:39.700
لسبعة احتمالات.

02:39.700 --> 02:44.920
أنا أقول سبعة لأنني أعتقد أن هناك سبعة أفعال بدلاً من ستة ، لأنه إلى جانب التحرك للأمام أو

02:44.920 --> 02:48.190
اليسار أو اليمين أو إطلاق النار ، يمكننا أيضًا الركض.

02:48.250 --> 02:53.860
هذا يجعل سبعة إجراءات ممكنة ، وبالتالي نحصل على توزيع سبعة احتمالات

02:53.860 --> 02:56.680
، واحد لكل قيمة Q مرتبطة بكل إجراء.

02:57.010 --> 02:58.840
لذا الدعائم تساوي.

02:58.840 --> 03:00.580
والآن تذكر ما يتعين علينا القيام به.

03:00.610 --> 03:06.400
حسنًا ، يتعين علينا بشكل أساسي استخدام وظيفة set max من الوحدة الوظيفية.

03:06.400 --> 03:07.330
لذلك هذا بسيط للغاية.

03:07.330 --> 03:13.630
نأخذ الوحدة الوظيفية أولاً ، ثم النقطة ، ثم نأخذ دالة max soft.

03:13.630 --> 03:14.380
ها هو.

03:14.380 --> 03:22.000
نضغط على مفتاح الإدخال (Enter) ، والآن نقوم بإدخال وسيطات الدالة max ، والتي أذكر أنها العناصر

03:22.000 --> 03:25.270
التي تريد إنشاء توزيع للاحتمالات لها.

03:25.270 --> 03:31.510
وهذه بالطبع قيم Q ، وهي مخرجات الشبكة العصبية ، وهي مخرجات الشبكة العصبية

03:31.510 --> 03:35.770
التي تريد إنشاء توزيع للاحتمالات لها.

03:35.770 --> 03:41.200
وأذكر أننا نريد إنشاء هذا التوزيع للاحتمالات لنكون قادرين على استكشاف الإجراءات المختلفة

03:41.200 --> 03:45.730
بدلاً من الاختيار المباشر للإحتمالات ذات القيمة القصوى Q.

03:45.730 --> 03:51.100
إذا اخترنا مباشرة الشخص الذي يحتوي على أقصى قيمة Q ، حيث لا نستكشف الكثير من الإجراءات الأخرى

03:51.100 --> 03:57.220
وقد نفقد شيئًا ما ، ولكن باستخدام طريقة self max ، يمكننا القيام ببعض الاستكشافات ، وبالتالي ربما نجد

03:57.220 --> 04:01.330
بعض الحلول المخفية في الأنماط التي قد تكون أفضل بكثير.

04:01.600 --> 04:07.720
لذا مرة أخرى ، أوصي بشدة بـ self max ، وبالتالي ما يتعين علينا فعله الآن هو إدخال قيم Q.

04:07.720 --> 04:11.140
هذه هي مخرجاتنا هنا ، مخرجات عقولنا.

04:11.140 --> 04:13.720
إذن المخرجات ، ها نحن ذا.

04:13.720 --> 04:21.520
ولكن بعد ذلك لدينا معلمة درجة الحرارة هذه التي يمكننا استخدامها والتي يمكننا تهيئتها لتخصيص الاستكشاف.

04:21.520 --> 04:27.190
تذكر أنه كلما قمنا بتعيين درجة الحرارة أعلى ، قل استكشاف الإجراءات الأخرى التي

04:27.190 --> 04:32.860
سنفعلها ، لأنه سيتم اختيار الإجراء الأفضل باحتمالية أعلى مقارنة بالإجراءات الأخرى

04:32.860 --> 04:35.740
التي سيتم تحديدها باحتمالات أقل.

04:35.740 --> 04:41.830
هذا تمامًا مثل السيارة ذاتية القيادة ، وبالتالي علينا مضاعفة الناتج هنا في واجبنا

04:41.830 --> 04:44.770
الذاتي لمعامل درجة الحرارة.

04:45.560 --> 04:46.310
هناك نذهب.

04:47.140 --> 04:47.770
في احسن الاحوال.

04:47.800 --> 04:53.050
نتلقى الآن تحذيرًا بسيطًا لأننا لم نستخدم الدعائم بعد ، لكننا على وشك استخدامها الآن.

04:53.050 --> 04:55.330
وهذا يقودنا إلى الشيء التالي الذي يتعين علينا القيام به.

04:55.360 --> 04:57.640
كيف سنستخدم هذه الاحتمالات؟

04:57.670 --> 05:03.460
حسنًا ، سنقوم بأخذ عينة من الإجراء النهائي للعب من توزيع الاحتمالات هذا.

05:03.460 --> 05:10.030
وبالتالي ، ما يتعين علينا فعله الآن هو استخدام الدالة المتعددة العادية لأخذ عينة من الإجراء وفقًا

05:10.030 --> 05:11.950
لتوزيع الاحتمالات هذا.

05:12.070 --> 05:14.710
لذلك نحن الآن على استعداد لاتخاذ إجراءاتنا.

05:14.950 --> 05:20.140
لذلك أقوم بإنشاء متغير جديد هنا لأن ذلك سيصبح الإجراءات التي سيقوم بها

05:20.140 --> 05:21.250
جسم أعيننا.

05:21.280 --> 05:29.440
والآن نأخذ توزيعنا للاحتمالات ، الدعائم التي نضيف إليها النقطة ثم طريقة الأعداد

05:29.440 --> 05:31.480
المتعددة.

05:32.050 --> 05:32.680
حسنا.

05:32.680 --> 05:34.870
والآن نبدأ أعمالنا النهائية.

05:34.870 --> 05:37.810
تم أخذ عينات منها من توزيع الدعائم لدينا.

05:38.200 --> 05:39.400
حسنًا ، رائع.

05:39.400 --> 05:42.220
لذلك نحن الآن على استعداد لإعادة ما نريد.

05:42.220 --> 05:44.360
هذه هي الإجراءات التي يجب أن تلعبها.

05:44.380 --> 05:46.870
وهذه بالطبع أفعال.

05:46.870 --> 05:48.580
والآن يجب أن يختفي التحذير.

05:48.580 --> 05:50.220
نحن نستخدم كل ما نريد.

05:50.230 --> 05:51.070
هناك نذهب.

05:51.100 --> 05:51.900
في احسن الاحوال.

05:51.910 --> 05:53.860
حتى الآن وظيفة الأمام جاهزة.

05:53.860 --> 05:55.630
و مبروك.

05:55.630 --> 05:57.240
الجسم جاهز أيضًا.

05:57.250 --> 05:58.960
حتى الآن لدينا دماغنا.

05:58.960 --> 06:05.200
لدينا أجسادنا ، وبالتالي ، نحن على استعداد لتجميعها لجعل المستقبل هو مستقبلنا.

06:05.200 --> 06:08.740
لن أتكون من شيء سوى دماغ وجسد.

06:08.740 --> 06:14.110
وبالتالي سيكون لديها ذكاء وجسم لتلعب الأفعال ، والتي ستكون الإجراءات

06:14.110 --> 06:16.390
الصحيحة للعب بفضل ذكائها.

06:16.390 --> 06:22.030
لكن تذكر ، قبل أن نضطر إلى تدريب ذكاءها ، وهذا ما سنفعله في الجزء الثاني ، تدريب الذكاء الاصطناعي

06:22.030 --> 06:24.400
على التعلم العميق التلافيفي.

06:25.030 --> 06:28.300
حسنًا ، لنجعل الذكاء الاصطناعي في البرامج التعليمية التالية.

06:28.300 --> 06:31.690
مرة أخرى ، ستكون فئة من وظيفتين ، على ما أعتقد.

06:31.690 --> 06:34.390
وهذا يتطلب منا دروسين أو ثلاثة دروس.

06:34.390 --> 06:35.520
لذلك لا استطيع الانتظار.

06:35.530 --> 06:36.640
سيكون هذا مثيرًا.

06:36.640 --> 06:37.840
وحتى ذلك الحين ، استمتع.

06:37.840 --> 06:38.380
أنا.