WEBVTT

00:00.240 --> 00:05.250
مرحبًا ومرحبًا بكم في الجزء الثاني من تدريب الذكاء الاصطناعي على التعلم التلافيفي العميق.

00:05.250 --> 00:06.090
هذا صحيح.

00:06.090 --> 00:11.460
الآن بعد أن قمنا ببناء الذكاء الاصطناعي مع بنية الشبكة العصبية والجسم والطريقة التي يتم بها تنفيذ

00:11.460 --> 00:16.980
الإجراءات وكل شيء ، فقد حان الوقت لتدريب هذا الذكاء الاصطناعي بالتعلم التلافيفي العميق.

00:16.980 --> 00:22.740
من الآن فصاعدًا ، سنقوم بتنفيذ تجربة إعادة التشغيل ، والعمل مع القيم الأساسية

00:22.740 --> 00:28.950
، والعمل مع المكافآت ، وستكون هناك أيضًا مكافأة ستحسن كثيرًا من عملية التدريب وهذا

00:28.950 --> 00:31.410
ما يسمى تتبع الأهلية.

00:31.530 --> 00:38.940
يعد تتبع الأهلية أسلوبًا قويًا يتكون من تجميع المكافأة على عدة خطوات ، ويتم تعلم القيم الأساسية على هذا

00:38.940 --> 00:44.700
التراكم للمكافأة بدلاً من السابق ، حيث تم تعلم قيم التلميح بعد كل انتقال ، وبالتالي

00:44.700 --> 00:50.250
، بعد الحصول على كل مكافأة ، هذا الوقت الذي سنتعلم فيه القيم الأساسية بعد الحصول

00:50.250 --> 00:54.390
على العديد من المكافآت بدلاً من مكافأة واحدة فقط.

00:54.390 --> 01:01.020
لذلك بدلاً من إجراء انتقال واحد تلو الآخر وتحديث قيمة التلميح في كل مرة ، حسنًا ، سيتم

01:01.020 --> 01:07.590
تحديث قيم التلميح في كل مرة وخطوات لأن تتبع الأهلية يُسمى بالأحرى وخطوات تتبع الأهلية

01:07.590 --> 01:12.570
و MN هو هذا الرقم وبعد ذلك قيم جديلة سيتم تحديثها.

01:12.570 --> 01:15.390
وفي نموذجنا هنا ، سيكون لدينا يساوي عشرة.

01:15.390 --> 01:20.910
هذا يعني أننا سنكون تتبع أهلية من عشر خطوات ، وبالتالي سنقوم بتحديث وتعلم قيم

01:20.910 --> 01:25.470
التلميح كل عشر خطوات بعد تجميع المكافآت في هذه الخطوات العشر.

01:25.470 --> 01:29.490
لذا فهذه مكافأة ستجعل نموذجنا أكثر قوة.

01:29.490 --> 01:33.000
وسترون أننا في النهاية سنحقق نتائج باهرة.

01:33.000 --> 01:35.820
لقد اندهشت حقًا عندما رأيت النتائج النهائية.

01:35.820 --> 01:40.200
اعتدت العمل على نماذج استغرقت وقتًا طويلاً في التنفيذ.

01:40.200 --> 01:44.280
كما تعلم ، استغرق الذكاء الاصطناعي الكثير من الوقت للتدريب ، لكنك سترى ذلك مع هذا.

01:44.280 --> 01:50.400
بالإضافة إلى الشبكة العصبية التي أنشأناها والتي هي دماغنا وجسمنا هنا بالأشياء ، ماكس ، سنحصل

01:50.400 --> 01:56.460
على أخلاقيات قوية جدًا وبالتالي ذكاء اصطناعي قوي جدًا لأنك سترى أنه سيتحول إلى التطرف.

01:56.490 --> 01:58.920
هل تفهم ما أتحدث عنه؟

01:59.100 --> 02:04.980
لذا كما ترون في هذا الجزء الثاني ، بدأنا بالحصول على بيئة الهلاك وأقوم بالفعل بإعداد سطور التعليمات

02:04.980 --> 02:06.510
البرمجية من أجلك.

02:06.540 --> 02:12.690
نحن نستخدم فقط ملف خارجي للمعالجة المسبقة للصورة من مجلد دليل العمل الخاص بنا.

02:12.690 --> 02:19.980
إذن فالترتيب هو بالأحرى أخذ هذا السطر من الكود Jim الذي يجعل كود pachyderm صفرًا.

02:19.980 --> 02:24.270
إذن ، رمز الموت للصفر هو اسم بيئة اللعبة التي نلعبها.

02:24.270 --> 02:26.910
لذلك أولاً نستورد البيئة بهذا.

02:26.910 --> 02:35.250
Jim الذي يجعل هذا ما يمكنك العثور عليه في دروس Jim التعليمية المفتوحة ، ولكن بعد ذلك نستخدم فئة الصور

02:35.250 --> 02:42.300
قبل المعالجة وهي عبارة عن فصل من معالجة الصور إلى المعالجة المسبقة للصور التي ستأتي إلى

02:42.300 --> 02:48.930
الشبكة العصبية ونقوم بمعالجتها مسبقًا بحيث يكون لديهم مربع بأبعاد 80 × 80.

02:48.930 --> 02:56.400
ويتذكر ذلك أنه في شبكتنا العصبية حيث قمنا بتعيين الصور المدخلة لدينا بحيث تكون الأبعاد واحدًا

02:56.400 --> 03:00.360
في 80 × 80 ، تذكر أن واحدًا هو عدد القنوات.

03:00.360 --> 03:03.360
وهذا يعني أننا نعمل مع الصور بالأبيض والأسود.

03:03.420 --> 03:06.150
هذا هو المقياس الرمادي هنا.

03:06.600 --> 03:14.670
وتعني 80 في 80 أن أبعاد الصور المدخلة ستكون 80 × 80 ، وهذا ما حددناه في الشبكة العصبية.

03:14.670 --> 03:21.000
لكن بالطبع نحتاج إلى تحديد ذلك عند إدخال الصور ، وهو بالضبط ما نفعله هنا مع فئة

03:21.000 --> 03:22.950
الصورة قبل المعالجة.

03:23.400 --> 03:29.370
وبعد ذلك ، بعد استيراد البيئة بالتنسيق الصحيح لصور الإدخال ، حسنًا ، نقوم باستيراد اللعبة بأكملها بمقاطع الفيديو

03:29.370 --> 03:32.250
التي تحتوي على سطر التعليمات البرمجية هذا.

03:32.250 --> 03:37.650
وتذكر أن الشيء الرائع في هذا هو أنه في النهاية سنرى مقاطع فيديو لعذاب الذكاء الاصطناعي الخاص بنا.

03:37.650 --> 03:41.880
لذلك سنرى كيف سيقتل الوحوش ، نحاول الوصول إلى السترة وكل شيء.

03:41.910 --> 03:43.290
لذلك سيكون هذا مثيرًا للغاية.

03:43.290 --> 03:47.940
وتذكر أن مقاطع الفيديو هذه ستنتقل إلى مجلد مقاطع الفيديو هذا.

03:48.480 --> 03:49.050
حسنا.

03:49.050 --> 03:52.980
والسطر الأخير هنا ، لكني أريد أن أعرضه عليكم ، لأن هذا مهم.

03:52.980 --> 03:56.610
هذا الآن أكثر ارتباطًا بالذكاء الاصطناعي الذي نبنيه.

03:56.610 --> 04:02.610
حسنًا ، تذكر أن شبكتنا العصبية تتخذ إجراءات رقم الإدخال.

04:02.610 --> 04:07.710
هذا لأننا ، كما تعلمون ، نريد أن نصنع ذكاءً اصطناعيًا يمكننا اختباره بسهولة في العديد من البيئات

04:07.710 --> 04:09.390
، في العديد من بيئات الهلاك.

04:09.390 --> 04:15.040
وبما أن بيئات العذاب المختلفة لها عدد مختلف من الإجراءات حيث نحدد هذا

04:15.060 --> 04:19.080
العدد متغير الإجراءات كمدخلات من CNN ، الدماغ.

04:19.080 --> 04:26.160
وبالتالي ، ما سنفعله الآن هو الحصول على متغير الإجراءات العددية هذا باستخدام بيئة العذاب التي قمنا

04:26.160 --> 04:29.040
باستيرادها وإنشاءها في هذا المتغير.

04:29.040 --> 04:34.410
ولاحقًا ، سيكون متغير الإجراءات العددية الذي نحن على وشك إنشائه هو مدخلات الدماغ.

04:34.620 --> 04:35.820
لذلك دعونا نفعل هذا.

04:35.820 --> 04:40.230
أنا أقدم هذا العدد الحقيقي المتغير الآن من الإجراءات.

04:40.230 --> 04:42.420
لذا فإن عدد الإجراءات يساوي.

04:42.450 --> 04:45.630
الآن سنأخذ بيئتنا المهلكة.

04:45.630 --> 04:47.730
هذا هو المتغير الذي أنشأناه.

04:47.880 --> 04:52.590
إذن بيئة الهلاك ، ثم نضيف نقطة هنا ثم حسنًا هنا نبدأ.

04:52.590 --> 04:54.780
نأخذ أول مساحة عمل هنا.

04:54.780 --> 04:56.970
هذه هي مجموعة أفعالك.

04:56.970 --> 04:59.910
أنا أشجعك على إلقاء نظرة على الافتتاح.

05:00.060 --> 05:05.430
Hoiles لمعرفة كيف يعمل ، كما تعلم ، لفهم كيفية عمل بيئات الصالة الرياضية في الهواء الطلق.

05:05.430 --> 05:07.800
لكن هذه هي في الأساس مجموعة الإجراءات.

05:07.800 --> 05:12.750
ومن خلال هذه المجموعة من الإجراءات ، يمكننا الوصول إلى عدد الإجراءات في البيئة.

05:12.750 --> 05:21.000
وللقيام بذلك أضفنا أن هنا و DN هو عدد الإجراءات وبالتالي العذاب وأن مساحة العمل التي ستعيدها

05:21.000 --> 05:23.790
النقطة n ستعيد سبعة.

05:23.790 --> 05:26.520
ستعيد سبعة لأن هناك سبعة أفعال.

05:26.520 --> 05:32.250
أعلم أنه يمكننا رؤية ستة إجراءات في بيئات الهلاك في الصفحة الافتتاحية ، لكنني أعتقد أنه يمكننا أيضًا الركض

05:32.250 --> 05:38.820
وبالتالي يمكننا المضي قدمًا ، والتحرك يسارًا ، والتحرك يمينًا ، والانعطاف يسارًا ، والانعطاف يمينًا وإطلاق النار.

05:38.820 --> 05:39.990
وإلى جانب ذلك ، يمكننا الركض.

05:39.990 --> 05:41.370
هذا يجعل سبعة أفعال.

05:42.140 --> 05:42.520
حسنا.

05:42.530 --> 05:48.350
وهذا كل شيء للحصول على بيئة الهلاك التي لدينا ، بيئة الهلاك لدينا عدد من الإجراءات.

05:48.350 --> 05:52.640
لذلك لدينا حتى الآن كل ما نحتاجه لأدمغتنا.

05:52.640 --> 05:58.220
سنقوم بعد ذلك فقط بإنشاء كائن ، كائن دماغي ، والذي سنطلق عليه CNN مع الحد الأدنى من الأحرف.

05:58.220 --> 06:03.860
ونظرًا لأن دالة init تأخذ عددًا من الإجراءات كوسيطات ، حسنًا ، سنقوم بإدخال

06:03.860 --> 06:06.890
عدد الإجراءات في كائن CNN الذي سننشئه.

06:07.310 --> 06:11.630
وبعد ذلك بالطبع ، سنخلق الجسد ونموت في النهاية.

06:11.630 --> 06:17.570
وهذا هو السبب في أن القسم التالي ، سأطلق عليه اسم بناء ذكاء اصطناعي ، لأنه يمكننا الآن بناء العديد

06:17.570 --> 06:18.940
من العيون كما نريد.

06:18.950 --> 06:21.950
هذا هو الشيء الرائع في البرمجة الشيئية.

06:21.950 --> 06:28.280
يمكننا بناء أي عيون كما نريد ، ولذا سنقوم ببناء الذكاء الاصطناعي لدينا الذي يحتوي على دماغ متطور ، وهذا

06:28.280 --> 06:31.370
بالضبط ما سنفعله في البرنامج التعليمي التالي.

06:31.670 --> 06:32.930
حتى ذلك الحين ، استمتع.

06:32.930 --> 06:33.320
أنا.
