WEBVTT

00:00.470 --> 00:03.750
أهلا ومرحبا بكم مرة أخرى في دورة الذكاء الاصطناعي.

00:03.770 --> 00:09.140
في درس اليوم ، بدأنا القسم الخاص بالتعلم الأساسي التلافيفي العميق.

00:09.140 --> 00:10.820
لذلك دعونا نلقي نظرة على ما يدور حوله كل شيء.

00:10.820 --> 00:18.890
تحدثنا سابقًا عن التعلم العميق ، لذلك كان لدينا بيئة مع عامل وكان لدينا ناقل يصف تلك

00:18.890 --> 00:23.030
البيئة التي تم تغذيتها في شبكة عصبية.

00:23.030 --> 00:26.090
وفي النهاية حصلنا على قيم Q كمخرجات.

00:26.120 --> 00:29.210
ثم بالطبع اكتشفنا كيفية تدريب الشبكة.

00:29.210 --> 00:29.870
جزء التعلم.

00:29.870 --> 00:32.900
اكتشفنا كيف يتم تحديد الإجراءات بناءً على قيم الإشارات هذه.

00:32.900 --> 00:34.370
هذا جزء من العمل.

00:34.370 --> 00:42.140
وتحدثنا عن سياسات اختيار الإجراء وأشياء مختلفة حول كيفية عمل التعلم العميق.

00:42.140 --> 00:51.200
لكن هنا المفهوم الأساسي لكل هذا هو كيف ننتقل من هذا ، من البيئة الفعلية والحالة

00:51.200 --> 00:54.410
إلى الشبكة العصبية؟

00:54.410 --> 00:57.800
حسنًا ، لقد انتهى الانتقال هنا ، متجه الإدخال.

00:57.800 --> 01:02.180
إذن طبقة الإدخال لشبكتنا العصبية وهي متجه.

01:02.180 --> 01:07.490
إذن ما ننظر إليه هو OC ، لذا فنحن في الواقع لسنا هو المصطلح ، إنه ليس المصطلح الصحيح ، ولا

01:07.490 --> 01:08.720
ننظر إلى أي شيء.

01:08.720 --> 01:12.230
الوكيل لديه هذه المعلومات بشكل أساسي.

01:12.230 --> 01:17.600
إذن البيئة تمرر هذه المعلومات قائلة ، حسنًا ، أنت الوكيل ، أنت حاليًا في هذا

01:17.900 --> 01:24.530
، حالتك موصوفة بواسطة هذا المتجه وهذا المثال المبسط ، يتم وصفه بواسطة هذا المتجه x واحد من

01:24.530 --> 01:26.660
واحد ، x اثنان من اثنين.

01:26.690 --> 01:30.020
إذن ، إحداثياتك هي واحد اثنان وهذه هي حالتك الكاملة.

01:30.020 --> 01:36.020
في بيئة أكثر تعقيدًا ، قد تتضمن الحالة أشياء أخرى يمكن أن يراقبها الفاعل.

01:36.020 --> 01:39.050
لكن النقطة هنا هي أنه يتم طرحه كمتجه.

01:39.050 --> 01:45.740
والشيء هو أن هذا لا يحدث في الحياة الواقعية ، في الحياة الواقعية ، باستثناء أنظمة GPS وأشياء أخرى من هذا

01:45.740 --> 01:46.310
القبيل.

01:46.310 --> 01:48.350
لكن في الحياة الواقعية ، ماذا نستخدم؟

01:48.350 --> 01:48.890
معظم الوقت؟

01:48.890 --> 01:50.840
نستخدم حواسنا وأعيننا.

01:50.840 --> 01:53.600
حتى في نظام تحديد المواقع العالمي (GPS) ، فهو غير مدمج في دماغنا.

01:53.600 --> 01:56.060
إنه لا يخبرنا بالإحداثيات عبر دماغنا.

01:56.060 --> 02:02.540
ولذا فنحن ما زلنا نستخدم أعيننا للنظر إلى GPS وفهم ما يحدث هناك.

02:02.720 --> 02:09.560
وهذا نوع من الغش للذكاء الاصطناعي لتكون قادرة على الحصول على مثل المعلومات حول البيئة كمتجه.

02:09.560 --> 02:10.520
الأمر بسيط للغاية.

02:10.520 --> 02:11.960
إنها ليست الطريقة التي تعمل بها في الحياة الواقعية.

02:11.960 --> 02:13.790
هذه ليست الطريقة التي نعمل بها نحن البشر.

02:13.880 --> 02:19.010
وفي النهاية ، نريد إنشاء ذكاء اصطناعي ، يمكن أن يعمل بطريقة مشابهة للبشر

02:19.010 --> 02:23.240
، وهو ما يمكنه من مواجهة نفس التحديات التي يواجهها البشر.

02:23.240 --> 02:28.130
وهكذا في العالم البشري ، ليس لدينا ذلك ، ليس لدينا ذلك ، ليس لدينا هذه الإحداثيات أو

02:28.130 --> 02:33.560
أنواع أخرى من المتجهات التي تم طرحها لنا والتي تشرح الحالة التي نحن فيها في تلك البيئة.

02:33.560 --> 02:37.250
لذا سيتعين علينا إزالة ذلك لجعله أكثر واقعية.

02:37.250 --> 02:38.750
ثم ما الذي يمكننا استبداله به؟

02:38.750 --> 02:42.110
ماذا نرى أو ماذا نفعل كبشر للحصول على المعلومات؟

02:42.110 --> 02:46.070
حسنًا ، في معظم الأوقات التي نراها ، بالطبع ، نستخدم جميع حواسنا

02:46.070 --> 02:51.260
، لكن معظم المعلومات التي نحصل عليها عن العالم من حولنا تأتي من خلال أعيننا.

02:51.260 --> 02:59.930
ولهذا السبب سنقوم بتغيير ذلك السهم الصغير الذي كان لدينا إلى شبكة عصبية تلافيفية كاملة.

02:59.930 --> 03:03.680
إذن هذا من الملحق رقم اثنين.

03:03.830 --> 03:09.170
لدينا الطبقة التلافيفية ، ولهذا من المهم أن تكون مرتاحًا تمامًا مع الشبكات العصبية

03:09.260 --> 03:11.030
الالتفافية وكيفية عملها.

03:11.030 --> 03:14.840
لذلك إذا كنت قد أكملت دورة التعلم العميق الخاصة بنا ، فيجب أن تكون مرتاحًا لذلك.

03:14.840 --> 03:16.880
أو يمكنك فقط إلقاء نظرة على الملحق.

03:16.880 --> 03:20.390
ثانيًا ، لدينا بعض الدروس التعليمية الجيدة جدًا عن الحدس.

03:20.390 --> 03:24.260
إذن لدينا هنا عملية الالتواء التي تحدث.

03:24.260 --> 03:27.230
لذلك سننظر إلى هذا على أنه صورة.

03:27.230 --> 03:31.250
إذن هذه صورة للبيئة الصافية.

03:31.250 --> 03:33.920
وبالتالي فإن الوكيل يبحث بالفعل في البيئة.

03:33.920 --> 03:40.610
إذن في هذه الحالة ، ليس لأنه يشبه النظر من الداخل هناك ، إنه يبدو وكأنه لنفترض أنه يلعب هذا على جهاز

03:40.610 --> 03:45.380
كمبيوتر ويمكنه رؤية هذه البيئة وبالتالي يمكنه رؤية مكان وجود هذا الرقم

03:45.740 --> 03:48.350
الذي يمثل الوكيل في الواقع.

03:48.350 --> 03:53.150
لذلك يمكنك أن ترى هذه البيئة بأكملها أو أيًا كان ما يراه الإنسان إذا كانت متاهة فعلية وسيرى الإنسان

03:53.150 --> 03:54.200
المتاهة من الداخل.

03:54.200 --> 03:56.390
وبالتالي يجب أن يكون العملاء قادرين على رؤية نفس الشيء بالضبط.

03:56.390 --> 04:02.030
لذا فإن ما يراه يتم من خلال طبقة التفاف ويمر عبر طبقة تجميع كاملة.

04:02.030 --> 04:03.230
يمر من خلال التسطيح مرة أخرى.

04:03.230 --> 04:10.640
يمكنك معرفة المزيد حول هذه الأجزاء المختلفة من الشبكة العصبية التلافيفية في الملحق.

04:10.640 --> 04:16.730
ثم بعد أن يتم تسويتها ، لدينا مدخلات تدخل في الشبكة العصبية.

04:16.730 --> 04:24.530
وهذه طريقة أكثر واقعية لأن الوكيل يجب أن يستخدم مواقعه و / أو يجب عليه معالجة الصور

04:24.530 --> 04:31.340
التي توفرها البيئة للوكيل ، تمامًا كما يقوم الإنسان بمعالجة الصور.

04:31.340 --> 04:37.430
والجمال في هذا ليس فقط أنه أكثر واقعية وأنه يشبه إلى حد ما هنا العوامل الموجودة في

04:37.430 --> 04:43.130
الواقع أكثر مثل الإنسان ، ولكنها تسمح لنا بمعالجة بيئات أكثر تعقيدًا.

04:43.130 --> 04:48.890
على سبيل المثال ، هذه هي الطريقة التي يمكننا بها لعب Doom أو ألعاب أخرى من هذا القبيل

04:48.890 --> 04:56.000
، لأنه بدلاً من مجرد الحصول على ناقل المعلومات الذي مثل شخص ما قد خلقه لنا في هذه البيئة ، يمكننا فقط

04:56.000 --> 05:00.020
ربط الذكاء الاصطناعي ببيئة مثل البشر. ، نحن.

05:00.060 --> 05:01.970
سيكون لدينا رؤية لهذه البيئة.

05:01.970 --> 05:07.550
لذا كإنسان ، عندما تلعب هذه اللعبة ، يمكنك رؤية هذه الصورة بالضبط وهذا بالضبط

05:07.550 --> 05:11.780
ما ستراه الشبكة العصبية الاصطناعية أو الوكيل.

05:11.780 --> 05:16.970
الآن ، في هذا الجزء من الدورة ، عندما تقوم ببرمجة المواد العملية ، سيرى الوكيل

05:16.970 --> 05:19.700
هذه الصورة بالضبط ، سترى وحدات البكسل.

05:19.700 --> 05:25.130
ستحصل على هذه الصورة الدقيقة لكل البكسلات مع هذا الشخص ، مع هذا مع هذا المسدس ، مع هذا

05:25.130 --> 05:27.440
الوجه ، بهذه النسبة ، مع كل شيء.

05:27.440 --> 05:28.580
بالضبط ما نراه هنا.

05:28.580 --> 05:30.350
هذا بالضبط ما سيراه الوكيل.

05:30.590 --> 05:36.230
ثم سيتعين عليها تشريح ذلك من خلال السحب التلافيفي ، وتسطيح الطبقة ، وبعد ذلك ستنتقل إلى

05:36.230 --> 05:37.370
الشبكة العصبية.

05:37.370 --> 05:40.940
وغني عن القول إن الشبكة العصبية ستكون في الواقع أكثر تعقيدًا من ذلك.

05:40.940 --> 05:42.700
لذلك دعونا نستبدلها بشيء مثل هذا.

05:42.710 --> 05:44.330
هذا ليس أكثر تعقيدا بكثير.

05:44.330 --> 05:46.430
هذا يبدو أكثر تعقيدًا بعض الشيء.

05:46.430 --> 05:51.050
لكن في الواقع ، الشبكات العصبية التي ستعمل معها وتخلقها باستخدام Atlan

05:51.050 --> 05:52.580
ستكون ممتعة للغاية.

05:52.580 --> 05:54.050
سيكونون أكثر تعقيدًا من هذا.

05:54.050 --> 05:59.870
لكن كما ترون هنا ، حتى لو كان لدينا خمسة مدخلات فقط بدلاً من اثنين ، فإن الأمور تصبح أكثر

05:59.870 --> 06:00.770
تعقيدًا.

06:00.770 --> 06:04.310
وهنا يمكنك أن ترى أن لدينا العديد من الإجراءات التي يمكن للوكيل اتخاذها.

06:04.310 --> 06:11.900
لذا في لعبة الموت واستدر يمينًا ويسارًا ، انظر إلى أسفل ، ابحث عن ، ركض ، أطلق النار ، أعد تحميل أو كل تلك الإجراءات

06:11.900 --> 06:16.220
المختلفة الممكنة في أول شخص يطلق النار مثل الموت.

06:16.220 --> 06:23.030
علاوة على ذلك ، ليس بالضرورة أنه يمكنك إرفاق هذا الوكيل بنوع آخر من الألعاب.

06:23.030 --> 06:29.840
هذا هو جمالها ، أنها تدرك بعد ذلك أنها تستطيع الآن تشغيل أي نوع من البيئة التي ترفقها بها ، لأنه طالما

06:29.840 --> 06:33.740
يوجد مثل التمثيل المرئي للبيئة ، لتلك البيئة ، فهي تحتوي

06:33.740 --> 06:36.920
بالفعل على البنية التحتية الكاملة.

06:36.950 --> 06:39.740
الهيكل بأكمله جاهز لمعالجة ذلك.

06:39.740 --> 06:43.910
هذا ما يدور حوله التعلم التلافيفي العميق.

06:43.910 --> 06:46.160
لذا فإننا ننتقل حتى إلى الخطوة التالية.

06:46.160 --> 06:54.410
نحن نضيف التلافيف إلى جميع الطبقات التلافيفية في دماغ العملاء الآن ، ونجعلها أكثر

06:54.410 --> 06:55.580
تعقيدًا.

06:55.580 --> 07:01.160
وبالتالي يمكننا مكافأتنا بقدرتنا على حل تحديات أكثر تعقيدًا.

07:01.160 --> 07:06.830
لذلك آمل أن تكون متحمسًا جدًا لأن هذا سيكون قسمًا ملحميًا وسننشئ بعض الأشياء

07:06.830 --> 07:07.760
الرائعة.

07:07.760 --> 07:10.100
ولا أطيق الانتظار لرؤيتك في القصة التالية.

07:10.340 --> 07:11.690
وحتى ذلك الحين ، استمتع.

07:11.720 --> 07:12.230
أنا.