WEBVTT

00:02.520 --> 00:04.620
المدرب: مرحبًا بالجميع ومرحبًا بعودتك.

00:04.620 --> 00:07.920
في هذا الفيديو سنتحدث عن كيفية

00:07.920 --> 00:11.640
استخدام ChatGPT لحل "الاختراق"

00:11.640 --> 00:15.540
، باستخدام ChatGPT لتنفيذ A3C.

00:15.540 --> 00:19.470
لذلك قمت بالفعل بتحفيز ذلك من خلال الكثير من المطالبات المجنونة

00:19.470 --> 00:23.010
، وحصلنا على نتائج مذهلة ، وسنراهم في ثانية.

00:23.010 --> 00:25.170
لذلك ، سيكون هذا الفيديو في الأساس

00:25.170 --> 00:26.640
عرضًا مشيًا خلال عملية

00:26.640 --> 00:28.740
تفكيري حول كيفية حصولي على النتائج

00:28.740 --> 00:31.470
بالفعل ، وكيف يمكنك بالفعل استخدام ChatGPT

00:31.470 --> 00:34.890
لإنشاء خوارزمية A3C أيضًا.

00:34.890 --> 00:39.360
حسنًا ، لقد بدأت بشكل مشابه لما كان لدينا في "DOOM" ، لقد ذكرت

00:39.360 --> 00:41.340
، حسنًا ، أنت في الأساس خبير

00:41.340 --> 00:42.930
في التعلم الآلي ولديك

00:42.930 --> 00:46.110
سنوات من الخبرة في مجال الروبوتات.

00:46.110 --> 00:50.490
أنا أوظفك للقيام بخوارزمية A3C لـ "Breakout. الهدف هو الحصول على خوارزمية SOTA و A3C

00:50.490 --> 00:52.110
تعمل بكامل طاقتها

00:52.110 --> 00:56.100
يمكنها لعب لعبة "Breakout".

00:56.100 --> 00:58.401
لقد قمت بتطبيق فئات ، وبيئة

00:58.401 --> 01:00.150
رمز الاختبار ، وإصدارات

01:00.150 --> 01:02.520
مخصصة من مُحسِّن آدم الذي

01:02.520 --> 01:05.040
يُستخدم كمحسِّن للأوزان المشتركة

01:05.040 --> 01:07.590
لطراز A3C.

01:07.590 --> 01:09.361
هذا يعطيها المزيد من السياق

01:09.361 --> 01:13.076
، ما فعلته ، سأقدم لك هذه الأشياء الثلاثة.

01:13.076 --> 01:18.000
لذا كما أشرت قبل إنشاء بقية الكود ، فإن هدفك هو تنفيذ

01:18.000 --> 01:20.160
الحل الكامل باستخدام

01:20.160 --> 01:21.900
Python ، Torch ، بشكل

01:21.900 --> 01:23.250
مشابه لما لدينا

01:23.250 --> 01:25.650
، وتحسين الكود ليتم تنفيذه

01:25.650 --> 01:27.690
في Google Colab ، تمامًا

01:27.690 --> 01:31.680
كما كان لدينا من قبل.

01:31.680 --> 01:33.540
بالإضافة إلى ذلك ، قم بالتعليق

01:33.540 --> 01:35.850
على كل سطر من الكود حتى يتمكن الطلاب

01:35.850 --> 01:38.590
من فهم ما فعلته في الكود.

01:40.710 --> 01:42.990
اطرح أسئلة توضيحية إذا لزم الأمر ، احصل عليها.

01:42.990 --> 01:46.500
لذلك لدينا بعض التداخل بين ما فعلناه

01:46.500 --> 01:48.360
للمحادثة Deep Q لـ "DOOM"

01:48.360 --> 01:53.130
، لكنني أضفت الكثير من السياق الذي لدي بالفعل أشياء

01:53.130 --> 01:54.600
تم تنفيذها ، وأود

01:54.600 --> 01:57.390
أن يتم استخدامها.

01:57.390 --> 02:00.210
هذا ما أبدأه وتم تأكيده.

02:00.210 --> 02:03.030
نعم ، أفهم ذلك وسأطرح أي

02:03.030 --> 02:06.840
أسئلة ، يرجى تقديم بقية الكود.

02:06.840 --> 02:09.510
ثم ذكرت ، هذا محسن آدم ، لقد قمت

02:09.510 --> 02:11.753
بلصق رمز محسن آدم ، للموارد

02:11.753 --> 02:15.180
التي لدينا ، وأعطيت هذه التعليمات ، وقلت

02:15.180 --> 02:16.920
، انتظر بقية الكود

02:16.920 --> 02:18.870
قبل التنفيذ ، أنا فقط

02:18.870 --> 02:21.963
، قبل أن أحصل على أي نتائج جيدة ، لقد

02:23.130 --> 02:27.210
قمت بلصقه للتو وانتقل على الفور إلى تنفيذ A3C

02:27.210 --> 02:30.510
، دون انتظار الباقي.

02:30.510 --> 02:32.310
لذا أضفت هذا كنوع من

02:32.310 --> 02:33.750
التعليمات البرمجية

02:33.750 --> 02:38.750
النظامية ، موجه نظامي ، وقال ، حسنًا ، يرجى توفير البيئة

02:39.060 --> 02:41.820
واختبار الكود.

02:41.820 --> 02:42.653
إذن فهو يشير في الواقع إلى

02:42.653 --> 02:43.650
ما قدمناه في الموجه الأول.

02:43.650 --> 02:46.323
قلت ، رائع ، إليك تنفيذ

02:47.160 --> 02:51.030
بيئة الصالة الرياضية.

02:51.030 --> 02:52.173
لقد قمت بلصق هذا الرمز

02:53.760 --> 02:56.010
الرئيسي ، وأضفت سياق هنا ، إذا ألقيت نظرة

02:56.010 --> 02:57.128
، وهذا هو الملف الرئيسي

02:57.128 --> 02:59.040
الذي يشغل كل شيء.

02:59.040 --> 03:01.383
ثم قلت ، حسنًا ، رائع ، انتظر

03:03.690 --> 03:05.267
كود الاختبار.

03:05.267 --> 03:06.813
وقد قال ، نعم ، ومع ذلك ، ما

03:07.830 --> 03:08.766
زلت بحاجة إلى رؤية

03:08.766 --> 03:11.880
كود الاختبار قبل أن أقوم بتطبيق A3C ، قلت ، رائع ،

03:11.880 --> 03:13.410
إليك رمز اختبار.

03:13.410 --> 03:15.813
وترى أن هذا هو كيف إذا كان

03:16.920 --> 03:19.170
لديك مشروع أكبر وأكبر ،

03:19.170 --> 03:21.480
يمكنك استخدام ذلك للتأثير

03:21.480 --> 03:23.230
عليه نوعًا ما لاستخدام

03:24.330 --> 03:27.810
قطعة من الكود أو كمرجع ، في النمط بحيث

03:27.810 --> 03:30.870
يمكنك بالفعل إنشاء شيء في أسلوبك

03:30.870 --> 03:33.630
في الكود.

03:33.630 --> 03:34.983
رائع ، وعندما فعلت

03:36.360 --> 03:38.370
ذلك ، قال ، رائع ، اذهب إليه.

03:38.370 --> 03:41.190
وقد قال بشكل أساسي أنني سأستخدم

03:41.190 --> 03:45.840
هذا الرمز الرئيسي ، وأختبر ، وأنفذ هذا.

03:45.840 --> 03:49.200
وبعد ذلك قال ، خلق النموذج. py ، وهو ما فعلناه بالفعل في الدورة التدريبية

03:49.200 --> 03:52.800
أيضًا.

03:52.800 --> 03:55.830
وقال ، ها هو نموذج الممثل الناقد

03:55.830 --> 03:58.620
، وأنا أقارن بنموذجنا.

03:58.620 --> 04:00.630
هذا هو الإصدار الأحدث من Python

04:00.630 --> 04:02.310
، ويمكن تهيئة الكثير من الأوزان

04:02.310 --> 04:05.640
وأشياء من هذا القبيل بطريقة أكثر أناقة.

04:05.640 --> 04:09.060
لذلك فعلت ذلك وهي تستخدم بشكل جيد

04:09.060 --> 04:13.680
جدًا ، ثم قامت بإنشاء رمز القطار ، وبشكل أساسي

04:13.680 --> 04:15.663
ActorCritic.

04:16.500 --> 04:19.860
وإذا ألقيت نظرة ، فهذا أمر بسيط للغاية ،

04:19.860 --> 04:22.020
لذا فهو بالتأكيد بحاجة إلى

04:22.020 --> 04:23.039
التحسين.

04:23.039 --> 04:25.980
إذن ما يمكنك فعله ، يمكنك أن تقول

04:25.980 --> 04:27.423
، حسنًا ، لقد قلت

04:28.500 --> 04:31.560
استمر ، وسيستمر في تدوينه.

04:31.560 --> 04:35.373
لقد خلقت هذا كنوع من الخسارة

04:37.920 --> 04:41.040
، ولكن هناك ، نعم ، في الأساس

04:41.040 --> 04:45.030
كل ما نحتاجه ، لقد حسّن كل شيء

04:45.030 --> 04:51.333
، ويمكنك رؤية هذا المُحسِّن.

04:51.333 --> 04:51.333
توقف في النهاية.

04:53.160 --> 04:56.550
لذلك فقد استخدم أساسًا

04:56.550 --> 04:58.080
كل ما حددناه حتى الآن

04:58.080 --> 04:59.220
، بالإضافة إلى الخسارة

04:59.220 --> 05:02.490
المناسبة ، ونعم ، المحسن ، كل شيء.

05:02.490 --> 05:05.730
هذا كل شيء.

05:05.730 --> 05:07.591
في خطوتين بسيطتين ،

05:07.591 --> 05:10.530
تمكنا من تنفيذ الكود بالكامل لأحد

05:10.530 --> 05:13.170
النماذج الحديثة التي تصادف

05:13.170 --> 05:15.270
أنها واحدة من أفضل النماذج

05:15.270 --> 05:18.450
في عام 2017 ، 2018.

05:18.450 --> 05:21.060
حتى يومنا هذا ، تمتلك في الواقع

05:21.060 --> 05:24.900
قدرة كبيرة على حل البيئات المعقدة مثل

05:24.900 --> 05:27.240
"الاختراق. لقد رأيت الآن ، بعد أن أصبح لدينا

05:27.240 --> 05:28.710
ChatGPT على سبيل المثال

05:28.710 --> 05:32.490
، يمكنك توجيهه لتنفيذ أجزاء معينة من الكود.

05:32.490 --> 05:35.250
وإذا كنت لا تعرف ما تفعله

05:35.250 --> 05:36.990
أجزاء معينة من

05:36.990 --> 05:39.450
الكود فعليًا ، فيمكنك

05:39.450 --> 05:41.430
أن تذهب وتسأله ، على

05:41.430 --> 05:42.450
سبيل المثال

05:42.450 --> 05:44.853
، رائع ، هل يمكنك شرح جزء

05:47.310 --> 05:51.840
التدريب وأين هي عادة آدم؟

05:51.840 --> 05:56.200
لذلك أنا أحثه على شرح نفسه بالفعل ، لذلك فهذه

05:58.320 --> 05:59.223
طريقة أخرى

06:04.740 --> 06:08.430
لدفعه بشكل أساسي لإعطائك المزيد من المنطق

06:08.430 --> 06:10.290
وراء جيله.

06:10.290 --> 06:12.570
ويمكنك أن ترى أنه

06:12.570 --> 06:16.803
في الواقع سيشرح خطوة بخطوة.

06:17.730 --> 06:18.563
لذا ، نعم ،

06:18.563 --> 06:21.213
يمكننا انتظار هذا ، يمكنك فعل نفس

06:22.920 --> 06:25.890
المطالبات وستحصل على نتائج مشابهة

06:25.890 --> 06:27.510
حقًا لنتائجي ، ولكن

06:27.510 --> 06:30.030
بشكل عام ، ما سيفعله الآن هو أن

06:30.030 --> 06:31.950
يأخذ وظيفة القطار التي

06:31.950 --> 06:34.050
حددتها في الأعلى هنا ، وسوف

06:34.050 --> 06:38.010
يمر بشكل أساسي بكل خطوة وينفذها.

06:38.010 --> 06:40.890
لذا نعم ، سيكون ذلك.

06:40.890 --> 06:43.803
أنا بالتأكيد أشجعك على تجربة هذا الرمز

06:44.700 --> 06:46.053
في Google Colab

06:47.580 --> 06:48.600
، ويمكن القيام

06:48.600 --> 06:52.863
به ، وسيكون من الصعب بعض الشيء جعله يعمل ، بسبب التصور

06:53.730 --> 06:54.780
والقيود المفروضة

06:54.780 --> 06:58.380
على بيئة Goggle Colab.

06:58.380 --> 06:59.760
ومع ذلك ، يمكنك بالتأكيد

06:59.760 --> 07:02.430
الانتقال ولصق الأخطاء هنا ، ويمكنك ، يمكنك

07:02.430 --> 07:03.840
الذهاب والحصول على بعض

07:03.840 --> 07:07.083
النتائج اللائقة لذلك لتصحيح العملية.

07:08.580 --> 07:11.310
ونعم ، سأسمح لك بذلك ، والآن لديك

07:11.310 --> 07:13.890
طريقة لاستخدام ChatGPT حول

07:13.890 --> 07:16.860
كيفية الحصول على قيمة لـ A3C.

07:16.860 --> 07:20.400
ونعم ، أتمنى أن تكون قد استمتعت

07:20.400 --> 07:24.960
بالدورة حتى الآن ، مع السلامة.
