WEBVTT

00:00.440 --> 00:02.280
أهلا ومرحبا بكم في هذا البرنامج التعليمي.

00:02.300 --> 00:07.180
سنقوم الآن بعمل الحلقة الكاملة التي ستحسب خسارة السياسة وخسارة القيمة.

00:07.190 --> 00:12.380
وبمجرد أن نحصل على هاتين الخسارتين ، سنتمكن من استخدام مُحسِّننا لتطبيق النسب المتدرج

00:12.380 --> 00:14.270
العشوائي لتقليل الخسائر.

00:14.660 --> 00:14.960
حسنا.

00:14.960 --> 00:15.780
لذا ها نحن ذا.

00:15.800 --> 00:17.480
نبدأ من هنا.

00:17.480 --> 00:23.240
بالمناسبة ، في البرنامج التعليمي السابق ، قمنا بتنفيذ هذا القسم ونسيت إزالة المسافات البادئة.

00:23.240 --> 00:24.200
اسف بشأن ذلك.

00:24.200 --> 00:30.350
لذا فالبدء من r هنا ليس في الحلقة for والآن نبدأ حلقة for جديدة.

00:30.350 --> 00:35.810
لذا سأبدأ هنا بأربعة وما سنفعله الآن هو أننا سنبدأ من الخطوة الأخيرة التي تم القيام

00:35.810 --> 00:40.220
بها أثناء انتهاء الصلاحية وسنتحرك إلى الوراء في الوقت المناسب.

00:40.220 --> 00:51.050
هذا هو السبب في أنني أقوم هنا بأربع مكافآت في النطاق المعكوس لأن المكافآت هي القائمة.

00:51.050 --> 00:57.050
وبما أن كل خطوة من خطوات الاستكشاف مرتبطة بمكافأة لأنه في كل خطوة نحصل على مكافأة عندما تكون مكافآت

00:57.050 --> 01:03.970
Len هي هذا العدد من الخطوات ويتم استخدام هذا الاتجاه المعاكس هنا حتى نتمكن من العودة في الوقت المناسب.

01:03.980 --> 01:04.970
لذا ها نحن ذا.

01:04.970 --> 01:11.510
والآن ما سنفعله هو تحديث المكافأة التراكمية وهي R وسنقوم بتحديثها بهذه الطريقة.

01:11.510 --> 01:13.790
هذا في الواقع هو نفس ما فعلناه من أجل Doom.

01:13.940 --> 01:18.290
سيكون مساويًا لـ جاما ، التي نحصل عليها من معلماتنا.

01:18.290 --> 01:27.650
أنا آخذ البارامترات الأولى التي تضربها gamma في R بالإضافة إلى مكافأة الخطوة ، والتي يمكننا الحصول عليها من خلال

01:27.650 --> 01:31.220
أخذ مكافأة القائمة ورفع المؤشر عاليًا.

01:31.250 --> 01:35.930
إذن أولاً ، ستكون هذه مكافأة الخطوة الأخيرة ، ثم ستكون

01:35.930 --> 01:42.740
مكافأة الخطوة السابقة وما إلى ذلك. وفي كل مرة نقوم بتحديثها بضربها في جاما ثم إضافة هذه المكافأة في هذه

01:42.740 --> 01:43.250
الخطوة.

01:43.340 --> 01:47.000
وبفعل هذا ، تذكر أننا سنصل في النهاية.

01:47.000 --> 01:48.860
لذا سأكتبها كتعليق.

01:48.890 --> 01:56.510
سوف نحصل على المكافأة التراكمية التي ستساوي في نهاية الحلقة إلى

01:56.510 --> 02:08.450
r صفر ، ومكافأة الخطوة صفر زائد جاما مضروبة في r واحد ، ومكافأة الخطوة الأولى زائد جاما تربيع مضروبة في

02:08.450 --> 02:20.600
R لمكافأة الخطوة الثانية بالإضافة إلى ذلك زائد جاما بقوة n ناقص واحد في المكافأة التي تم الحصول عليها في

02:20.600 --> 02:25.880
الخطوة وسالب واحد حيث n هو عدد الخطوات.

02:25.880 --> 02:27.290
ولكن بعد ذلك كن حذرا.

02:27.290 --> 02:32.210
في النهاية سيكون لدينا جاما بقوة عدد الخطوات.

02:33.460 --> 02:39.640
مرات قيمة قيمة الدالة V المطبقة على الحالة الأخيرة.

02:39.970 --> 02:47.410
هذا ما يجب أن نحصل عليه في النهاية وهذا ما سنحصل عليه لأننا تذكر هنا أننا حصلنا على قيمة الخطوة

02:47.410 --> 02:50.740
الأخيرة لأن هذا تم في نهاية حلقة for هنا.

02:50.920 --> 02:56.050
وهكذا حصلنا على القيمة وضبطناها على أن تكون مساوية لتلك القيمة.

02:56.140 --> 03:03.310
إذن الآن في بداية حلقة for الثانية هذه هنا ستكون مساوية لقيمة الحالة الأقل.

03:03.310 --> 03:10.150
ولكن بعد ذلك من خلال القيام بذلك ، هذا ما سنحصل عليه في النهاية أو يساوي أو صفر زائد جاما r واحد

03:10.150 --> 03:16.570
زائد جاما تربيع أو اثنين زائد جاما قوة n ناقص واحد في المكافأة في الخطوة n ناقص واحد زائد

03:16.570 --> 03:20.700
جاما قوة عدد الخطوات ، مضروبة في قيمة الحالة الأقل.

03:20.710 --> 03:25.840
هذا هو الشيء الرئيسي الذي يجب فهمه في هذا الحساب للمكافأة التراكمية.

03:25.840 --> 03:32.740
ولهذا السبب من المهم أن نبدأ منه بتهيئة قيمتنا هنا والقيام بهذا المعكوس من أجل

03:32.740 --> 03:37.270
التكرار للحصول على هذه المعادلة النهائية كاملة.

03:37.270 --> 03:43.570
والآن بعد أن أصبح لدينا القيمة الصحيحة للمكافأة التراكمية ، حسنًا ، سنحسب الميزة.

03:43.600 --> 03:48.940
والميزة هنا هي مجرد ميزة الحصول على هذه المكافأة مقارنة بالقيمة.

03:48.940 --> 03:56.080
لذلك سأقدم ميزة متغيرة جديدة ، وبالتالي ستكون مساوية لهذه المكافأة التراكمية مطروحًا

03:56.080 --> 04:01.390
منها قيمة الدالة V التي تم الحصول عليها في الخطوة الثانية.

04:01.390 --> 04:07.570
لذلك هذا خطأ مطروحًا منه القيم ، أي الكمال.

04:07.570 --> 04:13.010
والآن بعد أن أصبح لدينا المكافأة التراكمية والميزة ، يمكننا الحصول على خسارة القيمة.

04:13.030 --> 04:19.090
هذه هي الدرجة الأولى التي يمكننا الحصول عليها الآن ، لذلك سنحصل على متغير خسارة القيمة الخاص بنا وسيتم

04:19.090 --> 04:20.830
تحديث هذا بالطريقة التالية.

04:20.830 --> 04:26.980
تذكر حتى الآن أن خسارة القيمة قد تمت تهيئتها إلى الصفر ولذا

04:26.980 --> 04:35.320
سنأخذ خسارة القيمة مرة أخرى ونضيف 0. 5 أضعاف الجذر التربيعي للميزة حتى نتمكن من الحصول عليها بهذه الطريقة.

04:35.320 --> 04:39.190
ميزة نقطة الأسرى الثانية.

04:39.220 --> 04:43.120
هذا يعني فقط مربع الميزة ، الميزة بقوة اثنين.

04:43.210 --> 04:50.710
وهذا هو بالضبط خسارة القيمة ، الخسارة الناتجة عن تنبؤات قيمة ناتج الدالة V

04:50.710 --> 04:52.390
بواسطة الناقد.

04:52.870 --> 04:59.710
ولذا فمن المنطقي أن هذه هي خسارة القيمة لأن تذكر أن الميزة أ للإجراء أ في

04:59.710 --> 05:04.600
حالات الحالة هي الفرق بين قيمة Q وقيمة الدالة V.

05:04.600 --> 05:11.140
ولذا عندما نلعب الإجراء الأمثل بشكل جيد ، نحصل على الحالة الثابتة.

05:11.170 --> 05:17.530
Q الأمثل للعمل الأمثل الذي يلعبه النجم في الحالة كما.

05:18.330 --> 05:21.960
يساوي القيمة المثلى التي نخزنها للولايات.

05:21.960 --> 05:28.230
لذا من البديهي أن نفهم أنه عندما لا تكون الميزة مساوية للصفر ، فسيكون هناك فرق بين هذين الاثنين

05:28.230 --> 05:32.700
، وبالتالي هذه هي الطريقة التي يتم بها قياس الخسارة.

05:33.870 --> 05:37.200
لذا فقد تم حساب خسارة القيمة بواقع أقل.

05:37.200 --> 05:38.850
لدينا الآن واحد آخر لنذهب إليه.

05:38.850 --> 05:42.690
إنها خسارة السياسة وهذا بالضبط ما سنحسبه الآن.

05:42.690 --> 05:49.530
ولحسابها ، نحتاج إلى النظر مرة أخرى في تقدير الميزة المعمم ، لأنه لحساب خسارة السياسة

05:49.530 --> 05:55.500
، نحتاج إلى تقدير الميزة المعمم وللحصول على تقدير الميزة المعمم ، نحتاج

05:55.500 --> 05:59.610
أولاً إلى الاختلاف الزمني لقيم الحالة.

05:59.610 --> 06:02.940
لذلك لدينا أشياء متعددة لحسابها هنا.

06:02.940 --> 06:05.640
وسنبدأ بهذا الاختلاف الزمني.

06:05.640 --> 06:10.290
بمجرد أن نحصل على الاختلاف الزمني ، سنحصل على تقدير الميزة المعمم.

06:10.290 --> 06:14.700
وبمجرد أن نحصل على تقدير الميزة المعمم ، سنحصل على خسارة السياسة.

06:14.700 --> 06:15.390
حسنا.

06:15.390 --> 06:18.510
لنبدأ إذن بالفرق الزمني.

06:18.570 --> 06:31.620
T لذلك t يساوي مكافأة الخطوة الثانية بالإضافة إلى جاما ، والتي نحصل عليها بفضل قائمة المعلمات الخاصة بنا.

06:31.620 --> 06:42.660
لذا فإن المعلمات تضرب غاما قيمة الخطوة الثانية زائد واحد ونضيف تلك البيانات للوصول إليها مطروحًا

06:42.660 --> 06:45.900
منها قيمة الخطوة i.

06:46.740 --> 06:49.380
ونفس الشيء نضيف تلك البيانات.

06:50.150 --> 06:50.480
حسنا.

06:50.480 --> 06:53.880
إذن هذه هي صيغة الاختلاف الزمني لقيم الحالة.

06:53.900 --> 06:58.310
والآن يمكننا التحديث لتقدير الميزة المعمم.

06:58.310 --> 07:08.560
وكيف يتم تحديثه حيث نأخذ غازنا ونضربه بمعامل جاما ، خلية أوقات جاما ، والتي وصلنا إليها باستخدام

07:08.570 --> 07:10.760
معلماتنا أيضًا.

07:10.760 --> 07:18.320
لذلك نأخذ خلية البارامترات ونضيف هذا الاختلاف الزمني لقيم الحالة.

07:18.320 --> 07:19.670
لذا كن حذرا.

07:19.670 --> 07:26.930
نحن في حلقة for وفي كل مرة نضرب الغاز في جاما وفي تاو ونضيف الفرق الزمني.

07:26.930 --> 07:33.800
لذا من المهم أن نفهم أنه في نهاية هذه الحلقة ، حسنًا ، تقدير الميزة

07:33.950 --> 07:41.630
المعمم هذا سيكون مساويًا للشمس في جميع درجات أوقات جاما.

07:41.630 --> 07:44.810
تاو بقوة الذكاء الإصطناعي.

07:44.990 --> 07:47.390
الاختلاف الزمني خطوة بخطوة.

07:48.110 --> 07:48.440
حسنا.

07:48.440 --> 07:50.300
من المهم أن تضع ذلك في الاعتبار.

07:50.390 --> 07:56.930
والآن بعد أن أصبح لدينا الميزة العامة والتقدير والفرق الزمني ، يمكننا أخيرًا

07:56.930 --> 07:58.810
حساب خسارة السياسة.

07:58.820 --> 07:59.990
لذلك دعونا نفعل هذا.

08:00.020 --> 08:10.070
سنقوم بتحديث خسارة سياستنا بالطريقة التالية من خلال اتخاذ خسارة السياسة القديمة ، ونطرح احتمالات السجل التي

08:10.070 --> 08:20.210
تم الحصول عليها في الخطوة الثانية التي نضربها في تقدير الميزة المعمم هذا الذي يتعين علينا وضعه في متغير ، لأننا

08:20.210 --> 08:23.870
سنفعل ذلك بعد ذلك احسب التدرج.

08:23.870 --> 08:26.930
لذلك يجب إرفاقه بتدرج في الرسم البياني الديناميكي.

08:26.930 --> 08:36.470
ثم نضيف سالب 0. 01 يضاعف الانتروبيا ، الانتروبيا التي تم الحصول عليها في الخطوة الثانية في الحلقة for.

08:37.040 --> 08:39.200
ومرة أخرى ، كن حذرا الآن.

08:39.290 --> 08:45.110
هذا هو الحساب داخل الحلقة for ، مما يعني أنه في نهاية حلقة for ،

08:45.110 --> 08:48.140
ما سنحصل عليه هو خسارة السياسة.

08:50.100 --> 08:54.180
يساوي ناقص مجموع الخطوات.

08:55.060 --> 09:05.050
من سجل منتج السياسة في الخطوة الثانية أضعاف تقدير الميزة المعمم زائد هذا

09:05.050 --> 09:06.130
0. 01.

09:07.010 --> 09:09.890
في بعض الأحيان الانتروبيا في الخطوة العالية.

09:09.920 --> 09:10.640
لذا ها نحن ذا.

09:10.640 --> 09:12.890
والآن ما هي السياسة المتبعة في هذه الخطوة؟

09:12.890 --> 09:18.200
حسنًا ، هذه هي احتمالات الحد الأقصى للإجراءات والنتروبيا في الخطوة.

09:18.200 --> 09:22.760
حسنًا ، أنت تعرف ما هو ، هذا ما حسبناه سابقًا وما قمنا بإلحاقه بالقائمة.

09:22.760 --> 09:24.050
لذلك لدينا ذلك بالفعل.

09:24.050 --> 09:29.420
لكن هذه الفطيرة هنا هي الاحتمال الأقصى الناعم للإجراءات.

09:29.960 --> 09:31.990
ولماذا نضع ناقص هنا؟

09:32.000 --> 09:36.980
ذلك لأن لوغاريتم الاحتمال والنتروبيا قيمتان سالبة.

09:36.980 --> 09:43.280
ونظرًا لأننا نريد تقليل قيمتها المطلقة ، يجب أن ننظر إلى هذا الأخير على أنه احتمال لوغاريتمي بدلاً

09:43.280 --> 09:44.180
من مسافة.

09:44.180 --> 09:51.230
كما تعلم ، نريد تعظيم احتمالية لعب الإجراء الذي سيعظم الميزة.

09:51.260 --> 09:52.940
هذه هي الفكرة الكاملة وراءها.

09:52.940 --> 09:57.950
نريد تعظيم احتمالية لعب الإجراء الذي سيعظم الميزة.

09:57.980 --> 10:03.860
ولأولئك الذين قد يتساءلون عن الغرض من معامل الإنتروبيا هذا هو هذا

10:03.860 --> 10:05.630
العامل 0. 01 هنا؟

10:05.660 --> 10:13.370
حسنًا ، الغرض منه هو فقط منع السقوط بسرعة كبيرة في الفخ حيث يكون لدينا توزيع للاحتمالات

10:13.370 --> 10:19.280
بأصفار لجميع الإجراءات باستثناء واحد له احتمال واحد.

10:19.280 --> 10:22.310
وإذا حدث ذلك ، فسيؤدي ذلك إلى تقليل الانتروبيا.

10:22.310 --> 10:29.000
لهذا السبب نضيف هذا المعامل الصغير 0. 01 هنا سيؤدي إلى زيادة الانتروبيا في نزول

10:29.000 --> 10:29.990
التدرج.

10:30.910 --> 10:31.320
تمام.

10:31.420 --> 10:35.220
لذا فإن الخبر السار الآن هو أن الجزء الأكثر صعوبة قد تم إنجازه.

10:35.230 --> 10:40.990
لدينا الخسارتان ، وبالتالي ما نحتاج إلى فعله الآن ونحن نعرف بالفعل كيفية القيام بذلك هو

10:40.990 --> 10:44.560
إجراء هبوط التدرج العشوائي لتقليل هاتين الخسارتين.

10:44.950 --> 10:51.430
وما سنفعله الآن هو الخروج من هذه الحلقة وسنأخذ المحسن الذي صنعناه

10:51.430 --> 10:53.110
بشكل منفصل.

10:53.290 --> 10:58.420
ثم تذكر أن أول شيء يتعين علينا القيام به هو تهيئة جميع معاملات التدرج إلى الصفر.

10:58.420 --> 11:04.210
وللقيام بذلك ، نضيف نقطة ثم طريقة الشبكة السفلية الصفرية.

11:04.690 --> 11:06.790
حسنًا ، تم ذلك بعد ذلك.

11:06.790 --> 11:11.680
سنقوم الآن بالانتشار العكسي ، لكننا سنعطي ضعف أهمية السياسة

11:11.680 --> 11:15.490
أقل من القيمة المفقودة لأن خسارة السياسة أقل.

11:15.730 --> 11:25.630
للقيام بذلك ، سنضع سياسة الأقواس ، ووضع علامة على الخسارة زائد 0. 5 خسارة القيمة.

11:26.620 --> 11:30.160
إذن 4. 5 أضعاف خسارة القيمة.

11:30.430 --> 11:38.260
وسنضيف النقطة هنا وطبقنا الطريقة العكسية لإجراء الانتشار العكسي.

11:38.260 --> 11:44.110
وبفضل هذه الحيلة هنا مع خسارة السياسة بالإضافة إلى نصف خسارة القيمة ، فإننا نعطي ضعف الأهمية

11:44.110 --> 11:46.870
للسياسة أقل من القيمة المفقودة.

11:47.680 --> 11:53.560
ثم سنستخدم خدعة أخرى ، وهي منع التدرج اللوني من أخذ قيم كبيرة للغاية

11:53.560 --> 11:56.770
وبالتالي إنشاء الخوارزمية.

11:56.770 --> 12:03.700
والحيلة للقيام بذلك هي الحصول أولاً على مكتبة torch لدينا ، ثم الوحدة الداخلية من مكتبة

12:03.970 --> 12:07.210
torch ، ثم الوحدة الفرعية utils.

12:07.210 --> 12:14.080
والآن سنستخدم مقطع الوظيفة ، وضع شرطة سفلية grad في معيار النتيجة

12:14.080 --> 12:20.740
وسنقوم بإدخال معلمات نموذجنا بإدخال ثانٍ سيكون 40.

12:20.980 --> 12:26.530
وستتأكد هذه الحيلة بشكل أساسي من أن التدرج اللوني لن يأخذ قيمًا كبيرة للغاية وأن يؤدي إلى

12:26.530 --> 12:27.850
إنشاء الخوارزمية.

12:28.000 --> 12:31.480
ولأولئك الذين قد يتساءلون عن هذه الأربعين سنة بالضبط.

12:31.570 --> 12:37.540
حسنًا ، هذا يعني أننا نستخدم هذه القيمة بحيث يبقى معيار التدرج بين

12:37.540 --> 12:38.410
صفر و 40.

12:38.410 --> 12:42.220
وبالتالي ، هذه هي الطريقة التي نمنع بها التدرج اللوني من أخذ قيم كبيرة جدًا.

12:43.660 --> 12:44.980
لذلك نحن الآن على وشك الانتهاء.

12:44.980 --> 12:52.750
تذكر ، لقد جعلنا هذا يضمن الوظيفة المشتركة في بداية الملف ، وهو التأكد من أن العامل والنموذج المشترك

12:52.750 --> 12:59.650
يشتركان في نفس التدرج اللوني ، وللقيام بذلك للتأكد من أنه يمكننا تطبيق هذه الوظيفة

12:59.650 --> 13:00.610
هنا.

13:01.030 --> 13:14.290
ولذا سنقوم بإضافة شبكات ضمان مشتركة للتأكد من أن النموذج والنموذج المشترك يشتركان في نفس التدرج اللوني.

13:14.500 --> 13:14.830
حسنا.

13:14.830 --> 13:16.450
لذلك هذا مجرد إجراء احترازي.

13:16.450 --> 13:21.310
لست متأكدًا من أن هذا ضروري تمامًا ، لكن ، كما تعلم ، لن نواجه أي مشكلة هنا على الأقل.

13:22.440 --> 13:29.730
وأخيرًا ، السطر الأخير من التعليمات البرمجية ، سنقوم بالطبع بتنفيذ خطوة التحسين لتقليل الخسائر

13:29.730 --> 13:32.040
وأنت تعرف كيفية القيام بذلك.

13:32.070 --> 13:40.310
بالطبع ، نأخذ المحسن الخاص بنا ونضيف هذه الخطوة بين قوسين وهناك نبدأ.

13:40.320 --> 13:43.210
لقد انتهى تدريب أدمغتنا.

13:43.260 --> 13:44.670
لذا تهانينا.

13:44.670 --> 13:46.820
آمل أن هذا لم يكن ساحقًا جدًا.

13:46.830 --> 13:49.410
لا تقلق ، سأقدم الرمز بجميع التعليقات.

13:49.410 --> 13:53.190
لذلك إذا فاتتك أي تفاصيل ، يمكنك إلقاء نظرة على التعليقات.

13:53.190 --> 13:55.860
ولا تقلق إذا لم تفهم شيئًا.

13:55.860 --> 13:57.180
هذا متقدم جدا.

13:57.180 --> 14:00.600
لكن كن مطمئنًا ، هذا أيضًا هو الأقوى.

14:00.600 --> 14:03.930
تذكر ، من الذي صنعه منشئ PyTorch.

14:03.930 --> 14:07.800
لذلك نحن نعمل بالفعل مع الأفضل هنا ، أحدث ما توصلت إليه التكنولوجيا.

14:07.800 --> 14:13.560
لذلك من الطبيعي تمامًا إذا لم تحصل على كل شيء في المرة الأولى ، ولكن من خلال العمل عليه عدة

14:13.560 --> 14:15.840
مرات ، ستشعر بالتأكيد براحة أكبر.

14:16.260 --> 14:18.960
والآن انتهينا من التدريب.

14:18.960 --> 14:22.770
لذا فقد صنعنا كل الأشياء الأكثر أهمية.

14:22.770 --> 14:28.080
تعلمون ، لقد صنعنا الأدمغة من خلال بناء هياكل الشبكات العصبية مع التلافيف و lshtm

14:28.080 --> 14:30.360
والطبقات المتصلة بالكامل.

14:30.360 --> 14:34.290
نقوم بتدريب هذا العقل عن طريق عمل رمز القطار هذا هنا.

14:34.290 --> 14:37.080
لذلك تم في الأساس قلب الخوارزمية.

14:37.080 --> 14:39.510
لقد صنعت a3c ، تهانينا.

14:39.510 --> 14:43.830
الآن لدينا بعض الأشياء الأخرى التي يجب القيام بها ، ولكن هذا فقط للحصول على الجزء الممتع.

14:43.830 --> 14:52.290
كما تعلم ، نحتاج إلى إجراء هذا الاختبار الذي يفشل فيه الأشخاص ، والذي سيختبر الوكيل ويقدم مقاطع فيديو للذكاء الاصطناعي

14:52.290 --> 14:53.970
أثناء اللعب.

14:53.970 --> 14:55.980
لذلك سيكون هذا ممتعًا جدًا للمشاهدة.

14:56.010 --> 15:02.190
لن نقوم بتشفير جميع أسطر هذا الاختبار في ملف PI لأننا كما قلنا ، قمنا بأهم

15:02.190 --> 15:02.700
شيء.

15:02.700 --> 15:06.870
سأربطها بـ a3c ، لكنني بالطبع سأشرح الكود.

15:06.870 --> 15:11.670
وفي النهاية لدينا ملف da pi الرئيسي الذي سينفذ الكود.

15:11.670 --> 15:15.840
ومن اللحظة التي ننفذ فيها هذا الرمز ، سيتم إنشاء جميع الرموز.

15:15.840 --> 15:21.960
لذلك سيتم تكوين الأدمغة ، وسيحدث التدريب ، وسيقوم الذكاء الاصطناعي بلعب ألعاب جديدة من الاختراقات وسنحصل

15:21.960 --> 15:23.790
على جميع مقاطع الفيديو.

15:23.790 --> 15:26.370
لذلك لا يمكنني الانتظار حتى أشاهدهم في النهاية.

15:26.370 --> 15:29.720
سنرى ما إذا كان الذكاء الاصطناعي ذكيًا بما يكفي لالتقاط الكرات.

15:29.730 --> 15:36.390
سأراك الآن في البرنامج التعليمي التالي لاختبار PI هذا حتى نتمكن من اختبار الذكاء الاصطناعي في بعض الألعاب الجديدة

15:36.390 --> 15:39.000
وحتى ذلك الحين ، استمتع بالذكاء الاصطناعي.