WEBVTT

00:00.980 --> 00:04.520
أهلا ومرحبا بكم مرة أخرى في دورة الذكاء الاصطناعي.

00:04.520 --> 00:07.490
سنناقش اليوم خطة الهجوم لهذا القسم.

00:07.490 --> 00:11.120
نحن نتحدث عن التعلم الأساسي ولدينا عدد غير قليل من البرامج التعليمية.

00:11.120 --> 00:20.180
لذلك أعتقد أنها فكرة جيدة أن نراجعها بسرعة لفهم ما يمكن توقعه في مقاطع الفيديو القادمة.

00:20.300 --> 00:21.260
حسنا هيا بنا.

00:22.010 --> 00:22.490
حسنا.

00:22.490 --> 00:24.770
ماذا سنتعلم في هذا القسم.

00:25.040 --> 00:31.610
أول الأشياء أولاً ، سنتحدث عن ماهية التعلم المعزز في الواقع وما هي الفلسفة الكامنة وراء التعلم

00:31.610 --> 00:37.850
المعزز وكيف يمكن رؤية التعلم المعزز في الواقع في الحياة الواقعية وكيف يرتبط بالأشياء

00:37.850 --> 00:43.910
التي نلاحظها في الحياة الواقعية كانت في الواقع أشياء نقوم بها أنفسنا.

00:44.540 --> 00:51.320
سنتحدث عن معادلة بلمونت ، وهو مفهوم أساسي للغاية يقوم عليه كل شيء أو الكثير من الأشياء

00:51.320 --> 00:56.720
التي تحدث في التعلم المعزز ، خاصة في هذا الفضاء من التعلم.

00:56.720 --> 01:01.610
وما سنناقشه في هذا القسم من الدورة وفي الأقسام

01:01.610 --> 01:10.100
التالية ، سنتحدث بعد ذلك عن الخطة والخطة التي يأتي بها الذكاء الاصطناعي للتنقل داخل

01:10.100 --> 01:11.540
بيئتنا.

01:11.540 --> 01:14.530
وسنرى كيف يتم ذلك معًا.

01:14.540 --> 01:17.220
برنامج تعليمي سريع جدًا ، ولكنه ممتع جدًا.

01:17.480 --> 01:21.080
ثم سنتحدث عن عمليات اتخاذ القرار في السوق والمفهوم الجديد.

01:21.080 --> 01:29.030
سنقدم مفهومًا جديدًا للغاية سيضيف ببطء طبقة إضافية من التطور إلى معادلة بلمونت ، إلى

01:29.030 --> 01:34.850
التعلم المعزز بالكامل ، إلى مفاهيم التعلم الأساسية لدينا.

01:34.850 --> 01:40.070
وهذه هي الطريقة التي يتم بها تنظيم هذا القسم ، حيث نقدم معادلة بلمونت بشكل مبسط للغاية.

01:40.070 --> 01:47.060
وبعد ذلك ببطء خلال الدروس ، نضيف إليها طبقات من التطور للوصول إلى الإصدار

01:47.060 --> 01:48.470
النهائي.

01:48.470 --> 01:55.010
هذه هي وجهتنا المحددة من حيث التلوين ، لكننا سنصل إلى هناك ببطء حتى نحصل على الوقت الكافي لمعالجة

01:55.010 --> 01:58.760
كل تلك المعلومات والسماح لها بالاستقرار.

01:58.760 --> 02:04.790
وعمليات اتخاذ القرار ماركوف هي طبقة إضافية من التعقيد بالإضافة إلى ما ناقشناه بالفعل أو

02:04.790 --> 02:07.400
ما سنناقشه بالفعل بحلول ذلك الوقت.

02:08.240 --> 02:10.700
ثم سنتحدث عن السياسات مقابل الخطط.

02:11.090 --> 02:13.760
برنامج تعليمي آخر مثير للاهتمام ، كلها مثيرة للاهتمام.

02:13.760 --> 02:19.520
مجرد برنامج تعليمي سريع آخر حول كيفية اختلاف السياسة عن الخطط وما هي الاختلافات الموجودة.

02:19.520 --> 02:24.470
وهذه مصطلحات ربما تسمعها أو تقرأها في الأدبيات الأخرى.

02:24.470 --> 02:30.020
إذا كنت تنوي الخوض في الأمر للحصول على معلومات إضافية حول التعلم

02:30.020 --> 02:34.490
المعزز ، فسنتحدث عن إضافة عقوبة حية إلى بيئاتنا.

02:34.490 --> 02:42.950
وهذه طريقة أخرى لإضافة التعقيد إلى البيئة التي سيعمل فيها وكلاؤنا.

02:43.040 --> 02:46.160
ثم سنتحدث عن الحدس وراء التعلم الأساسي.

02:46.160 --> 02:51.530
حتى هذا البرنامج التعليمي ، سنتحدث عن قيم الحالات ، ثم

02:51.530 --> 02:59.690
أخيرًا سننتقل إلى الحديث عن قيم الأفعال أو قيم Q ، ثم سنقدم الاختلاف الزمني.

02:59.690 --> 03:05.810
إذن هذا هو البرنامج التعليمي حيث كل ما تعلمناه سوف يجتمع معًا لشرح كيف

03:05.810 --> 03:11.090
يتعامل الوكلاء بالضبط أو كيف يتعلم الذكاء الاصطناعي؟

03:11.090 --> 03:16.160
كيف تُحدِّث قيمها خلال العملية التكرارية التي تمر بها؟

03:16.610 --> 03:21.470
ثم أخيرًا ، سنلقي نظرة على تصور التعلم الأساسي.

03:21.470 --> 03:26.960
لذلك سنأخذ كل شيء تعلمناه وسننظر إليه وهو يحدث أمام أعيننا ونشاهد

03:26.960 --> 03:34.070
الذكاء الاصطناعي في الواقع يؤدي التعلم الأساسي ويفعل كل الأشياء التي سنناقشها بطريقة

03:34.070 --> 03:37.880
بديهية المستوى في الواقع العملي.

03:37.880 --> 03:44.240
وسيساعدنا ذلك على فهم هذه المعرفة التي سنغطيها في هذا القسم بشكل أكبر.

03:44.240 --> 03:47.360
لذلك نأمل أن تكون متحمسًا جدًا لهذه البرامج التعليمية القادمة.

03:47.360 --> 03:48.740
أنا بالتأكيد.

03:48.740 --> 03:51.800
وهناك بعض الشرائح المثيرة للاهتمام قادمة.

03:51.800 --> 03:56.990
والأهم من ذلك ، المفاهيم نفسها مثيرة جدًا للاهتمام وأنا متأكد من أنك

03:56.990 --> 04:01.280
ستستمتع بها كثيرًا وأتطلع إلى رؤيتك في المرة القادمة.

04:01.280 --> 04:02.570
حتى ذلك الحين ، استمتع.

04:02.570 --> 04:03.170
أنا.
