WEBVTT

00:00.910 --> 00:04.540
أهلا ومرحبا بكم من جديد في دورة الذكاء الاصطناعي.

00:04.810 --> 00:12.100
في السابق كان لدينا برنامج تعليمي شاق وطويل عن عمليات اتخاذ قرارات ماركوف ، ونأمل

00:12.130 --> 00:18.950
أن تتماشى جيدًا مع ذلك وآمل أن أتمكن من شرح الأمور بطريقة سهلة وجذابة.

00:18.970 --> 00:22.630
واليوم سنتحدث عن السياسات مقابل الخطط.

00:22.660 --> 00:27.160
سيكون برنامجًا تعليميًا سريعًا وممتعًا لأننا الآن ندخل إلى عالم جديد.

00:27.160 --> 00:33.160
نحن ندخل في عالم البحث العشوائي ، البحث غير الحتمي ، عندما لا يتعلق الأمر فقط بالمرور عبر المتاهة

00:33.160 --> 00:37.630
، ولكن أيضًا في حساب العوامل العشوائية التي قد تصيبك في رأسك عندما تمر

00:37.660 --> 00:41.050
عبر هذه المتاهة وتحتاج إلى كن مستعدا لهم.

00:41.050 --> 00:44.440
هذا هو العالم الذي يعيش فيه وكيلنا.

00:44.440 --> 00:46.750
وهي أكثر إمتاعًا ، لكنها أيضًا أكثر خطورة.

00:46.750 --> 00:47.260
انها أكثر.

00:47.260 --> 00:48.460
إنه أقل قابلية للتنبؤ.

00:48.460 --> 00:50.800
إذن كيف سيتصرف وكيلنا؟

00:50.830 --> 00:51.670
لنلقي نظرة.

00:52.000 --> 00:57.730
هناك إطار عمل ماركوف لعملية اتخاذ القرار ، والذي يعد مرة أخرى معادلة بيلمان المفضلة لدينا.

00:58.090 --> 01:01.960
ومع ذلك ، فإن النسخة الأكثر تقدمًا من معادلة بيلمان التي كنا نعمل معها.

01:01.960 --> 01:04.360
لذا من الآن فصاعدًا ، سنسمي هذه المعادلة التطويرية.

01:04.480 --> 01:07.810
وهنا لدينا الحد الأقصى في جميع الإجراءات.

01:07.810 --> 01:12.790
لذا فإن قيمة الحالة والحالات هي الحد الأقصى عبر جميع الإجراءات التي يمكن أن يؤديها الوكيل

01:12.790 --> 01:13.960
في تلك الحالة.

01:13.960 --> 01:21.160
ويتم أخذ الحد الأقصى من المكافأة التي سيحصل عليها الوكيل من خلال تنفيذ الإجراء أ في الولايات ، بالإضافة

01:21.160 --> 01:25.570
إلى عامل الخصم مضروبًا في القيمة المتوقعة للحالة الجديدة.

01:25.570 --> 01:31.090
سيكون في والقيم المتوقعة مأخوذة هنا لأنها لا تعرف بالضبط الحالة التي ستنتهي

01:31.090 --> 01:31.810
فيها.

01:31.810 --> 01:40.420
هناك بعض التأثيرات العشوائية الموجودة في البيئة والتي قد تغير الحالة وقد لا ينتهي بك الأمر في

01:40.600 --> 01:42.550
الحالة المرغوبة.

01:42.550 --> 01:44.080
قد ينتهي بك الأمر في حالة مختلفة.

01:44.080 --> 01:47.380
ولهذا نأخذ القيمة المتوقعة هنا ، هذا المجموع هنا.

01:47.830 --> 01:53.590
لذلك دعونا نلقي نظرة على هذا كمثالنا أو في مثالنا عن المتاهة.

01:53.590 --> 01:56.650
إذن هذا ما كان لدينا من قبل.

01:56.650 --> 02:01.780
لذلك كنا في السابق نتعامل مع البحث الحتمي ، لذلك عرفنا ذلك.

02:01.780 --> 02:04.750
حسنًا ، إذا كنت هنا ، فأنا بالتأكيد بحاجة للذهاب إلى هنا.

02:04.750 --> 02:06.550
إذا كنت هنا ، فأنا بالتأكيد بحاجة للذهاب إلى هنا.

02:06.550 --> 02:08.120
إذا كنت هنا ، فأنا بالتأكيد بحاجة للذهاب إلى هنا.

02:08.140 --> 02:08.920
إذا كنت هنا ، فأنا هنا.

02:08.920 --> 02:11.230
لذلك كان كل شيء بسيطًا جدًا.

02:11.230 --> 02:14.560
بمجرد الحصول على هذه الخريطة وتذكرها ، أطلقنا عليها اسم خطة.

02:14.560 --> 02:17.350
بمجرد الانتهاء من الخطة ، يكون ما عليك القيام به واضحًا جدًا.

02:17.830 --> 02:18.930
هناك أخطاء.

02:18.940 --> 02:20.380
هذه هي الخطة ذات الأسهم.

02:20.380 --> 02:23.140
ومن هنا كان الأمر واضحًا جدًا حيث يوجد هذا.

02:23.140 --> 02:24.700
هذه هي المسارات التي قد يسلكها الوكيل.

02:24.700 --> 02:27.850
أينما تبدأ على هذا الخط الأزرق ، فهذه هي بالضبط الطريقة التي ستسلكها.

02:28.510 --> 02:31.060
ومع ذلك ، الآن ليس لدينا خطة بعد الآن.

02:31.060 --> 02:36.490
لا يمكننا الحصول على خطة لأنه ، كما تعلمون ، كل ما نخطط له قد لا يحدث.

02:36.490 --> 02:37.600
إنه ليس تحت سيطرتنا.

02:37.600 --> 02:40.840
الخطة هي عندما تعرف بالضبط ما عليك القيام به بعد ذلك.

02:40.840 --> 02:41.710
أنت تعرف الخطوات.

02:41.710 --> 02:46.300
إذن لديك نقطة بداية ، ولديك هدف ، وأنت تعرف كل خطوة حتى تتمكن من التخطيط

02:46.300 --> 02:46.990
لها.

02:46.990 --> 02:48.850
أنت مثل ، سأفعل هذا ، سأفعل هذا ، سأفعل هذا.

02:49.000 --> 02:50.350
مثل حياتك ، مثل خطة.

02:50.350 --> 02:54.790
لكن في نفس الوقت ، هناك الكثير من العشوائية التي تحدث.

02:54.790 --> 03:00.010
لا يمكنك الحصول على خطة لأنك ماذا لو وصلت إلى هنا ثم نقرت على اليمين وأخذت في الواقع إلى

03:00.010 --> 03:00.490
أسفل؟

03:00.490 --> 03:01.990
لذلك هذا ليس جزءًا من خطتك.

03:02.050 --> 03:03.880
لهذا السبب لم يعد يطلق عليها الخطة بعد الآن.

03:03.880 --> 03:08.440
وهنا سنحسب القيم أو سنلقي نظرة على القيم

03:08.440 --> 03:11.800
المحسوبة لنفس المشكلة.

03:11.800 --> 03:18.220
لكن استنادًا إلى الأساس ، نظرًا لوجود هذه العشوائية في الداخل ، فهذه هي القيم الجديدة.

03:18.610 --> 03:21.040
فلماذا تختلف هذه القيم؟

03:21.040 --> 03:22.810
لذلك دعونا نقارنه بما كان لدينا من قبل.

03:22.810 --> 03:24.220
هذا ما كان لدينا من قبل.

03:24.550 --> 03:25.600
هذه هي القيم الجديدة.

03:25.600 --> 03:33.850
مرة أخرى ، كان لدينا سابقًا يمكنك رؤية 10. 9 ، 0. 81 ، 73 ، 66 وهذا ما لدينا الآن ، 86.

03:33.850 --> 03:36.650
الدرس الأول ، 74 ، 71 ، 63 وهكذا.

03:36.670 --> 03:43.540
وبالمناسبة ، هذه ليست بالضبط القيم الصحيحة من أعلى رأسي ، ولكن إذا أردنا تشغيل وكيل ، فستكون

03:43.540 --> 03:46.300
القيم شيئًا مشابهًا لهذا.

03:46.810 --> 03:51.850
ويمكن أن تتغير القيم لأننا نختار 0 اعتمادًا على جاما. 9 أو قيمة أخرى.

03:51.850 --> 03:56.230
لكن مع ذلك ، من أجل الجدل ، هذه هي القيم التي نتعامل معها الآن.

03:56.350 --> 03:57.730
وهي تقريبية.

03:57.730 --> 04:00.970
ينقلون الفكرة بأكملها بالطريقة الصحيحة.

04:00.970 --> 04:02.200
لذلك دعونا نلقي نظرة عليهم.

04:02.200 --> 04:03.160
لماذا تغيروا؟

04:03.160 --> 04:05.620
حسنًا ، لماذا هنا لنبدأ بهذا.

04:05.620 --> 04:07.210
هنا القيمة واحدة.

04:07.210 --> 04:09.400
لماذا هو فجأة 0. 86؟

04:09.400 --> 04:10.240
لماذا هو أقل من واحد؟

04:10.240 --> 04:11.140
هل يمكننا الذهاب من هنا؟

04:11.140 --> 04:11.650
هنا؟

04:11.650 --> 04:18.280
حسنًا ، نحن في الواقع نسميها لأنه من هنا ، إذا ذهبنا إلى اليمين ، وهي نيتنا ، وإذا كنا على حق ، فيمكننا

04:18.280 --> 04:22.270
في الواقع مع فرصة 10٪ أن ينتهي بنا المطاف هنا.

04:22.270 --> 04:27.190
لذلك كنا قد اصطدمنا بالجدار وسنعود إلى هذه الحالة ونتذكر ، لدينا جاما لذا سيتم

04:27.190 --> 04:32.080
خصم القيمة أو مع أو مع أو مع أو مع احتمال 10٪ سينتهي الأمر هنا في هذه الحالة.

04:32.080 --> 04:34.870
لذلك ليس احتمال الوصول إلى هنا بنسبة 100٪.

04:34.870 --> 04:37.360
لذلك لم يعد من الممكن أن تكون هذه القيمة واحدة.

04:37.360 --> 04:41.290
إنه شيء أقل وهو ، دعنا نقول 0. 86.

04:41.290 --> 04:43.720
إذن هذا مثال على سبب ذلك.

04:43.720 --> 04:48.940
ويمكنك الحصول على القيمة الدقيقة إذا قمت بحساب معادلة بلمونت ، معادلة بلمونت الكاملة التي

04:48.940 --> 04:49.660
لدينا الآن.

04:49.690 --> 04:54.160
المشكلة الوحيدة هي أنه سيكون هناك بعض العودية لأنك ستحتاج إلى معرفة قيمة هذا ومن

04:54.160 --> 04:55.780
ثم تحتاج إلى معرفة قيمة ذلك.

04:55.810 --> 04:59.050
إنه معقد للغاية ، ولهذا السبب لا نقوم بالحسابات يدويًا هنا.

04:59.050 --> 05:00.160
هذا هو السبب في أن ملف.

05:00.420 --> 05:03.000
يمكنني القيام بها أثناء مرورها بكل هذا.

05:03.050 --> 05:07.650
يبدو الأمر كما لو أنه لا يوجد شيء معقد للغاية بالنسبة للذكاء الاصطناعي لحساب هذه الأشياء.

05:08.400 --> 05:09.990
إذن هذه هي قيمتنا هنا.

05:09.990 --> 05:11.460
ولكن دعونا نلقي نظرة على مختلف منها.

05:11.460 --> 05:14.520
لذلك اعتادت أن تكون هنا 0. 9 فقط بسبب عامل الخصم.

05:14.520 --> 05:19.770
تذكر ، من هنا إلى هنا مرة أخرى ، الآن من هنا ، لا يمكننا القفز من هنا إلى هنا لمجرد أنه حتى لو

05:19.770 --> 05:23.720
قفزنا إذا ذهبنا بهذه الطريقة ، فقد ينتهي بنا الأمر هنا مرة أخرى.

05:23.730 --> 05:24.870
مرة أخرى هنا ، صحيح.

05:24.870 --> 05:29.640
هناك احتمال بنسبة 20٪ بأننا سنبقى في الميدان لأننا سنصطدم بجدار ومرة أخرى وهكذا.

05:29.670 --> 05:32.640
إذن قيمة الوجود هنا هي 0. 71.

05:32.640 --> 05:38.580
مرة أخرى ، هذا هو عامل الخصم ، قد يبدو هذا غريبًا بالنسبة لك حتى مع عامل الخصم ، هذا

05:38.580 --> 05:39.780
مرتفع جدًا.

05:39.810 --> 05:44.550
ربما لا يكون عامل الخصم في هذا المثال صفرًا. 9 ، ربما يكون 0. 99 أو شيء من هذا القبيل.

05:44.550 --> 05:46.230
لذلك لا تقلق بشأن ذلك.

05:46.230 --> 05:48.420
مجرد نوع من التركيز على ذلك.

05:48.420 --> 05:56.850
لقد تغيرت القيم بالفعل لأن القيم الآن أقل ، غالبًا لأنه ليس احتمالًا بنسبة 100٪ للوصول إلى الحالة التي

05:56.850 --> 05:58.860
تريد الحصول عليها.

05:58.980 --> 06:05.220
وما ستجده مثيرًا للاهتمام هنا أنه اعتاد أن يكون 0. 9 وقد انخفض كثيرًا في الواقع.

06:05.230 --> 06:06.420
لقد تم إسقاطه بشكل كبير.

06:06.420 --> 06:07.020
لماذا هذا؟

06:07.020 --> 06:12.090
حسنًا ، لأنك إذا انتقلت من هنا إلى أعلى ، وهي نيتنا ، فهناك فرصة بنسبة 10٪ للاصطدام

06:12.090 --> 06:18.600
بالحائط ، ولكن هناك احتمال بنسبة 10٪ أن ينتهي بك المطاف في حفرة النار وخسارة ناقص واحد للمكافأة.

06:18.600 --> 06:22.620
وهذا يعني بشكل أساسي بالنسبة للوكيل أن هذه هي نهاية اللعبة.

06:22.980 --> 06:25.530
ولذا فهذه حالة سيئة للغاية.

06:25.530 --> 06:28.670
لذلك فجأة ، تذكر ، كان لدينا 0. 9 هنا نقطة.

06:28.680 --> 06:29.810
لذلك كانوا متكافئين.

06:29.830 --> 06:34.710
لا يهمك هنا أو هنا ، فهما متساويان إلى حد كبير من حيث قيمة الوجود في كل من هذه الحالات.

06:34.710 --> 06:41.340
ولكن الآن فجأة ، بام ، هذه الحالة هي ضعف جودة هذه الحالة تقريبًا.

06:41.340 --> 06:46.800
ببساطة لأنه هنا ، إذا ذهبت مباشرة إليك ، فانتقل إلى المكان الذي تريد الذهاب إليه.

06:46.800 --> 06:51.180
عواقب حدوث العشوائية هي أنك ستبقى هنا.

06:51.180 --> 06:51.510
هنا.

06:51.750 --> 06:54.600
إحدى العواقب ، فرصة 10٪ هي أن ينتهي بك الأمر في الحفرة.

06:54.810 --> 07:02.100
لذا كما ترون ، لم تعد هذه الحالة جيدة بعد الآن ، ببساطة بسبب شيء يمكن أن يحدث

07:02.100 --> 07:03.180
تقلبات.

07:03.270 --> 07:09.090
كما ترون ، هذا أيضًا سيء جدًا لأنه سيء مثل هذا من حيث احتمال 10٪ فقط أن ينتهي به الأمر في

07:09.090 --> 07:12.390
النهاية ، و 10٪ فرصة أن ينتهي به الأمر في الحائط.

07:12.390 --> 07:14.940
لكن في نفس الوقت ، هناك عامل خصم.

07:14.940 --> 07:20.220
لذا أولاً وقبل كل شيء ، عامل الخصم وأيضًا بعد هذا ، عليك الانتقال إلى هنا.

07:20.400 --> 07:23.820
وحتى إذا ذهبت إلى هنا افتراضيًا ، فقد ينتهي بك الأمر في الحفرة مرة أخرى.

07:23.820 --> 07:28.620
لذلك ستؤخذ هذه الفرصة أيضًا في الاعتبار لأن تذكر أن هذه القيمة مشتقة من هذه

07:28.620 --> 07:32.190
القيمة وهذه القيمة مشتقة من هذه القيمة ، أليس كذلك؟

07:32.190 --> 07:34.020
وبالتالي فهي صغيرة.

07:34.020 --> 07:37.290
لكن في الواقع ، ما قلته كان خطأ.

07:37.290 --> 07:39.540
هذه القيمة ليست مشتقة من هذه القيمة.

07:39.540 --> 07:47.190
لذا إذا ألقيت نظرة الآن ، ستلاحظ أن هذه القيمة V0 هنا في الواقع أكبر من هذه.

07:47.340 --> 07:53.670
ستلاحظ أنه من الأفضل للوكيل أن يتجول بهذه الطريقة بدلاً من ذلك.

07:53.670 --> 07:54.690
وهذا منطقي ، أليس كذلك؟

07:54.690 --> 07:56.970
لأن هذه الطريقة لا تخسر.

07:57.150 --> 07:58.530
ليس هناك فرصة للحصول على الحفرة.

07:58.530 --> 07:59.700
نعم ، إنها أطول قليلاً.

07:59.700 --> 08:03.300
وبالتالي ، فإن عامل الخصم له تأثير أكبر.

08:03.300 --> 08:07.410
لكن في نفس الوقت ، ببساطة لأن هناك فرصة للدخول إلى الحفرة هنا ، إذا سارت الأمور بشكل مستقيم ، فستكون

08:07.410 --> 08:09.000
هناك فرصة للتغلب على القفز.

08:09.180 --> 08:14.790
لذلك سيستغرق الأمر وقته وسيستمر لأنه بهذه الطريقة تكون فرصة الحصول عليه أقل

08:14.790 --> 08:15.480
بكثير.

08:15.630 --> 08:16.350
لا يزال هناك.

08:16.350 --> 08:18.090
لذا من هنا يذهب هناك.

08:18.570 --> 08:19.530
من هنا يذهب هناك.

08:19.530 --> 08:23.340
من المحتمل أن يدخل إلى الحفرة لأنه قد ينتهي به الأمر هناك ثم ينتهي به المطاف

08:23.460 --> 08:25.590
في الحفرة ، لكن مع ذلك ، إنها فرصة أقل.

08:25.590 --> 08:27.270
لذلك سوف تدور هكذا.

08:27.270 --> 08:30.150
لذا من المثير للاهتمام أن نرى كيف يتغير كل منهم.

08:30.150 --> 08:32.370
تذكر سابقًا من هنا كنت ستذهب هكذا.

08:32.370 --> 08:34.710
من هنا تذهب هكذا ، ومن هنا تذهب هكذا.

08:34.710 --> 08:36.750
والآن فجأة يمكنك أن ترى أنه يتغير.

08:36.750 --> 08:38.580
لذلك دعونا نرسم الأسهم ونرى كيف تبدو الآن.

08:39.300 --> 08:43.680
وفويلا ، ترى شيئًا أكثر عشوائية ، أليس كذلك؟

08:43.680 --> 08:45.180
لذا نعم ، هذا صحيح.

08:45.180 --> 08:46.440
لكن انظر إلى ما حدث هنا.

08:46.440 --> 08:47.520
انظر الى هذا.

08:47.550 --> 08:48.600
انظر الى هذا.

08:48.810 --> 08:50.400
هل تتوقع ذلك؟

08:50.400 --> 08:54.480
هذا شيء يشبه بالتأكيد عندما رأيت هذا لأول مرة ، لقد تأثرت كثيرًا.

08:54.480 --> 08:55.320
لم أتفاجأ.

08:55.320 --> 08:57.120
لم أكن متفاجئة.

08:57.120 --> 08:59.430
ولم أكن أتوقع هذا على الإطلاق.

08:59.700 --> 09:04.620
وهذا مثال على متى يمكنني التفوق على الإنسان.

09:05.070 --> 09:08.250
إنه ليس شيئًا لا يمكنك حتى التنبؤ به.

09:08.250 --> 09:12.210
لكن A. أنا. ، من خلال التعلم المعزز ، تذكر

09:12.210 --> 09:18.660
هذا المثال من الكلاب التي يمكن أن تعمل في بعض الأحيان بشكل أفضل من الكلاب الواقعية العادية أو الكلاب الآلية المبرمجة مسبقًا ، أو يمكنها

09:18.660 --> 09:22.200
لعب كرة القدم لمجرد أنها توصلت إلى هذه الأفكار التي لا يمكننا رؤيتها.

09:22.200 --> 09:23.580
وهذا مثال رائع.

09:23.580 --> 09:23.730
الصحيح.

09:23.730 --> 09:28.800
لذلك ربما لم تكن تتوقع ذلك أيضًا ، أن الوكيل ، بدلاً من الصعود ، يبدو الأمر كذلك ، لماذا

09:28.800 --> 09:33.060
سأحب إذا صعدت ، فهناك فرصة بنسبة 10٪ لأنني سأقفز إلى الحفرة.

09:33.060 --> 09:35.040
لكن ما الذي يتم تحقيقه بالذهاب إلى الجدار؟

09:35.040 --> 09:40.350
حسنًا ، 80٪ من الوقت سيتراجع ويبقى في هذه الحالة ، لكن 10٪ من الوقت سيذهب هنا و 10٪

09:40.350 --> 09:41.910
من الوقت سيذهب هنا.

09:42.090 --> 09:48.930
لذلك فجأة يمكنك أن ترى أنه الآن في الواقع في هذا النهج الجديد للقفز في الحائط.

09:48.930 --> 09:52.980
هناك احتمال بنسبة 0٪ أن يدخل في حفرة النار من هذه البقعة.

09:52.980 --> 09:55.500
لذا يبدو الأمر كما لو أنه لا يريد حقًا الدخول في حفرة النار.

09:55.500 --> 09:59.610
لذلك فإنه يرسم السندات وترتد إلى الحائط عدة مرات وبعد ذلك سوف تفعل.

09:59.880 --> 10:03.000
اذهب يمينًا أو يسارًا في مرحلة ما لأن هذه العشوائية ستحدث.

10:03.000 --> 10:05.640
وهكذا تعلمت ذلك من خلال التجريب.

10:05.640 --> 10:11.310
لقد تعلمت أنه عندما أمضي قدمًا ، فإن النتائج ليست جيدة كما لو كنت أذهب إلى الحائط.

10:11.310 --> 10:15.770
وإذا فكرت في الأمر ، إنه مثل هذا الروبوت ، إذا فكرت في الأمر كما لو كان حفرة

10:15.780 --> 10:19.470
نار ، فهو بحد ذاته مثل هذا المربع يشبه الحافة الصغيرة جدًا.

10:19.590 --> 10:21.510
ثم هذا مثل الجبل ، مثل الجرف.

10:21.510 --> 10:27.330
وهذا الروبوت يعانق الجرف تمامًا مثل محاولة الانتظار حتى يدفعه يمينًا أو

10:27.330 --> 10:31.080
يسارًا لأنه ، كإنسان ، ربما تفعل الشيء نفسه.

10:31.080 --> 10:32.400
لن تقف في مواجهة هذه الطريقة.

10:32.400 --> 10:34.890
بهذه الطريقة ستحتضن الجرف ، صحيح.

10:34.890 --> 10:35.760
أو شيء من هذا القبيل.

10:35.760 --> 10:39.510
ونأمل ألا ينتهي بك الأمر أبدًا إلى أن ينتهي بك الأمر في مثل هذا الموقف.

10:39.510 --> 10:43.500
ولكن مثل بصريًا ، فقط إذا فكرت في الأمر ، نفس الشيء هنا.

10:43.500 --> 10:46.380
وهذا مكثف جدًا ، أليس كذلك؟

10:46.380 --> 10:51.630
حتى أتت بهذه الفكرة ونفسها هنا بدلاً من الذهاب إلى اليسار والمخاطرة بالخوض في قتال ، لكنني

10:51.630 --> 10:56.040
سأحاول القفز من الحائط ، مثل احتضان الحائط ، حاول القفز إلى الحائط في مرحلة

10:56.120 --> 10:56.850
ما .

10:56.850 --> 11:00.840
أعلم أن هناك احتمال وجود فرصة بنسبة 10٪.

11:00.840 --> 11:04.350
في كل مرة أفعل ذلك ، سأذهب إلى هنا وأحيانًا سيحدث هذا وسأكون هنا وسأكون آمنًا وبعد

11:04.350 --> 11:05.700
ذلك سأستمر على هذا المنوال.

11:06.570 --> 11:13.020
لذا ، فإن النهج المثير للاهتمام للغاية الذي اتبعته هنا وكما ترون ، فإن الجذور هي على هذا النحو.

11:13.020 --> 11:17.370
إذن من هنا قد يتجه يمينًا ثم يتجه يمينًا إلى المخرج أو هنا يسارًا

11:17.370 --> 11:22.140
هكذا ، وهنا في مرحلة ما سيتجه يسارًا وسيتجه إلى هذا النحو مرة أخرى.

11:22.140 --> 11:23.340
هذا أمر مهم لتفهمه.

11:23.340 --> 11:24.030
إنها ليست سياسة.

11:24.030 --> 11:28.110
لذا حتى عندما يقفز من هنا ، ربما يذهب هنا.

11:28.110 --> 11:31.770
وبعد ذلك من هنا قد يكون في الواقع ، بدلاً من الذهاب مباشرة ، قد يعود في الواقع

11:31.770 --> 11:33.930
إلى اليمين ثم من هنا قد يذهب إلى اليسار.

11:33.930 --> 11:34.290
حسنا.

11:34.290 --> 11:36.390
لذلك هناك الكثير من الخيارات المختلفة للذهاب.

11:36.390 --> 11:37.710
لذلك قد لا يتبع هذا بالضبط.

11:37.710 --> 11:38.640
قد أذهب في الاتجاه الآخر.

11:38.670 --> 11:42.360
هذا هو مجرد المسار المطلوب الذي تم تصميمه لنفسه.

11:42.360 --> 11:44.610
لكن الطريقة التي ستعمل بها قد تكون مختلفة في الواقع.

11:44.610 --> 11:46.050
هذا يعتمد على العالم الحقيقي.

11:46.050 --> 11:46.860
لذا ها نحن ذا.

11:46.860 --> 11:50.010
هذا هو عالم الذكاء الاصطناعي.

11:50.010 --> 11:52.350
هذا ما هي السياسة مقابل الخطة.

11:52.470 --> 12:00.000
ونأمل أن تكون متحمسًا ببطء لما يمكن أن يفعله الذكاء الاصطناعي ، خاصة بالنظر إلى ما

12:00.000 --> 12:01.170
رأيناه هنا.

12:01.170 --> 12:07.410
هذه بعض أنواع القرارات المبتكرة للغاية التي يتوصل إليها الذكاء الاصطناعي.

12:07.410 --> 12:12.720
وكما ترى ، عند تطبيق الذكاء الاصطناعي ، حتى من هذا المثال الصغير ، يمكنك أن ترى أنه عندما تلعب

12:12.720 --> 12:19.170
الذكاء الاصطناعي في العالم الحقيقي ، ربما ستأتي بأفكار وقرارات لا يستطيع البشر أحيانًا التوصل إليها.

12:19.170 --> 12:25.890
وهذا بالضبط يشبه ما حدث في تلك الألعاب حيث كان Google AlphaGo يلعب

12:25.890 --> 12:32.250
ضد Lee Sedol ، بطل Go في كوريا ، مرة أخرى في بطل العالم Go.

12:32.250 --> 12:36.870
وكانوا يلعبون في كوريا مرة أخرى ، في عام 2016 ، أعتقد أنه كان في مارس 2016.

12:36.870 --> 12:42.300
تمخضت عن بعض الحركات التي لم يلعبها البشر منذ 3000 عام أو لم يعتاد البشر على اللعب.

12:42.300 --> 12:45.450
وهذا بالضبط مثال على ذلك.

12:45.450 --> 12:49.620
لذا ، مرة أخرى ، أتمنى أن تكون متحمسًا ومندفعًا بشأن هذه الدورة التدريبية وحول ما

12:49.620 --> 12:50.160
سننشئه.

12:50.160 --> 12:52.590
وأنا أتطلع إلى رؤيتك في المرة القادمة.

12:52.590 --> 12:54.150
حتى ذلك الحين ، استمتع.

12:54.180 --> 12:54.720
أنا.
