WEBVTT

00:00.210 --> 00:02.070
أهلا ومرحبا بكم في هذا البرنامج التعليمي.

00:02.070 --> 00:05.910
في البرنامج التعليمي اليوم ، سنقوم بالمزامنة مع النموذج المشترك.

00:05.910 --> 00:13.950
إذن ما سنفعله هو نفس الوظيفة بالطبع ، ثم نبدأ طول الحلقة الواحدة.

00:13.950 --> 00:19.740
لذلك سنطلق على طول الحلقة ، طول الشرطة السفلية.

00:20.040 --> 00:20.910
هناك نذهب.

00:20.910 --> 00:23.700
وسنقوم بتهيئته إلى الصفر.

00:23.700 --> 00:27.150
ولكن بعد ذلك سيتم زيادة طول هذه الحلقة.

00:27.300 --> 00:30.360
وبالحديث عن زيادتها ، هذا بالضبط ما سنفعله.

00:30.390 --> 00:37.560
لذلك سنستخدم حلقة while loop ونستخدم هذه الحيلة لنقول إنها صحيحة.

00:38.430 --> 00:43.680
كولين لتكرار ما سيحدث الآن ، ما الذي سيحدث داخل هذه الحلقة.

00:43.980 --> 00:49.950
ولذا فإن أول شيء سيحدث في حلقة البئر هذه هو تنفيذ طول الحلقة.

00:49.980 --> 00:53.640
لذا فإن أول شيء سنفعله هو زيادة العدد بمقدار واحد.

00:53.640 --> 00:58.860
وللقيام بذلك ، يمكننا ببساطة أخذ طول الحلقة و.

00:59.720 --> 01:02.480
أضف هنا زائد يساوي واحدًا.

01:02.990 --> 01:06.330
والآن سنقوم بالمزامنة مع النموذج المشترك.

01:06.350 --> 01:13.520
هذا يعني أنه الآن سيستخدم الوكيل النموذج المشترك للقيام باستكشافه الصغير على عدد

01:13.520 --> 01:15.280
معين من الخطوات.

01:15.290 --> 01:18.620
وكيف سيحصل النموذج على هذا النموذج المشترك؟

01:18.650 --> 01:27.650
حسنًا ، نحتاج إلى أخذ نموذجنا ثم وضع نقطة ثم استخدام طريقة تحميل حالة الدكت لأننا

01:27.650 --> 01:34.140
سنستخدمها للحصول على قاموس الحالة لنموذجنا المشترك.

01:34.160 --> 01:41.780
لذلك علينا أن نضع النموذج المشترك أولاً ثم نطبق الطريقة الثابتة للحصول على معلمات هذا النموذج المشترك.

01:41.780 --> 01:46.970
وهذه هي الطريقة التي سيحول بها نموذجنا هنا النموذج المشترك إلى استكشافه الصغير.

01:48.430 --> 01:53.560
وبمجرد أن يحصل النموذج على هذا النموذج المشترك ، علينا الآن التمييز بين حالتين.

01:53.590 --> 01:59.940
الأول هو إذا تم القيام به ، أي ما إذا كانت اللعبة قد انتهت.

01:59.950 --> 02:03.240
إذن ، إذا انتهت اللعبة ، فماذا يحدث في هذه الحالة؟

02:03.280 --> 02:09.660
حسنًا ، علينا إعادة تهيئة الحالات المخفية وحالات الخلية الخاصة بـ lshtm والنموذج.

02:09.670 --> 02:17.440
ولهذا السبب الآن سأأخذ C X حالات الخلية وأيضًا h x الحالة المخفية وسأقوم بإعادة تهيئتهما

02:17.440 --> 02:18.960
معًا.

02:18.970 --> 02:22.900
وكيف سنقوم بإعادة تهيئتها جيدًا باستخدام الأصفار فقط.

02:22.930 --> 02:30.370
سيكون هناك متجه من 256 صفراً لأنك تذكر أن مخرجات lshtm لها أبعاد واحد

02:30.370 --> 02:31.600
و 256.

02:31.600 --> 02:32.260
لذا ها نحن ذا.

02:32.260 --> 02:36.070
سنقوم بتهيئتهم باستخدام مكتبة الشعلة.

02:36.070 --> 02:38.890
ثم وظيفة الأصفار.

02:38.890 --> 02:46.270
ونظرًا لأننا نريد متجهًا يبلغ 256 صفرًا ، فسنقوم هنا بإدخال بعدين ، أحدهما للمتجه

02:46.270 --> 02:50.500
و 256 لعدد العناصر التي ستكون أصفارًا.

02:50.500 --> 02:51.520
وها نحن ذا.

02:51.520 --> 02:58.450
ولكن بعد ذلك سنحول ذلك إلى متغير شعلة لأنه سيتم بعد ذلك حساب بعض التدرجات.

02:58.450 --> 03:01.390
لذا علينا دمج هذا مع التدرج اللوني.

03:01.870 --> 03:02.380
حسنا.

03:02.380 --> 03:09.460
وسنفعل الشيء نفسه بالنسبة للحالات المخفية أدناه ، ونقوم بتهيئتها بنفس الطريقة.

03:09.730 --> 03:10.570
هناك نذهب.

03:10.570 --> 03:13.060
هذا إذا انتهت اللعبة.

03:13.060 --> 03:20.740
والآن الحالة الأخرى التي يمكننا الوصول إليها باستخدام ls ls ثم ما يحدث في هذه الحالة.

03:20.740 --> 03:27.010
حسنًا ، سنحتفظ بحالات الخلية القديمة والحالات المخفية ، وبكل سهولة يمكننا الاحتفاظ بالحالات القديمة بهذه

03:27.010 --> 03:28.810
الطريقة عن طريق الكتابة.

03:28.840 --> 03:36.610
نرى أن x يساوي بيانات المتغير c x ونفس الشيء بالنسبة للحالات المخفية.

03:36.610 --> 03:44.470
يمكننا ببساطة أن نضيف هنا h x يساوي المتغير h x إلى البيانات.

03:44.890 --> 03:45.490
حسنا.

03:45.490 --> 03:46.000
شيء جيد.

03:46.000 --> 03:46.420
فعله.

03:46.420 --> 03:53.230
الآن يمكننا الخروج من LS لأننا انتهينا أساسًا من هاتين الحالتين سواء انتهت اللعبة

03:53.230 --> 03:53.890
أم لا.

03:53.890 --> 03:59.080
لكننا نبقى في الحلقة البرية لأننا الآن سنفعل بعض الأشياء الأخرى التي هي أساسًا كل

03:59.080 --> 04:00.250
عملية التدريب.

04:00.250 --> 04:05.890
ولذا ما سنفعله الآن هو تهيئة العديد من المتغيرات التي ستكون في قلب العمليات

04:05.890 --> 04:07.930
الحسابية في التدريب.

04:07.930 --> 04:08.830
لذلك دعونا نفعل هذا.

04:08.830 --> 04:13.600
سنحتاج إلى القيم التي نتذكرها هي نتاج الناقد.

04:13.600 --> 04:18.610
إذن هذه هي الدالة V وسنقوم بتهيئتها كقائمة فارغة بهذه الطريقة.

04:18.940 --> 04:22.450
ثم سنحتاج إلى احتمالات اللوغاريتمات.

04:22.720 --> 04:27.040
لذا قم بتسجيل الاستجوابات وسنقوم أيضًا بتهيئتها كقائمة فارغة.

04:27.340 --> 04:33.160
ثم بالطبع سنحتاج إلى مكافآتنا التي سنبدأها أيضًا كقائمة فارغة.

04:33.370 --> 04:41.860
وأخيرًا سنحتاج إلى أن يكون الانتروبيا شيئًا جديدًا ، لكن هذا في الواقع يقع في قلب حسابات

04:41.860 --> 04:43.060
التدريب.

04:43.060 --> 04:44.800
قائمة فارغة كذلك.

04:44.890 --> 04:49.240
والآن بعد أن بدأنا هذه المتغيرات الأربعة ، يمكننا بدء حلقة for جديدة.

04:49.240 --> 04:53.110
وفي حلقة for الجديدة هذه ، سنحدِّث قيم هذه المتغيرات الأربعة.

04:53.110 --> 04:59.260
وبالتالي فإن حلقة for الجديدة هذه ستكون حلقة كاملة على خطوات الاستكشاف ، وبالتالي فإن متغير

04:59.260 --> 05:01.300
الحلقة سيكون خطواتنا.

05:01.300 --> 05:12.070
لذلك بالنسبة للخطوة في النطاق والداخل ، يمكننا إدخال المعلمات مباشرة من عدد الخطوات لأن المعلمة num هي بالضبط

05:12.070 --> 05:14.680
عدد خطوات الاستكشاف.

05:14.950 --> 05:19.090
إذن بالنسبة لجميع خطوات الاستكشاف ، ماذا نفعل؟

05:19.120 --> 05:24.490
حسنًا ، سنحصل على تنبؤات النموذج ، كما تعلمون ، ما تم إرجاعه بواسطة النموذج.

05:24.490 --> 05:29.740
وللحصول على هذه التوقعات ، يمكننا ببساطة أخذ النموذج وتطبيقه على المدخلات.

05:29.740 --> 05:31.240
إذن هذه هي إشارة الإدخال.

05:31.240 --> 05:36.850
إنه يمر عبر الأدمغة في النموذج وسيوفر لنا المخرجات ، لكنه سيحصل على العديد من المخرجات.

05:36.850 --> 05:42.400
كما تعلم ، ستحصل لنا على قيم الدالة V ، وهي ناتج الناقد ، ثم

05:42.400 --> 05:45.790
مقايسة قيم Q Q ، وهي ناتج الممثل.

05:45.970 --> 05:51.430
ولكن لا تنس أيضًا أنه سينتج أيضًا مجموعة الحالات المخفية وحالات الخلية.

05:51.430 --> 05:58.120
لأن تذكر ، إذا عدنا إلى نموذجنا جيدًا في الوظيفة الأمامية ، يمكننا أن نرى أنه

05:58.120 --> 06:05.620
في الواقع يُرجع ناتج الناقد الذي يمثل قيمة الدالة v مقابل ناتج الممثل ، وهي قيم Q فحص Q

06:05.620 --> 06:12.280
، وكذلك مخرجات lshtm ، وهي عبارة عن سداسي عشري مزدوج ورؤية الحالات المخفية

06:12.670 --> 06:14.410
وحالات الخلية.

06:14.680 --> 06:16.810
لذلك يجب أن نكون حذرين مع ذلك.

06:16.810 --> 06:22.270
هذا مختلف تمامًا عما حدث من قبل ، وبالتالي سنقوم الآن بتطبيق النموذج على

06:22.270 --> 06:24.280
المدخلات وهي الحالة.

06:24.280 --> 06:29.500
ولكن الآن هناك العديد من الأشياء التي يجب القيام بها والتي تتعلق بالتعذيب ، ولكن هذا يمنح بالطبع

06:29.500 --> 06:30.610
قوة لما نقوم به.

06:31.030 --> 06:34.210
أول شيء علينا القيام به هو الضغط.

06:35.590 --> 06:40.600
الدولة المراد إضافة هذا البعد الوهمي الذي يجب أن يكون مؤشره صفر.

06:40.840 --> 06:46.250
ذلك لأن النموذج يمكنه فقط قبول دفعة من المدخلات وليس إدخالًا بمفرده في متجه

06:46.250 --> 06:47.020
أو موتر.

06:47.050 --> 06:49.420
لذلك هذا هو أول شيء يجب أن نفعله في الضغط.

06:49.420 --> 06:55.290
ولكن هذا ليس كل ما نحتاجه لتحويل حالة الإدخال إلى متغير شعلة.

06:55.300 --> 06:58.450
لذلك أقوم بإضافة المتغير هنا.

06:58.960 --> 07:01.720
لذلك نحن الآن بخير مع الدولة ، حالة الإدخال.

07:01.720 --> 07:06.790
لكن تذكر أن مدخلات الوظائف الأربع هي في الواقع صورة المدخلات.

07:06.830 --> 07:13.180
هذا ما اعتنينا به للتو ، ولكنه أيضًا العنصر الأساسي للحالات المخفية وحالات الخلية.

07:13.510 --> 07:22.030
وبالتالي ، علينا أن نضيف هنا هذا الجزء الثاني من الإدخال مع زوجي H و x و c x.

07:23.090 --> 07:23.570
حسنا.

07:23.570 --> 07:26.810
وعلينا أن نأخذ القوس الذي نذهب إليه.

07:26.810 --> 07:28.300
لدينا مدخلاتنا.

07:28.310 --> 07:30.140
الأول هو حالة الإدخال.

07:30.140 --> 07:36.080
هذه هي صور المدخلات التي تم تحويلها جميعًا إلى متغير شعلة ويتم ضغطها لإضافة هذا البعد الغامض

07:36.080 --> 07:40.160
للدُفعة وهذه المجموعة من الحالات المخفية وحالات الخلية.

07:40.160 --> 07:41.510
لذلك نحن جميعًا على ما يرام.

07:41.510 --> 07:43.670
نحن على استعداد للحصول على توقعاتنا.

07:43.820 --> 07:49.820
والآن منذ هذه العودة ، حسنًا ، تنبؤاتنا الثلاثة ، ناتج الناقد ، ناتج الممثل

07:49.820 --> 07:54.350
ومجموعة الحالات المخفية وحالة الخلية بواسطة LCM.

07:54.350 --> 07:59.720
حسنًا ، سنقوم بتقديم ثلاثة متغيرات جديدة الآن ، والتي ستكون هذه المخرجات الثلاثة.

07:59.720 --> 08:00.380
لذا ها نحن ذا.

08:00.380 --> 08:05.330
الناتج الأول هو قيمة الدالة V ، وهي ناتج الناقد.

08:05.330 --> 08:07.490
لذلك سنسميها قيمة.

08:08.330 --> 08:08.900
لذا ها نحن ذا.

08:08.900 --> 08:10.130
هذا هو الناتج الأول.

08:10.130 --> 08:16.790
ثم سيكون الناتج الثاني هو إخراج الممثل ، وهذا هو اختبار قيم Q Q.

08:16.910 --> 08:23.720
ولكن نظرًا لأن قيم Q مرتبطة بالإجراءات ، يمكننا أيضًا تسميتها قيم الإجراء.

08:24.630 --> 08:25.440
حسنا.

08:25.440 --> 08:28.700
ثم يتم إرجاع الناتج النهائي بواسطة النموذج.

08:28.710 --> 08:33.000
هذا هو الجزء العلوي من الحالة المخفية ، h x وحالات الخلية.

08:33.030 --> 08:34.920
انظر X وها نحن ذا.

08:34.920 --> 08:38.970
لدينا ثلاثة مخرجات تم إرجاعها بواسطة النموذج.

08:39.000 --> 08:39.930
في احسن الاحوال.

08:39.930 --> 08:45.420
والآن بعد أن أصبح لدينا التنبؤات ، نحتاج إلى استخدام حد أقصى ناعم لتشغيل الإجراء الصحيح.

08:45.420 --> 08:48.390
والآن سيكون هذا بالضبط نفس ما فعلناه من قبل.

08:48.420 --> 08:53.730
الخطوة التالية هي الحصول على احتمالاتنا حتى نتمكن من تسميتها prob.

08:54.700 --> 09:01.450
وهذا هو المكان الذي نستخدم فيه طريقة soft max التي نأخذها من الوحدة الوظيفية التي تحتوي على الاختصار.

09:01.450 --> 09:09.970
F لذا F نقطة soft max وهذا ما يولد توزيعًا لاحتمالات المدخلات التي نحن على وشك إدخالها

09:09.970 --> 09:14.050
الآن والتي هي بالطبع قيم الإجراء.

09:14.050 --> 09:18.880
هذه هي قيم Q ، أي ناتج الممثل في النموذج.

09:19.030 --> 09:19.270
تمام.

09:19.390 --> 09:24.820
إذن لدينا الآن احتمالاتنا ، لكن كما لاحظت ، سنعمل مع الانتروبيا ولنحصل على الانتروبيا

09:24.820 --> 09:31.090
، لا نحتاج فقط إلى الاحتمالات ولكن أيضًا احتمالات اللوغاريتمات لأن الانتروبيا هي مجموع

09:31.090 --> 09:32.770
حاصل الضرب.

09:32.770 --> 09:37.120
مرات تسجيل الدخول prob كل هذا مضروبًا في ناقص واحد.

09:37.120 --> 09:46.210
ولذا نحتاج أيضًا إلى الحصول على احتمال السجل الخاص بنا والذي سيتم إنشاؤه من log soft max.

09:46.210 --> 09:51.640
لذا فبدلاً من توزيع الاحتمالات ، نأخذ توزيعًا لاحتمالات اللوغاريتمات ونفعل

09:51.640 --> 09:54.250
ذلك باستخدام اللوغاريتمات.

09:55.060 --> 09:59.200
أعناق محشوة ، وظيفة الأقفال من الحد الأقصى هي نفسها.

09:59.200 --> 10:01.330
نحن نطبق على قيم جديلة.

10:02.280 --> 10:04.170
التي نسميها قيم العمل.

10:04.320 --> 10:04.710
حسنا.

10:04.710 --> 10:11.190
إذن لدينا الآن المسبار والمسبار ، ولذا فنحن جاهزون للحصول على الانتروبيا والإنتروبيا.

10:12.030 --> 10:13.590
ما هي الصيغة لذلك؟

10:13.620 --> 10:20.550
حسنًا ، كما ذكرت للتو ، نأخذ خاصية السجل ، ونضربها في المسبار ، ثم نأخذ

10:20.550 --> 10:22.380
مجموع كل هذا.

10:22.860 --> 10:26.010
وللقيام بذلك ، يمكننا أن نضيف هذا المجموع هنا.

10:26.830 --> 10:27.520
واحد.

10:27.640 --> 10:29.830
نحن في الواقع نستخدم هذه الحيلة عدة مرات الآن.

10:29.980 --> 10:33.400
وكما قلنا ، نضرب كل هذا في ناقص واحد.

10:33.490 --> 10:39.670
إذن فهو ناقص مجموع محصول سجل حاصل الضرب مضروبًا في احتمال الكمال.

10:39.670 --> 10:44.770
والآن سنقوم بتخزين الإنتروبيا التي تم حسابها للتو في قائمة الأنتروبيا لدينا.

10:45.340 --> 10:46.060
لأننا هناك.

10:46.060 --> 10:48.400
لدينا آخر حساب للإنتروبيا.

10:48.400 --> 10:51.370
ولذا نحتاج إلى تخزينه في قائمة الإنتروبيا.

10:51.460 --> 10:55.720
وللقيام بذلك ، لا شيء أكثر بساطة ، سنستخدم وظيفة الإلحاق ، بالطبع ، لأن

10:55.720 --> 10:57.250
الإنتروبيا هي قائمة.

10:57.250 --> 11:04.720
لذلك نأخذ قائمة الانتروبيا الخاصة بنا ، ثم النقطة ، ونستخدم وظيفة الإلحاق لإضافة الانتروبيا التي تم حسابها

11:04.720 --> 11:05.590
للتو.

11:06.420 --> 11:06.780
حسنا.

11:06.780 --> 11:08.300
لذلك سنأخذ استراحة الآن.

11:08.310 --> 11:10.020
سنفعل هذا خطوة بخطوة.

11:10.020 --> 11:15.510
في البرنامج التعليمي التالي ، سنلعب الإجراء من خلال سحب عشوائي لهذا التوزيع الناتج

11:15.510 --> 11:16.730
للاحتمالات.

11:16.740 --> 11:22.260
وبعد أن نلعب الإجراء ، سنحصل على قيمة الحالة وسنقوم في النهاية بتخزين مكافآت حالات

11:22.260 --> 11:25.230
الإرسال الجديدة الخاصة بنا وفعلنا ذلك.

11:25.230 --> 11:29.340
ستكون هذه خطوة كبيرة جديدة نقوم بها وسنكملها في البرنامج التعليمي التالي.

11:29.340 --> 11:30.590
حتى ذلك الحين ، استمتع.

11:30.600 --> 11:31.140
أنا.
