WEBVTT

00:00.610 --> 00:03.190
Halo dan selamat datang di tutorial Python ini.

00:03.190 --> 00:09.460
Jadi mari kita lakukan ini, mari kita buat ini untuk loop mulai dari kanan dan ke kiri dan

00:09.460 --> 00:11.900
untuk melakukan ini kita akan menambahkan empat.

00:11.920 --> 00:17.980
Jadi ini adalah VAR berulang yang akan menjadi langkah kita karena kita akan beralih dari langkah

00:17.980 --> 00:21.590
terakhir ke langkah pertama dari serangkaian transisi dan seterusnya.

00:21.960 --> 00:29.850
Dan kemudian trik untuk pergi dari kanan ke kiri adalah menggunakan untuk langkah terbalik terbalik.

00:30.160 --> 00:35.300
Dan sekarang kita hanya perlu memasukkan urutan dan urutan ini tentu saja seri kita.

00:35.380 --> 00:41.790
Jadi kita bisa meletakkan seri kita tetapi seperti yang Anda lihat di koran kita mulai dari T minus 1 untuk memulai.

00:41.950 --> 00:47.760
Jadi kita tidak pergi dari langkah terakhir yang merupakan tahap terminal tetapi langkah sebelum itu menjadi minus satu

00:47.800 --> 00:50.380
tetapi untuk memulai itu adalah langkah pertama.

00:50.430 --> 00:59.090
Dan jadi di sini untuk pergi dari tidak mari kita mengambil langkah itu sebelum kita perlu menambahkan kolom tanda kurung minus satu.

00:59.380 --> 01:04.270
Saya yakin bahwa bagi Anda yang mengikuti pembelajaran mesin di kursus yang lebih dalam Anda

01:04.560 --> 01:11.050
tahu trik ini Kollin minus satu berarti bahwa Anda naik ke elemen sebelum elemen terakhir tetapi tidak sampai ke elemen

01:11.050 --> 01:14.740
terakhir dan karena itu kami mendapatkan urutan yang kita inginkan.

01:14.860 --> 01:20.890
Itulah yang akan kita mulai dari elemen sebelum elemen terakhir ke elemen pertama dan kita melakukan hal-hal

01:20.890 --> 01:23.900
terbalik untuk pergi dari kanan ke kiri.

01:24.160 --> 01:26.810
Baiklah jadi kita siap untuk masuk ke loop.

01:27.170 --> 01:29.740
Jadi di dalam ini untuk loop apa yang akan kita lakukan.

01:29.780 --> 01:32.870
Di mana kita akan melakukan persis seperti di koran.

01:32.900 --> 01:39.340
Kami akan memperbarui hadiah kumulatif dengan mengalikannya dengan Ghana dan menambahkan kata yang diperoleh pada langkah saat

01:39.400 --> 01:42.500
ini yang ada di langkah tindak lanjut.

01:42.670 --> 01:45.450
Baiklah jadi mari kita lakukan ini kembali ke Python.

01:45.590 --> 01:57.780
Jadi kami ingin memperbarui akumulasi kami, kami bekerja dengan cara berikut dengan terlebih dahulu mengalikannya dengan gamma.

01:57.780 --> 01:58.580
Itu dia.

01:58.660 --> 02:07.910
Di sini kita mengalikannya dengan gamma dan kemudian kita ingin menambahkan hadiah dari apa yang dapat kita akses dengan struktur

02:07.970 --> 02:09.420
khusus ini.

02:09.450 --> 02:13.120
Ingat kata itu adalah atribut objek.

02:13.130 --> 02:15.910
Dan jadi di sini tentu saja kami menambahkan nilai tambah.

02:16.020 --> 02:17.330
Baiklah itu adalah hadiah kumulatif.

02:17.450 --> 02:19.310
Sama dengan yang kita inginkan, langkah ini.

02:19.370 --> 02:25.620
Kita sekarang berada di loop dan Gahanna dikalikan dengan hadiah kumulatif sebelumnya sebelum a.

02:26.150 --> 02:26.870
Sempurna.

02:26.870 --> 02:28.190
Jadi sekarang saya pikir kita baik-baik saja.

02:28.220 --> 02:30.180
Kami benar-benar mengikuti algoritma.

02:30.500 --> 02:32.600
Dan sekarang saatnya untuk langkah selanjutnya.

02:32.840 --> 02:35.090
Nah sekarang ini akan menjadi sangat mudah.

02:35.090 --> 02:40.880
Kami kembali ke tindak lanjut pertama karena ini untuk loop hanya untuk menghitung hadiah kumulatif tidak pergi

02:41.060 --> 02:44.010
dari kanan ke kiri dengan memperbarui cara ini.

02:44.030 --> 02:50.930
Mengikuti algoritme dan sekarang seperti yang Anda ingat, tujuan melakukan ini adalah untuk menyiapkan input dan target

02:50.930 --> 02:55.950
kami agar kami dapat meminimalkan perbedaan kuadrat antara keduanya untuk pelatihan.

02:55.950 --> 03:01.020
Dan saat ini satu-satunya hal yang harus kita lakukan adalah menyiapkan input dan toilet ini.

03:01.220 --> 03:08.410
Jadi mari kita lakukan ini dulu apa yang perlu kita lakukan adalah menambahkan tanggal pertama seri dalam daftar bagian kita.

03:08.510 --> 03:11.460
Sejauh ini keadaan ini merupakan bagian dari tujuan kami.

03:11.480 --> 03:14.100
Itu hanya untuk menghitung output.

03:14.270 --> 03:19.370
Jadi kita akan mendapatkan status input dari langkah pertama ini secara terpisah karena itulah yang perlu

03:19.370 --> 03:21.320
kita lakukan dalam daftar kita.

03:21.380 --> 03:23.340
Jadi mari kita dapatkan ini secara terpisah.

03:23.360 --> 03:25.910
Karena itu kita akan menyebutnya negara.

03:26.000 --> 03:32.930
Dan persis sama dengan di sini kita bisa mendapatkannya dengan mengambil indeks pertama dari seri yang berisi

03:32.930 --> 03:38.300
transisi pertama dan kemudian menambahkan keadaan itu untuk mendapatkan keadaan transisi pertama ini.

03:38.330 --> 03:44.390
Jadi itulah situs yang kita butuhkan kemudian mengatakan kita akan mendapatkan secara terpisah target yang terkait

03:44.840 --> 03:46.830
dengan tahap input transisi ini.

03:46.880 --> 03:53.450
Dan variabel baru yang menarik di sini target yang akan sama dengan nilai langkah pertama.

03:53.540 --> 03:59.990
Dan karena nilai Q dikembalikan oleh jaringan saraf dan konten dan outputnya dan karena output adalah

04:00.070 --> 04:07.370
output yang terkait dengan input ini yang berisi yang pertama dari transisi dengan baik kita bisa mendapatkan nilai q

04:07.370 --> 04:12.830
dari kencan pertama hanya dengan mengambil output di sini dan mengambil indeks nol.

04:13.100 --> 04:20.630
Dan kemudian kita menambahkan data itu yang hanya akan memberi kita nilai Q dari negara input dari transisi pertama dan itulah

04:21.050 --> 04:22.310
waktu yang tepat.

04:22.320 --> 04:30.080
T Jadi dengan begitu kita mengambilnya maka kita akan memperbarui variabel target ini tetapi hanya untuk tindakan yang

04:30.080 --> 04:35.680
dipilih pada langkah pertama seri dan untuk mengakses langkah pertama seri ini.

04:35.870 --> 04:42.710
Kita perlu mengambil seri 0 pertama karena ini adalah langkah pertama pada seri 3 0.

04:42.970 --> 04:50.290
Dan untuk mengakses tindakan yang sesuai dengan langkah pertama dari seri ini dengan baik, kita perlu menambahkan di sini

04:50.380 --> 04:57.340
bahwa tindakan lagi yaitu struktur atribut ini yang kami gunakan. Anda tahu aksi adalah atribut dari langkah

04:57.340 --> 04:58.900
pertama dari seri.

04:58.900 --> 05:04.570
Itu adalah transisi pertama dari seri karena setiap transisi dari seri memiliki kata tindakan

05:04.720 --> 05:11.350
keadaan struktur berikut dan melakukan tindakan di sini tindakan atribut ini di sini berarti bahwa kita

05:11.500 --> 05:14.150
hanya mendapatkan tindakan kencan pertama ini.

05:14.330 --> 05:21.320
Jadi target untuk tindakan spesifik dari langkah pertama itulah yang perlu diperbarui oleh

05:21.410 --> 05:22.850
komunitas dunia.

05:22.850 --> 05:29.490
Jadi pada dasarnya di sini kita hanya akan menulis target yang terkait dengan aksi yang dimainkan.

05:29.630 --> 05:35.810
Langkah pertama dari seri ini adalah penghargaan kumulatif ini yang baru saja kita hitung.

05:36.130 --> 05:44.780
Baiklah dan sekarang kita akhirnya siap untuk memperbarui input kami dengan menambahkan ini tinggal pertama di sini dan ini pertama di sini

05:44.780 --> 05:46.770
selama satu jam pertama.

05:46.970 --> 05:53.090
Kami hanya perlu memperbarui langkah pertama dari seri karena Anda tahu kami melatih AI pada 10 langkah dan oleh

05:53.090 --> 05:56.000
karena itu input adalah langkah pertama dari sepuluh langkah.

05:56.180 --> 06:01.400
Dan kami juga mendapatkan target pada langkah pertama ini tetapi kemudian kami tidak mendapatkan input atau toilet

06:01.400 --> 06:06.310
apa pun dalam langkah-langkah 10 langkah berikut karena pada dasarnya pembelajaran terjadi 10 langkah setelahnya.

06:06.500 --> 06:11.380
Itulah mengapa saat ini kami hanya mendapatkan status dan target langkah pertama dari seri.

06:11.840 --> 06:16.820
Jadi, penting untuk memahami itu dan oleh karena itu jika kita mengerti bahwa sekarang kita memahami

06:16.820 --> 06:20.590
bahwa kita harus memasukkannya dalam daftar input dan daftar target kita.

06:20.660 --> 06:21.560
Jadi mari kita lakukan ini.

06:21.560 --> 06:25.140
Pertama mari kita tambahkan status ke input kita.

06:25.190 --> 06:33.680
Jadi kami mengambil daftar input kami dan kami menggunakan fungsi append untuk menambahkan status yang mengingat status input dari langkah

06:33.680 --> 06:41.030
pertama dari seri dan kemudian kami akan menambahkan target pada langkah pertama ke daftar target kami dan

06:41.120 --> 06:47.270
melakukan ini kami mengambil daftar target kami dan mengatakan kami menggunakan fungsi append untuk

06:47.270 --> 06:49.460
menambahkan target pertama ini.

06:49.490 --> 06:50.360
Itu dia.

06:50.540 --> 06:56.750
Hampir selesai dan sekarang kita perlu mengembalikan hal-hal terakhir yang tentu saja kita butuhkan seperti yang

06:56.840 --> 07:01.760
kita katakan di awal tutorial ini input dan target yang sekarang diperbarui.

07:02.090 --> 07:07.580
Jadi kita akan menambahkan di sini setiap belokan dan kita akan mendapatkan

07:07.580 --> 07:14.660
input kita terlebih dahulu, tetapi kemudian kita perlu mengonversinya menjadi array angka terlebih dahulu kemudian melakukan konversi

07:14.660 --> 07:21.710
tipe untuk memastikan kita memiliki tipe tunggal dengan tipe tersebut. Anda sama dan mengapung 32 sama.

07:21.890 --> 07:28.520
Dan kemudian kami mengonversikannya menjadi tensor obor karena tentu saja kami bekerja dengan obor yang sepenuhnya

07:28.730 --> 07:29.540
wajib.

07:29.570 --> 07:36.040
Dan jadi saya menggunakan obor dari fungsi non-Thailand lagi.

07:37.180 --> 07:39.000
Dan itu memberi kita masukan kita.

07:39.130 --> 07:39.590
Sempurna.

07:39.590 --> 07:42.460
Dan sekarang mari kita lakukan hal yang sama untuk target.

07:42.520 --> 07:44.620
Sekarang kita bisa menggunakan trik ini yang lebih cepat.

07:44.710 --> 07:50.950
Kita akan menumpuk target bersama-sama dan untuk melakukan ini kita harus mengambil dulu

07:50.950 --> 07:57.230
pustaka obor kita karena kita akan menggunakan fungsi tumpukan dengan obor untuk menumpuk target.

07:57.250 --> 07:57.550
Baiklah.

07:57.550 --> 08:04.030
Jadi baris kode ini pada dasarnya mengembalikan input dan toilet yang baru saja diperbarui

08:04.030 --> 08:07.100
melalui penelusuran kelayakan algoritma Sarsour ini.

08:07.180 --> 08:10.710
Atau kita dapat memanggilnya dan masuk dan mengirimkan ucapan selamat kami.

08:10.780 --> 08:16.540
Kami siap untuk melakukan pelatihan terakhir karena pada dasarnya pelatihan terdiri dari

08:16.540 --> 08:20.950
meminimalkan perbedaan kuadrat antara prediksi input kami dan toilet.

08:21.160 --> 08:22.870
Jadi mari kita buat mata kita pintar.

08:22.870 --> 08:25.150
Ini akan menjadi pintar dan selanjutnya.

08:25.210 --> 08:26.980
Dan sampai saat itu menikmati AI.
