WEBVTT

00:00.240 --> 00:06.600
Halo dan selamat datang di tutorial Python ini di Statoil kita akan membuat langkah pertama dalam menerapkan

00:06.630 --> 00:08.270
model teori yang mendalam.

00:08.280 --> 00:13.590
Jadi pada dasarnya kita akan mengimplementasikan seluruh proses algoritma difusi.

00:13.830 --> 00:16.580
Jadi kami akan menggunakan apa yang kami buat sebelumnya.

00:16.590 --> 00:22.460
Itu adalah arsitektur jaringan saraf untuk memutar ulang memori untuk mengintegrasikan ini ke dalam seluruh

00:22.530 --> 00:24.180
proses pembelajaran dequeue.

00:24.180 --> 00:28.320
Dan keseluruhan algoritma pembelajaran ini akan masuk ke dalam satu kelas.

00:28.380 --> 00:32.340
Itu yang terakhir yang kami buat untuk mengimplementasikan kecerdasan buatan.

00:32.340 --> 00:35.650
Dan kelas ini hanya akan berisi fungsi yang berbeda.

00:35.700 --> 00:41.790
Jadi kita akan memiliki fungsi-fungsi di dalamnya yang akan membuat dan menginisialisasi semua variabel yang melekat pada

00:41.790 --> 00:48.450
objek-objek memutar kita di masa depan yang akan mewakili model itu sendiri dan mereka akan memiliki beberapa fungsi lainnya.

00:48.510 --> 00:52.830
Salah satunya tentu saja akan memilih tindakan yang tepat setiap kali.

00:52.950 --> 00:59.250
Kami juga akan memiliki fungsi inti fungsi pembaruan untuk mendapatkan inti ini dan memiliki gagasan tentang bagaimana pembelajaran berjalan

00:59.250 --> 01:01.030
jika itu berjalan dengan baik.

01:01.090 --> 01:07.080
Jika eksplorasi berjalan dengan baik dan jika dapat beralih ke eksploitasi, maka kita akan memiliki fungsi

01:07.080 --> 01:12.430
yang aman untuk menyelamatkan besok, yaitu menyelamatkan otak mobil dan akhirnya memuat fungsi.

01:12.480 --> 01:14.590
Jadi kami memiliki beberapa fungsi untuk dibuat.

01:14.640 --> 01:17.440
Kita akan membuat satu fungsi untuk masing-masing bekerja keras.

01:17.490 --> 01:22.820
Dan hari ini kita akan mulai dengan fungsi akhir seperti biasa ketika kita membuat kelas.

01:23.010 --> 01:30.040
Tapi pertama-tama jangan lupa untuk memperkenalkan kelas sehingga kita akan menyebutnya D.

01:30.200 --> 01:35.970
T Dan untuk jaringan Anda maka beberapa panggilan kurung masuk

01:36.030 --> 01:39.440
Dan kemudian kita pergi dengan fungsi pertama kita.

01:39.500 --> 01:47.910
Jadi mari kita lakukan def ini kemudian double garis bawah lalu garis bawah ganda lagi dan tanda kurung.

01:48.170 --> 01:53.530
Jadi seperti yang Anda pahami dalam fungsi ini, kami akan memperkenalkan variabel-variabel yang melekat pada objek kami.

01:53.570 --> 01:59.240
Jadi kita akan memiliki beberapa baris yang memulai semuanya sendiri dan pada dasarnya kita akan

01:59.300 --> 02:03.530
membuat dan menginisialisasi semua variabel yang diperlukan untuk mengimplementasikan jaringan D2.

02:03.530 --> 02:09.740
Jadi kita akan misalnya membuat objek atau jaringan karena tentu saja kita membutuhkan jaringan saraf kita yang dalam maka

02:10.310 --> 02:12.190
kita akan membutuhkan memori kita.

02:12.300 --> 02:14.630
Kami akan membuat variabel lain untuk memori.

02:14.740 --> 02:20.430
Jadi kita akan memiliki memori self-up variabel lain tetapi kemudian itu tidak semua kita harus membuat juga.

02:20.480 --> 02:22.390
Beberapa variabel untuk tanggal terakhir.

02:22.490 --> 02:24.820
Tindakan terakhir dan kata terakhir.

02:24.920 --> 02:30.520
Itu tentu saja Anda tahu variabel yang Anda lihat dalam algoritma difusi.

02:30.920 --> 02:31.830
Lalu apa lagi.

02:31.940 --> 02:38.150
Yah kita juga akan membutuhkan pengoptimal yang Anda tahu untuk melakukan grid stokastik dalam arti bobot data

02:38.510 --> 02:42.170
sesuai dengan berapa banyak mereka akan berkontribusi pada kesalahan.

02:42.320 --> 02:48.650
Ketika AI membuat kesalahan dan kemudian saya berpikir bahwa pada dasarnya itulah variabel yang sekarang perlu kita

02:48.650 --> 02:50.230
buat dan inisialisasi.

02:50.510 --> 02:58.460
Tetapi dalam fungsi init ini kita akan menempatkan beberapa argumen pertama sebagai diri biasa yang merupakan argumen yang mengacu

02:58.460 --> 03:00.190
pada objek kita.

03:00.200 --> 03:05.210
Maka karena Anda tahu kita akan membuat objek dari kelas jaringan.

03:05.390 --> 03:12.740
Nah sejak kelas jaringan mengambil sebagai argumen dalam ukuran input fungsi init dan tindakan Nah itu sama

03:12.740 --> 03:13.740
di sini.

03:13.850 --> 03:19.110
Saat membuat objek kelas jaringan kita perlu memilih argumen ukuran input dan

03:19.160 --> 03:20.180
argumen aktual.

03:20.180 --> 03:22.140
Karena itu kita bisa menyalinnya di

03:25.660 --> 03:27.520
sini dan di sini.

03:27.710 --> 03:30.450
Jadi argumen ini sekarang akan menjadi.

03:30.560 --> 03:33.160
Juga beberapa argumen tidak bertahan lama.

03:33.170 --> 03:39.680
Setiap kali kita membuat beberapa objek masa depan dari kelas yang berbeda yang beberapa model peran masa depan dical

03:39.680 --> 03:45.010
Yah kita akan perlu menentukan ukuran input yang saya ingatkan adalah jumlah dimensi dalam vektor yang

03:45.010 --> 03:46.330
termasuk negara Anda.

03:46.370 --> 03:52.940
Input Anda menyatakan dan sejumlah tindakan yang merupakan jumlah tindakan yang dapat dilakukan mobil.

03:53.150 --> 03:54.000
Jadi saya mengingatkan Anda.

03:54.110 --> 03:57.830
Ini adalah ke kiri ke kanan atau ke kanan.

03:58.190 --> 03:59.270
Oke, sempurna.

03:59.270 --> 04:04.640
Kemudian Anda tahu bahwa Anda akan membuat objek baru dari kelas memori replay untuk

04:04.640 --> 04:10.680
membuat objek memori untuk mendapatkan memori kita tentang transisi dan dalam informasi kita memiliki argumen kapasitas.

04:10.850 --> 04:16.640
Tapi karena kita hanya akan menggunakannya sekali sebenarnya ketika kita membuat memori dan bukan

04:16.640 --> 04:20.000
setelahnya Yah kita tidak perlu menentukan argumen kapasitas.

04:20.030 --> 04:25.330
Kita bisa melakukan ini, tetapi akan secara langsung memasukkan jumlah transisi yang kita inginkan.

04:26.150 --> 04:32.390
Tetapi kemudian kita membutuhkan satu argumen terakhir yaitu untuk mendapatkan parameter dalam model guru.

04:32.480 --> 04:35.470
Ingat parameter gamma ini adalah penundaan.

04:35.750 --> 04:41.300
Dan itu adalah parameter dari persamaan dan oleh karena itu kami akan meletakkannya di sini karena kami

04:41.510 --> 04:42.920
akan menggunakannya beberapa kali.

04:43.160 --> 04:44.990
Jadi mari kita taruh di sini.

04:45.070 --> 04:47.140
Kita akan menyebutnya Gamma.

04:47.150 --> 04:52.610
Jadi untuk itu hanya nama argumen dan kemudian kita lanjutkan bahwa semua argumen yang Anda perlukan untuk

04:52.610 --> 04:53.740
ini dalam fungsinya.

04:53.750 --> 05:00.320
Jadi itu berarti bahwa setiap kali kita membuat model kamus kita, setiap kali kita membuat objek guru

05:00.320 --> 05:01.390
di kelas.

05:01.520 --> 05:08.060
Kita perlu menentukan argumen ukuran input jumlah aksi dan parameter.

05:08.360 --> 05:10.590
Dan kita akan akhiri dengan nilai nyata untuk mereka.

05:11.210 --> 05:13.870
Baiklah jadi sekarang mari kita masuk ke dalam fungsi.

05:14.100 --> 05:14.400
BAIK.

05:14.410 --> 05:16.480
Jadi sekarang pada dasarnya ini akan mudah.

05:16.510 --> 05:21.090
Kami baru saja akan membuat dan menginisialisasi semua variabel yang kita butuhkan.

05:21.110 --> 05:22.770
Jadi mari kita mulai dengan yang pertama.

05:22.910 --> 05:24.460
Mari kita mulai dengan gamma.

05:24.530 --> 05:26.090
Sebenarnya koefisien delay.

05:26.330 --> 05:31.850
Jadi karena ini adalah Voivode yang ingin dilampirkan ke objeknya, kita mulai dengan diri sendiri.

05:31.880 --> 05:39.500
Jadi gamma akan menjadi variabel guru kita dan model itu sendiri bahwa gamma sama dengan argumen yang

05:39.530 --> 05:42.930
akan dimasukkan ketika membuat objek kelas detune.

05:42.950 --> 05:46.900
Jadi Janna dan kita mulai dengan argumen kedua.

05:47.040 --> 05:50.560
Argumen kedua akan menjadi jendela hadiah.

05:50.840 --> 05:52.340
Jadi apa jendela ini?

05:52.520 --> 05:57.950
Nah itu akan menjadi jendela geser dari rata-rata 100 kata terakhir yang akan Anda gunakan

05:58.010 --> 06:04.280
hanya untuk mengevaluasi evolusi kinerja yang Anda tahu akan memiliki arti kata ke dalam perang ini Windu

06:04.280 --> 06:06.320
yang akan meluncur seiring waktu.

06:06.440 --> 06:11.680
Dan apa yang ingin kita amati adalah arti dari 100 kata terakhir meningkat seiring waktu.

06:11.930 --> 06:18.610
Jadi mari kita inisialisasi dengan diri sendiri yang menghargai jendela garis bawah.

06:18.710 --> 06:24.690
Dan karena ini akan menjadi jendela geser dari rata-rata yang berkembang dari 100 kata terakhir.

06:24.860 --> 06:31.710
Yah kita akan menginisialisasi itu sebagai daftar kosong dan kemudian kita akan memperluas berarti bahwa kita bekerja lembur.

06:32.860 --> 06:35.320
Baiklah maka lebih mengasyikkan.

06:35.420 --> 06:37.430
Mari kita buat jaringan saraf kita.

06:37.580 --> 06:43.780
Jadi kita akan menyebutnya Mario otodidak karena pada dasarnya itulah jantung para model.

06:43.790 --> 06:51.890
Saya menyebutnya model dan model ini tidak lain adalah subjek di kelas itu dan untuk membuat objek

06:51.890 --> 06:53.270
seperti itu.

06:53.300 --> 07:02.630
Kami mengambil jaringan kelas kami dalam tanda kurung dan di sini kami hanya menempatkan argumen kelas tetapi kami menempatkan argumen ini

07:02.750 --> 07:08.930
dalam argumen fungsi init dan oleh karena itu kami hanya perlu menyalinnya di

07:08.930 --> 07:15.290
sini dan hanya menempelkannya di kelas jaringan dan kemudian kami pergi dengan baris kode ini.

07:15.350 --> 07:22.690
Kami membuat satu jaringan saraf untuk model pembelajaran yang sempurna kemudian mari kita buat memori.

07:22.880 --> 07:29.930
Jadi sekali lagi kita akan membuat Vargo baru yang kita sebut memori otodidak.

07:29.930 --> 07:34.190
Dan lagi ini akan menjadi objek dari kelas memori replay.

07:34.220 --> 07:42.320
Jadi mari kita ambil nama atau kelas, mari kita salin, tetapi mari kita hadapi itu di sini dan dalam beberapa kurung

07:42.320 --> 07:48.680
kita perlu menempatkan kapasitas karena kapasitas adalah argumen dari fungsi dan itulah satu-satunya argumen yang kita

07:48.680 --> 07:49.880
butuhkan di sini.

07:50.240 --> 07:55.100
Jadi, kapasitas apa yang akan kita pilih mengingat yang sesuai dengan jumlah transisi,

07:55.100 --> 07:59.800
jumlah peristiwa yang terakhir Anda nyatakan tindakan terakhir dan kata terakhir.

07:59.830 --> 08:07.550
Dan seperti yang disebutkan dalam salah satu kerja keras Priester kita akan mengambil seratus ribu seratus ribu transisi

08:07.550 --> 08:14.390
ke dalam memori dan kemudian kita akan mengambil sampel dari memori ini untuk mendapatkan sejumlah kecil

08:14.390 --> 08:18.670
transisi acak dan di mana model tersebut akan OK.

08:18.720 --> 08:21.210
Jadi sekarang kita memiliki ingatan kita yang sempurna.

08:21.210 --> 08:23.180
Sekarang mari kita dapatkan pengoptimal kami.

08:23.430 --> 08:31.800
Jadi sekali lagi kita membuat variabel baru ini kita sebut optimizer jadi optimizer adalah variabel lain dari dequeue

08:31.800 --> 08:35.320
masa depan kita sebuah objek self optimizer.

08:35.520 --> 08:44.130
Dan sekarang jika kita kembali, Anda dapat melihat bahwa kami mengimpor Upton tersiksa yang merupakan obor modular yang berisi semua alat

08:44.160 --> 08:47.080
untuk melakukan untuk mendapatkan grid di tengah.

08:47.130 --> 08:54.260
Jadi tentu saja itu berisi beberapa pengoptimal dan kami memberikannya jalan pintas Upton dan oleh karena itu di sini

08:54.270 --> 09:00.900
yang akan kami lakukan adalah mengambil model kepadanya yang obor yang terserah dia dan dari modul ini kita

09:00.900 --> 09:03.060
akan mengambil salah satu pengoptimal.

09:03.180 --> 09:05.670
Jadi seperti yang Anda lihat mereka semua terdaftar di sini.

09:05.880 --> 09:10.630
Banyak dari mereka sangat baik misalnya Propp baju besi adalah pengoptimal yang sangat baik.

09:10.640 --> 09:16.170
Sebagai contoh, sangat direkomendasikan untuk catatan jaringan saraf atau pembelajaran mendalam tanpa pengawasan.

09:16.230 --> 09:22.140
Tapi yang lain yang sangat bagus dan dia akan pilih adalah pengoptimal atom.

09:22.500 --> 09:26.400
Itu yang Anda akan melihat bahwa dengan ini akan mendapatkan mobil self-driving yang bagus

09:26.580 --> 09:32.000
Tetapi sekali lagi Anda benar-benar dipersilakan untuk mencoba yang lain Anda dapat mencoba alat bantu lengan tetapi untuk logam kami akan

09:32.000 --> 09:32.810
memilih Adam.

09:32.850 --> 09:34.290
Jadi saya menekan enter.

09:34.560 --> 09:37.240
Dan sebenarnya Anda akan melihat ada gedung DPR di sini.

09:37.260 --> 09:40.430
Itu karena kami membuat objek kelas Atom.

09:40.430 --> 09:44.990
Ini adalah kelas tetapi objek akan menjadi pengoptimal atom itu sendiri.

09:45.060 --> 09:50.970
Tetapi karena ini adalah kelas, kita perlu memberikan beberapa argumen, argumen dari kelas Atom dan

09:51.060 --> 09:55.270
argumen adalah semua parameter yang dapat menyesuaikan dan pengoptimal Anda.

09:55.380 --> 10:00.330
Jadi misalnya itu biasanya tingkat belajar pembusukan atau beberapa parameter lainnya.

10:00.510 --> 10:05.690
Dan selain mengambil semua parameter Ormeau kami akan menentukan tingkat pembelajaran.

10:05.970 --> 10:08.650
Jadi ini awal dari parameter model kami.

10:08.670 --> 10:12.830
Kita bisa mendapatkannya dengan model keraguan diri.

10:12.870 --> 10:17.530
Jadi itulah model yang kami buat di sini model otodidak dari kelas kami sendiri.

10:17.580 --> 10:24.780
Jadi model otodidak dan kemudian untuk mengakses parameter model kami menambahkan titik lain dan kemudian parameter dengan

10:25.500 --> 10:28.170
beberapa tanda kurung sangat sederhana.

10:28.170 --> 10:35.860
Jadi itu hanya untuk menghubungkan pengoptimal addon ke jaringan saraf kita yang kita buat di sini lagi kemudian seperti

10:35.880 --> 10:42.810
yang baru saja kita sebutkan kita akan menambahkan tingkat pembelajaran dan argumen untuk ini adalah milik kita.

10:43.170 --> 10:50.540
Dan kita akan mengaturnya sama dengan nilai sehingga pembelajaran tidak terjadi terlalu cepat jika kita mendapatkan tingkat pembelajaran terlalu

10:50.540 --> 10:53.910
besar maka AI AI akan belajar dengan benar.

10:53.910 --> 10:58.890
Kami ingin memberi AI kami waktu untuk mengeksplorasi belajar dari kesalahannya.

10:58.890 --> 11:04.320
Anda tahu kapan kita menghukumnya ketika melakukan kesalahan seperti masuk akal atau terlalu dekat

11:04.320 --> 11:05.510
dengan tembok.

11:05.770 --> 11:08.780
Kami ingin memberi waktu untuk belajar.

11:08.880 --> 11:12.030
Kami ingin cara jaringan saraf untuk berkencan dengan benar.

11:12.180 --> 11:21.010
Jadi nilai bagus untuk tingkat pembelajaran yang saya dapatkan setelah mencoba beberapa diantaranya adalah 0. 2 atau satu.

11:21.210 --> 11:24.540
Baiklah dan hanya itu yang kita butuhkan untuk membuat pengoptimal.

11:24.720 --> 11:28.320
Jadi pada dasarnya Anda membuat objek kelas Atom.

11:28.530 --> 11:29.050
Besar.

11:29.070 --> 11:35.980
Dan kemudian tiga variabel terakhir yang kita butuhkan adalah variabel yang menyusun peristiwa transisi kita.

11:36.150 --> 11:40.130
Jadi itulah tanggal terakhir tindakan terakhir dan kata terakhir.

11:40.170 --> 11:45.280
Dan pada dasarnya itulah yang akan kita buat sekarang dan kita hanya perlu menginisialisasi mereka.

11:45.300 --> 11:50.130
Jadi mari kita mulai dengan kencan terakhir tanggal terakhir kita akan menyebutnya otodidak.

11:50.400 --> 11:56.000
Keadaan garis bawah terakhir dan kemudian bagaimana Anda akan menginisialisasi itu.

11:56.190 --> 12:03.840
Ingat tanggal terakhir adalah vektor 5 dominasi, vektor yang dikodekan dalam satu keadaan

12:03.840 --> 12:04.700
lingkungan.

12:04.950 --> 12:10.800
Dan sebagai pengingat lima dimensi ini adalah tiga sinyal dari tiga sensor kiri

12:10.800 --> 12:15.180
lurus dan kanan dan orientasi dan orientasi minus.

12:15.210 --> 12:18.350
Jadi ini adalah vektor dan pengertian intuitif.

12:18.420 --> 12:21.060
Tetapi untuk obor itu harus lebih dari vektor.

12:21.210 --> 12:23.640
Ini sebenarnya harus menjadi tensor obor.

12:23.820 --> 12:29.970
Tetapi tidak hanya perlu sensor obor tetapi juga perlu memiliki satu dimensi lagi yang saya

12:29.970 --> 12:33.510
suka menyebutnya dimensi palsu yang sesuai dengan batch.

12:33.630 --> 12:39.810
Dan itu karena delapan terakhir akan menjadi input dari jaringan saraf tetapi ketika bekerja dengan saya ketika itu

12:39.810 --> 12:46.220
bekerja secara umum apakah itu dengan aliran yang lebih padat membawa obor sedangkan vektor input tidak bisa menjadi

12:46.290 --> 12:48.040
vektor sederhana dengan sendirinya.

12:48.210 --> 12:49.760
Itu harus dalam batch.

12:49.830 --> 12:57.660
Jaringan hanya dapat menerima kumpulan pengamatan input dan oleh karena itu tidak hanya akan membuat tensor untuk

12:57.870 --> 13:05.140
vektor negara input tetapi juga kami akan membuat dimensi palsu ini sesuai dengan batch.

13:05.190 --> 13:11.490
Jadi mari kita lakukan ini dan mari kita mulai dengan menginisialisasi tensor obor sehingga untuk melakukan ini tidak ada yang

13:11.490 --> 13:12.340
lebih sederhana.

13:12.510 --> 13:21.810
Kita ambil perpustakaan torche kita lalu titik dan kemudian kita akan menggunakan kelas tensor karena seperti yang Anda

13:21.810 --> 13:27.950
duga ini akan membuat objek kelas tensor yang merupakan objek tensor.

13:28.120 --> 13:34.660
Dan dalam tensor ini kita perlu menempatkan argumen yang akan menentukan ukuran tensor.

13:34.660 --> 13:38.720
Anda dapat membayangkannya seperti array yang memiliki satu tipe tunggal.

13:38.890 --> 13:45.430
Tetapi pada dasarnya apa yang akan diwakili sekarang tentu saja keadaan input ini yang dapat Anda lihat memiliki vektor

13:46.180 --> 13:49.380
dan untuk menentukan jumlah elemen yang harus dimiliki jarak.

13:49.570 --> 13:55.180
Yah kita perlu menggunakan tentu saja ukuran input karena ukuran input persis jumlah dimensi

13:55.510 --> 13:57.520
vektor negara input kami.

13:57.520 --> 13:59.050
Sekarang saya harus mengatakan tensor.

13:59.170 --> 14:05.650
Jadi apa yang kita perlu input di kelas tensor kita untuk membuat objek tensor.

14:06.010 --> 14:07.260
Nah itu tidak tepat.

14:07.540 --> 14:10.230
Dan nantinya ukuran input akan dikuantifikasi.

14:11.350 --> 14:12.430
Baiklah itu bagus.

14:12.430 --> 14:13.670
Itu hal pertama yang dilakukan.

14:13.720 --> 14:17.390
Kami baru saja menginisialisasi tensor sebagaimana mestinya.

14:17.530 --> 14:23.080
Tetapi ingatlah bahwa kita perlu melakukan hal lain yang perlu kita buat dimensi palsu itu

14:23.080 --> 14:30.070
karena ini adalah apa yang diharapkan jaringan untuk inputnya dan untuk menciptakan yang ini untuk pemeriksaan yang omong-omong harus menjadi

14:30.070 --> 14:35.840
mesin pertama kali Anda tahu kerusakan Anda Dimasukkan ke dalam batch akan menjadi pertama kalinya saya menyebutkan

14:35.940 --> 14:37.800
ini katakanlah dengan sangat baik.

14:38.230 --> 14:46.050
Nah untuk melakukan ini kita hanya perlu menambahkan itu lalu memeras dan kemudian dalam tanda kurung.

14:46.050 --> 14:49.580
Kita perlu menempatkan indeks dari dimensi besar ini.

14:49.620 --> 14:55.790
Dan seperti yang saya katakan dimensi palsu ini harus menjadi animasi pertama dari tanggal terakhir dan

14:55.790 --> 15:02.460
sejak indeks dan byte dimulai nol kita perlu memasukkan nol sehingga mesin paradigma baru ini menjadi mesin

15:02.460 --> 15:03.570
baris pertama.

15:03.570 --> 15:09.360
Jadi kami memiliki mesin pertama kali yang sesuai dengan batch dan kemudian berlian

15:09.360 --> 15:15.960
harus menanggapi sensor yang akan berisi lima elemen input Anda menyatakan tiga orientasi sinyal dan

15:15.990 --> 15:16.910
orientasi minus.

15:17.370 --> 15:21.960
Dan kemudian kita mulai menginisialisasi keadaan input kita dengan benar.

15:21.960 --> 15:22.850
Sempurna.

15:23.310 --> 15:30.840
Dan kemudian dua variabel untuk pergi dan itu akan menjadi jauh lebih mudah karena variabel berikutnya adalah tindakan

15:31.110 --> 15:31.850
terakhir.

15:32.190 --> 15:36.340
Itu Roybal baru yang kami buat untuk aksi terakhir Object.

15:36.510 --> 15:43.440
Dan ingat dalam tutorial pertama dari bagian yang saya katakan bahwa tindakan akan menjadi

15:43.440 --> 15:52.470
0 1 atau 2 dan kemudian menggunakan vektor rotasi tindakan kita akan mengkonversi indeks tindakan ini menjadi sudut

15:52.470 --> 15:58.010
rotasi yang saya ingatkan 0 kami 20 atau minus 20.

15:58.050 --> 16:00.980
Kita sebenarnya bisa menyegarkan ingatan kita dengan itu.

16:01.200 --> 16:03.170
Yah itu persis di sini.

16:03.170 --> 16:06.260
Aksi berotasi jika aksinya nol.

16:06.390 --> 16:11.650
Nah ini akan sesuai dengan indeks pertama nol jika aksinya 1.

16:11.700 --> 16:17.310
Ini akan sesuai dengan indeks salah satu dari vektor-vektor ini dari 20 derajat dan jika aksinya

16:17.310 --> 16:23.490
adalah kita akan mendapatkan minus 20 derajat itu akan menjadi sudut rotasi mobil kita ketika kita memainkan aksinya.

16:23.510 --> 16:24.200
Baiklah.

16:24.380 --> 16:31.040
Dan karena itu tindakannya akan menjadi 0 1 atau 2 Nah tindakannya ada untuk angka

16:31.040 --> 16:31.740
sederhana.

16:31.850 --> 16:35.440
Dan dengan sangat sederhana kita dapat menginisialisasi ke nol.

16:35.660 --> 16:38.330
Kami tidak perlu membuat puluhan atau mendengar apa pun.

16:38.360 --> 16:40.880
Kita hanya perlu menginisialisasi dengan nol.

16:41.420 --> 16:42.850
Dan akhirnya.

16:43.010 --> 16:44.460
Nah itu kata terakhir.

16:44.550 --> 16:48.840
Diri adalah kata terakhir.

16:48.860 --> 16:49.940
Itu dia.

16:49.940 --> 16:56.510
Dan lagi kata itu adalah angka float yang saya ingatkan adalah antara minus 1 dan plus 1.

16:56.510 --> 16:57.790
Jadi itu angka lagi.

16:57.860 --> 16:59.400
Dan untuk aksinya.

16:59.510 --> 17:02.900
Kami akan menginisialisasi ke nol dan kemudian kita pergi.

17:02.900 --> 17:06.330
Selamat di dalamnya fungsinya sudah siap.

17:06.350 --> 17:08.930
Jadi sekarang kita siap untuk beralih ke hal-hal yang menarik.

17:08.930 --> 17:16.040
Dan sebenarnya hal yang paling penting untuk AI yang menentukan tindakan mana yang akan dimainkan pada setiap

17:16.080 --> 17:23.240
waktu dan setiap tanty. Dan itulah yang akan kita lakukan di tutorial selanjutnya dengan membuat metode tindakan pilih.

17:23.510 --> 17:27.310
Jadi mari kita lakukan ini di sebelah jerih payah dan sampai saat itu.
