WEBVTT

00:00.240 --> 00:02.790
Halo dan selamat datang di tutorial Python ini.

00:02.790 --> 00:07.230
Baiklah kita memiliki satu fungsi terakhir untuk diimplementasikan di kelas memori ulangan kami.

00:07.230 --> 00:12.060
Itu fungsi sederhana dan itu tentu saja untuk mendapatkan beberapa sampel acak dari ingatan kita.

00:12.210 --> 00:16.080
Dan karena itu fungsi ini akan mengembalikan sampel acak ini.

00:16.080 --> 00:17.850
Baiklah jadi mari kita ke dalamnya.

00:17.870 --> 00:20.630
Kita akan menyebutnya sederhana.

00:20.640 --> 00:21.330
Kita mulai.

00:21.420 --> 00:25.030
Dan fungsi ini membutuhkan dua argumen sebagai input.

00:25.260 --> 00:32.490
Yang pertama seperti biasa objek masa depan kita untuk memutar ulang kelas memori dan argumen kedua adalah dapat Anda

00:32.490 --> 00:33.430
coba tebak.

00:33.510 --> 00:40.290
Kami mengambil beberapa sampel dengan ukuran tetap dan oleh karena itu kami perlu memilih ukuran untuk sampel dan

00:40.290 --> 00:42.610
lebih tepatnya kami menyebutnya ukuran batch.

00:42.820 --> 00:47.910
Jadi itulah nama yang akan kami berikan untuk ukuran batch argumen kedua kami.

00:48.180 --> 00:49.530
Dan kita mulai.

00:49.560 --> 00:54.490
Kami memiliki dua argumen kami dan sekarang kami dapat menerapkan fungsi sederhana.

00:54.500 --> 01:00.780
Jadi sekarang saya hanya ingin memperingatkan Anda ini akan mendapatkan sedikit teknis tetapi saya akan mencoba yang terbaik untuk menjelaskan.

01:01.250 --> 01:05.140
Jadi kita akan mulai dengan membuat variabel sampel.

01:05.150 --> 01:09.620
Ini hanya variabel yang akan berisi sampel memori.

01:09.620 --> 01:11.340
Baiklah begitu sederhana itu sama.

01:11.360 --> 01:14.090
Dan sekarang bagaimana kita akan mendapatkan sampel ini.

01:14.450 --> 01:20.960
Yah pertama-tama kita harus mengambil ingatan kita karena kita mendapatkan sampel dari ingatan kita.

01:20.960 --> 01:26.870
Maka kita mungkin perlu ukuran batch karena sampel akan mendapatkan ukuran batch yang terkandung

01:26.930 --> 01:27.720
Elon.

01:27.830 --> 01:33.920
Jadi kita perlu memori kita perlu ukuran batch dan kemudian kita perlu beberapa trik torche atau bison untuk mendapatkan

01:34.040 --> 01:35.600
format sampel yang baik.

01:35.600 --> 01:40.790
Jadi apa yang akan saya lakukan saya akan menulis baris kode dan kemudian saya akan menjelaskan

01:40.790 --> 01:41.900
elemen demi elemen.

01:41.990 --> 01:42.860
Jadi ayo kita lakukan.

01:42.860 --> 01:48.580
Saya mulai dengan mengambil fungsi zip. Saya akan segera menjelaskan apa fungsinya.

01:48.620 --> 01:51.980
Dan di dalam fungsi ini saya akan menambahkan bintang.

01:52.100 --> 01:53.800
Saya akan memperluas itu juga.

01:53.900 --> 02:02.600
Bintang dan pusat pemikiran acak begitu acak seperti yang Anda duga adalah perpustakaan acak yang kami impor di

02:02.600 --> 02:03.360
sini.

02:03.410 --> 02:08.900
Jadi itulah alasan utama mengapa kami harus mengimpor perpustakaan acak ini karena kami mengambil beberapa

02:08.900 --> 02:09.730
sampel acak.

02:10.040 --> 02:15.570
Jadi dari pustaka acak ini kita akan menggunakan fungsi sederhana.

02:15.600 --> 02:20.060
Jadi ini adalah variabel kami dan ini adalah fungsi jadi saya akan menambahkan beberapa tanda kurung.

02:20.210 --> 02:26.110
Dan sekarang seperti yang Anda lihat sampel adalah fungsi dan kami harus meletakkan beberapa argumen sehingga Anda dapat

02:26.110 --> 02:27.850
melihat argumen pertama itu sendiri.

02:27.850 --> 02:34.660
Dan sebenarnya berbicara tentang diri ini berhubungan dengan memori self-talk, memori objek contoh masa depan kita

02:34.870 --> 02:36.970
dari memori replay kita.

02:37.180 --> 02:44.290
Jadi saya akan menambahkan di sini sendiri memori itu dan kemudian argumen kedua adalah karena Anda mungkin sudah

02:44.530 --> 02:51.360
menebak ukuran Bechuana secara acak dari ingatan kita dan bahwa kita memberinya nama yang ukuran batch.

02:51.550 --> 02:55.690
Jadi argumen kedua akan menjadi Bachche menyebalkan.

02:55.870 --> 02:56.410
Baiklah.

02:56.470 --> 03:01.080
Jadi baris kode diketik dan saya akan menjelaskan apa fungsinya.

03:01.510 --> 03:08.260
Jadi pertama-tama dengan fungsi acak titik sederhana ini kami mengambil beberapa sampel acak dari memori

03:08.800 --> 03:11.820
yang memiliki ukuran tetap sebesar itu.

03:12.550 --> 03:13.940
Jadi itu bisa dimengerti.

03:14.150 --> 03:18.230
Tapi lalu apa fungsi bintang Zipp ini.

03:18.530 --> 03:20.500
Yah tidak ada misteri tentang itu.

03:20.540 --> 03:22.870
Ini seperti fungsi membentuk kembali.

03:22.880 --> 03:28.460
Jadi misalnya saya akan menambahkan sedikit ke sini hanya untuk menjelaskan bahwa saya akan menghapusnya.

03:28.460 --> 03:34.680
Jadi katakanlah misalnya kita memiliki daftar elemen berikut misalnya.

03:34.820 --> 03:37.900
Pertama satu dua tiga.

03:38.180 --> 03:39.680
Dan kemudian elemen kedua.

03:39.680 --> 03:43.180
Empat lima enam.

03:43.190 --> 03:48.020
Jadi kami memiliki daftar dua ganda dari tiga elemen satu dua tiga empat lima enam.

03:48.380 --> 03:52.690
Kalau begitu saya menerapkan fungsi zip dengan bintang di atasnya.

03:52.880 --> 04:02.840
Nah apa yang akan jadi daftar bintang Zip akan sama dengan daftar baru tetapi dari bentuk yang berbeda

04:03.380 --> 04:12.440
dan bentuk yang berbeda akan menjadi satu untuk kemudian dua tiga dan kemudian lima enam.

04:12.460 --> 04:12.770
Baiklah.

04:12.800 --> 04:13.950
Jadi begitulah fungsinya.

04:13.970 --> 04:16.640
Itu hanya membentuk kembali daftar Anda.

04:16.990 --> 04:21.610
OK jadi sekarang Anda mengerti apa yang dilakukan daftar bintang Zipp ini.

04:21.680 --> 04:24.560
Baiklah sekarang mari kita jelaskan mengapa kita harus melakukannya.

04:24.590 --> 04:30.360
Jadi seperti yang Anda pahami, kami akan menambahkan acara ke memori dan acara memiliki formulir.

04:30.440 --> 04:34.530
Pertama, negara, lalu aksi, lalu ganjaran.

04:34.820 --> 04:40.330
Tetapi untuk algoritma kami, kami tidak ingin format ini, kami sebenarnya ingin sampel kami memiliki format berikut.

04:40.330 --> 04:47.540
Format terdiri dari tiga sampel satu sampel untuk negara bagian satu sampel untuk tindakan dan satu sampel

04:47.540 --> 04:48.660
untuk hadiah.

04:48.800 --> 04:53.690
Jadi misalnya katakanlah ini 1-3 adalah negara satu tindakan satu.

04:53.800 --> 05:01.100
Kami ingin satu dan kemudian menyatakan untuk bertindak dua dan kami dengan baik apa yang kami inginkan adalah satu batch untuk masing-masing satu

05:01.100 --> 05:03.630
batch untuk negara satu dan menyatakan dua.

05:03.680 --> 05:10.090
Satu adalah pertandingan untuk aksi satu dalam aksi dua dan sepertiga untuk kami adalah satu dan kami berdua.

05:10.190 --> 05:15.680
Itu hanya format yang akan diharapkan selanjutnya karena kita akan membungkus batch ini

05:15.770 --> 05:22.610
menjadi pie menuju dampak mengerikan yang jauh kita akan ingat adalah variabel yang berisi tensor dan

05:22.610 --> 05:23.280
gradien

05:23.510 --> 05:29.750
Dan itu agar dapat membedakan sehubungan dengan tensor untuk dapat membedakan

05:29.750 --> 05:35.480
sehubungan dengan intensor dalam struktur tensor dan gradien yang mengerikan.

05:35.540 --> 05:37.820
Lagi-lagi itulah cara kerja obor Pi.

05:37.820 --> 05:44.480
Jadi untuk meringkas kita membuat satu batch untuk setiap tindakan negara dan penghargaan dan kemudian kita akan

05:44.480 --> 05:50.600
menempatkan masing-masing vetches secara terpisah menjadi beberapa byte yang Horrible's yang masing-masing akan mendapatkan gradien sehingga

05:50.840 --> 05:54.360
akhirnya kita akan dapat membedakan masing-masing dari mereka.

05:54.620 --> 05:57.430
Baiklah jadi itulah tujuan dari fungsi Zipp.

05:57.480 --> 06:00.350
Jadi izinkan saya hapus saja komentar ini.

06:00.530 --> 06:05.980
Dan sekarang satu-satunya hal yang harus kita lakukan adalah mengembalikan sampel.

06:06.230 --> 06:12.650
Jadi seperti yang saya jelaskan kami tidak dapat mengembalikan sampel secara langsung karena alasan sederhana bahwa kami ingin

06:12.830 --> 06:15.670
menempatkan sampel ke dalam by torche viable.

06:15.680 --> 06:22.580
Jadi untuk melakukan ini untuk masing-masing sampel kita akan menggunakan fungsi peta dan fungsi

06:22.580 --> 06:30.180
peta ini akan melakukan pemetaan dari sampel ke variabel penyiksaan yang akan mengandung tensor dan gradien.

06:30.200 --> 06:33.550
Jadi seperti yang Anda lihat, fungsi peta ini membutuhkan beberapa argumen.

06:33.620 --> 06:38.600
Argumen pertama adalah fungsi dan fungsi ini akan menjadi fungsi yang akan mengkonversi

06:38.600 --> 06:40.590
sampel menjadi beberapa variabel torche.

06:40.760 --> 06:45.340
Dan argumen kedua adalah ke mana kita ingin menerapkan fungsi ini.

06:45.590 --> 06:50.580
Sehingga akan menjadi argumen dari fungsi ini dan karena itu akan menjadi apa.

06:50.600 --> 06:52.780
Itu tentu saja akan menjadi sampel.

06:52.790 --> 06:55.510
Jadi argumen kedua di sini adalah simbol.

06:55.870 --> 06:59.440
Tapi mari kita mendefinisikan fungsi yang ingin kita terapkan.

06:59.480 --> 07:00.620
Masing-masing simbol.

07:01.040 --> 07:06.890
Jadi untuk mendefinisikan suatu fungsi di sini kita harus terlebih dahulu memberi nama pada fungsi yang akan memanggil lambda.

07:07.070 --> 07:14.330
Itu hanya nama dan memberikan Lenda maka X yang akan menjadi variabel dari fungsi ini.

07:14.420 --> 07:18.390
Jadi itu hanya nama dan pemberian untuk variabel dan kemudian.

07:18.500 --> 07:24.140
Dan di sini kita memberikan ekspresi fungsi yang kita inginkan fungsi lambda ini kembali

07:25.400 --> 07:32.010
dan melihat apa yang akan baik itu seharusnya menjadi sesuatu yang akan mengkonversi sampel kita menjadi variabel

07:32.250 --> 07:34.800
obor dan untuk melakukan ini.

07:34.800 --> 07:37.370
Kami sudah menyebutkannya di beberapa tutorial sebelumnya.

07:37.560 --> 07:39.880
Kami memiliki fungsi Voivode untuk mereka.

07:40.110 --> 07:46.680
Suara akan berfungsi, kami akan melakukan konversi dari penari obor ke variabel yang akan mengandung

07:46.690 --> 07:48.590
sensor dan yang terbesar.

07:48.810 --> 07:55.830
Jadi hal pertama yang akan saya tambahkan di sini adalah variabel variabel di dalamnya saya akan mengonversi

07:56.010 --> 08:01.540
X karena X akan menjadi yang sederhana yang akan diterapkan ke sampel.

08:02.420 --> 08:09.080
Tapi kemudian itu semua ada satu hal teknis terakhir yang perlu kita terapkan adalah kenyataan bahwa

08:09.140 --> 08:15.680
untuk setiap batch yang terkandung dalam sampel misalnya batch tindakan 1 8 2 3

08:15.680 --> 08:23.080
dan tindakan lain kita harus menggabungkannya dengan hormat ke mesin waktu pertama yang sesuai dengan Amerika Serikat.

08:23.120 --> 08:25.380
Dan mengapa kita harus membuat rangkaian ini.

08:25.550 --> 08:27.610
Itu hanya agar semuanya selaras.

08:27.710 --> 08:34.740
Itu adalah bahwa di setiap baris untuk menyatakan tindakan dan hadiah sesuai dengan waktu yang sama ..

08:35.180 --> 08:42.240
Sehingga pada akhirnya kami mendapatkan daftar semua batch-disejajarkan dengan baik dan setiap batch adalah pie menuju Voivod.

08:42.470 --> 08:44.700
Jadi bagaimana kita bisa membuat rangkaian ini.

08:44.840 --> 08:48.030
Kita harus menggunakan fungsi kucing dari pustaka obor.

08:48.170 --> 08:55.400
Jadi kita akan menambahkan di sini obor yang kita tambahkan yang diterapkan ke X tetapi kemudian dalam fungsi

08:55.400 --> 09:00.820
ini kita perlu menentukan dimensi sehubungan dengan yang ingin kita buat rangkaian itu.

09:00.860 --> 09:05.460
Dan seperti yang saya sebutkan ini adalah mesin pertama kali yang memiliki era indeks.

09:05.900 --> 09:12.320
Dan di sini kita pergi kita memiliki fungsi kita siap Lunda ini yang berfungsi akan mengambil

09:12.320 --> 09:18.110
sampel menggabungkannya sehubungan dengan mesin waktu pertama dan kemudian akhirnya kita mengkonversi sensor menjadi

09:18.110 --> 09:24.230
beberapa variabel torche yang berisi tensor dan gradien sehingga nanti ketika kita berlaku untuk castigate

09:24.230 --> 09:28.610
dalam arti kita akan dapat membedakan untuk memiliki bobot data.

09:28.610 --> 09:30.170
Baiklah jadi fungsi ini sudah siap.

09:30.410 --> 09:35.270
Dan inilah argumen kedua dari fungsi peta.

09:35.270 --> 09:42.960
Kita perlu menentukan ke apa kita ingin menerapkan fungsi ini dan itu ada di semua sampel kami.

09:43.040 --> 09:43.850
Itu dia.

09:43.850 --> 09:50.750
Kami akan menerapkan fungsi lambda ini pada semua sampel sehingga pada akhirnya kami mendapatkan daftar kecocokan di mana

09:50.990 --> 09:53.840
setiap kecocokan adalah obor PI yang layak.

09:53.840 --> 09:58.810
Baiklah jadi itu cukup teknis tetapi sekarang setidaknya semuanya akan bekerja dengan baik.

09:58.850 --> 10:00.060
Kami ingin menggunakan teknik ini.

10:00.080 --> 10:05.150
Setelah itu kami hanya menggunakannya di sini jadi jika Anda tidak ingin memiliki pemahaman yang mendalam tentang

10:05.150 --> 10:11.060
detail teknis di sini, tidak apa-apa, Anda cukup menyalin tiga baris kode ini untuk menyederhanakan memori Anda jika Anda ingin

10:11.060 --> 10:14.460
membuat kecerdasan buatan dengan menggunakan obor. seperti yang kamu inginkan.

10:14.600 --> 10:21.110
Tapi sekarang kabar baiknya adalah kita sudah selesai dengan pengalaman kelas memori replay replay sekarang diimplementasikan dan kita

10:21.470 --> 10:26.780
bisa beralih ke kelas berikutnya dan terakhir yang akan menjadi mode keamanan keseluruhan.

10:26.960 --> 10:34.520
Jadi dalam model ini kita tentu saja memiliki jaringan kami yang akan mengalami replay dan kemudian

10:34.640 --> 10:36.600
semua algoritma keamanan lainnya.

10:36.620 --> 10:39.150
Jadi ini akan menjadi kelas yang jauh lebih besar.

10:39.200 --> 10:44.240
Kami akan membuat sekitar 10 fungsi tapi itu hanya karena kami melakukan langkah demi langkah sehingga Anda

10:44.240 --> 10:46.130
dapat lebih memahami apa yang terjadi.

10:46.520 --> 10:49.260
Jadi saya tidak sabar untuk menerapkan model keamanan kami.

10:49.280 --> 10:50.900
Dan sampai saat itu aku.
