WEBVTT

00:00.510 --> 00:02.990
Halo dan selamat datang di tutorial Python ini.

00:03.240 --> 00:08.400
Baiklah sekarang kita akan membuat fungsi maju yang akan menyebarkan sinyal output otak kita

00:08.400 --> 00:13.550
ke tubuh AI sehingga akan memainkan tindakan yang tepat untuk mencapai rompi.

00:13.770 --> 00:20.100
Tetapi belum ada reaksi karena belum ada pelatihan bahwa kami belum melatih AI, tetapi inilah tepatnya yang

00:20.100 --> 00:25.920
akan kami lakukan sebagian untuk diterapkan dalam curin convolutional yang mendalam yang dengan cara saya akan

00:25.920 --> 00:29.720
mengubah nama melatih AI dengan Kill convolutional yang mendalam.

00:29.940 --> 00:35.340
Tetapi sekarang kita perlu meneruskan sinyal dari lapisan keluaran otak ke tubuh.

00:35.370 --> 00:40.170
Dan itulah tepatnya yang akan kita lakukan dengan fungsi maju ini yang merupakan fungsi terakhir tubuh

00:40.170 --> 00:40.670
kita.

00:41.420 --> 00:42.860
Jadi mari kita lakukan ini.

00:42.860 --> 00:50.140
Kami mulai dengan Teff maju dan menurut Anda apa argumen yang akan diambil

00:50.330 --> 00:55.030
Yah itu akan mengambil kekuatan diri pertama dan kemudian apakah ada yang lain.

00:55.220 --> 00:56.740
Ya ada.

00:56.870 --> 00:58.140
Dan apa yang akan terjadi.

00:58.310 --> 01:04.700
Yah sangat alami kami ingin meneruskan sinyal output dari otak ke tubuh dan oleh karena itu input

01:04.700 --> 01:07.470
akan menjadi sinyal output dari otak.

01:07.850 --> 01:10.480
Jadi sekarang kita perlu memberi nama pada sinyal-sinyal luar ini.

01:10.610 --> 01:14.390
Jadi saya akan menambahkan di sini argumen put out.

01:14.460 --> 01:21.200
Baiklah sehingga sesuai dengan sinyal output otak setelah gambar input disebarkan melalui semua otak untuk

01:21.200 --> 01:26.540
mencapai output nanti yang X di sini kembali oleh fungsi maju

01:26.540 --> 01:27.170
otak.

01:27.380 --> 01:32.480
Dan sekarang sinyal output otak ini akan diteruskan ke tubuh dengan fungsi maju

01:32.480 --> 01:35.410
baru yang kita buat di kelas berikutnya.

01:35.460 --> 01:41.760
Jadi mari kita lakukan ini, mari kita tambahkan beberapa warna di sini dan sekarang setelah Anda memahaminya kita akan menggunakan metode

01:41.870 --> 01:43.940
berikutnya yang soughed untuk memainkan aksinya.

01:43.940 --> 01:49.820
Itu berarti bahwa tubuh AI kita setelah menerima sinyal output dari otak akan memainkan tindakan

01:49.820 --> 01:51.440
dengan teknik selanjutnya.

01:51.440 --> 01:56.510
Jadi pada dasarnya sekarang apa yang harus kita lakukan adalah persis sama dengan apa yang kita lakukan untuk mobil.

01:56.600 --> 01:59.390
Kami akan mendapatkan distribusi probabilitas kami.

01:59.540 --> 02:05.960
Itu langkah pertama dan kemudian kita akan mengambil sampel tindakan sesuai dengan distribusi probabilitas ini.

02:05.960 --> 02:11.510
Jadi pada dasarnya apa yang bisa kita lakukan sekarang adalah mendapatkan file mobil self-driving kami dan salin tempel apa

02:11.510 --> 02:14.570
yang kami terapkan untuk fungsi pilih sebenarnya di mobil self-driving.

02:14.810 --> 02:15.700
Tapi mari kita lakukan lagi.

02:15.710 --> 02:19.710
Ini akan menjadi latihan yang bagus dan sebenarnya Anda bisa mencoba mengetiknya sebelum saya.

02:20.150 --> 02:23.870
OK jadi pertama-tama apa yang akan kita lakukan adalah mendapatkan probabilitas kita.

02:23.870 --> 02:29.930
Jadi saya ingatkan ini adalah distribusi probabilitas untuk masing-masing nilai q yang bergantung pada gambar

02:29.960 --> 02:31.790
input dan setiap tindakan.

02:31.790 --> 02:38.120
Jadi kami memiliki satu nilai kunci untuk masing-masing dari enam atau tujuh tindakan yang mungkin dan oleh karena itu

02:38.120 --> 02:43.600
kami mendapatkan distribusi tujuh probabilitas dan kemudian 7 karena saya pikir ada tujuh tindakan, bukan enam.

02:43.670 --> 02:50.010
Karena selain bergerak untuk kiri kanan atau memotret, kami juga dapat menjalankan yang membuat tujuh tindakan yang

02:50.420 --> 02:57.260
mungkin dan oleh karena itu kami mendapatkan distribusi tujuh probabilitas satu untuk setiap nilai q yang terkait dengan setiap tindakan.

02:57.260 --> 02:58.930
Jadi Propst sama dengan.

02:59.040 --> 03:00.670
Dan sekarang ingat apa yang harus kita lakukan.

03:00.860 --> 03:06.650
Yah pada dasarnya kita harus menggunakan fungsi max soughed dari modul fungsional.

03:06.680 --> 03:13.010
Itu sangat sederhana, kami mengambil modul fungsional kami terlebih dahulu kemudian melakukan itu dan kemudian kami mengambil fungsi

03:13.130 --> 03:13.700
berikutnya.

03:13.700 --> 03:14.480
Ini dia.

03:14.570 --> 03:22.430
Kami menekan enter dan sekarang kami menempatkan argumen fungsi berikutnya yang saya ingatkan adalah elemen yang

03:22.430 --> 03:25.290
ingin Anda buat distribusi probabilitas.

03:25.550 --> 03:30.560
Dan itu tentu saja nilai q yang merupakan output dari jaringan saraf.

03:30.680 --> 03:35.830
Itulah output dari jaringan saraf yang Anda inginkan untuk membuat distribusi probabilitas.

03:35.990 --> 03:41.270
Sekarang ingatkan kami bahwa kami ingin membuat distribusi probabilitas ini untuk dapat mengeksplorasi berbagai

03:41.270 --> 03:45.760
tindakan alih-alih memilih secara langsung tindakan yang memiliki nilai Q maksimum.

03:46.010 --> 03:51.020
Jika kita langsung memilih yang memiliki nilai Q maksimum di mana kita tidak banyak mengeksplorasi tindakan lain dan

03:51.350 --> 03:52.650
kita mungkin kehilangan sesuatu.

03:52.880 --> 03:58.760
Tetapi dengan metode berikutnya yang telah kita lakukan ini, kita dapat melakukan lebih banyak eksplorasi dan karena itu mungkin menemukan beberapa

03:58.760 --> 04:01.520
solusi tersembunyi dalam pola yang mungkin jauh lebih baik.

04:01.850 --> 04:08.060
Jadi sekali lagi saya sangat merekomendasikan hal-hal Nax dan kemudian mulai sekarang apa yang harus kita lakukan adalah memasukkan nilai-nilai yang

04:08.060 --> 04:09.560
merupakan keluaran kita di sini.

04:09.560 --> 04:13.860
Keluaran otak kita jadi keluaran yang kita tuju.

04:13.970 --> 04:21.710
Tetapi kemudian kita memiliki parameter suhu ini yang dapat kita gunakan yang dapat kita konfigurasi untuk menyesuaikan eksplorasi.

04:21.710 --> 04:28.130
Ingatlah bahwa semakin tinggi kita mengatur suhu, semakin sedikit eksplorasi tindakan lain akan dilakukan karena tindakan

04:28.130 --> 04:33.260
terbaik akan dipilih dengan probabilitas lebih tinggi dibandingkan dengan tindakan lain yang

04:33.260 --> 04:35.910
akan dipilih dengan probabilitas lebih rendah.

04:35.930 --> 04:42.620
Itu persis seperti dengan di dalam mobil dan oleh karena itu kita harus melipatgandakan output di

04:43.010 --> 04:51.800
sini dengan parameter suhu kita sehingga kita menjadi sempurna sekarang kita mendapatkan sedikit peringatan karena kita belum menggunakan preps tetapi kita

04:51.810 --> 04:53.220
akan menggunakannya sekarang.

04:53.260 --> 04:55.540
Dan itu membawa kita ke hal berikutnya yang harus kita lakukan.

04:55.540 --> 04:57.750
Bagaimana kita akan menggunakan probabilitas ini.

04:57.910 --> 05:04.390
Kita akan mengambil sampel aksi terakhir untuk dimainkan dari distribusi probabilitas ini dan oleh karena itu

05:04.990 --> 05:10.960
yang harus kita lakukan sekarang adalah menggunakan fungsi multinomial untuk mengambil sampel aksi berdasarkan distribusi

05:10.960 --> 05:12.080
probabilitas ini.

05:12.370 --> 05:15.030
Jadi sekarang kita siap untuk mengambil tindakan kita.

05:15.190 --> 05:20.500
Jadi saya membuat Voivode baru di sini karena itu akan menjadi tindakan yang akan dimainkan oleh tubuh

05:20.500 --> 05:21.490
AI kami.

05:21.520 --> 05:31.480
Dan sekarang kita mengambil distribusi probabilitas probabilitas yang kita tambahkan titik dan metode multi normal.

05:32.220 --> 05:38.030
Baiklah dan sekarang kita mendapatkan aksi terakhir kita untuk bermain di sana yang dikumpulkan dari distribusi alat peraga kita.

05:38.430 --> 05:39.570
Oke, sempurna.

05:39.570 --> 05:42.300
Jadi sekarang kami siap untuk mengembalikan apa yang kami inginkan.

05:42.360 --> 05:44.450
Itu adalah aksi untuk dimainkan.

05:44.670 --> 05:48.720
Dan ini tentu saja tindakan dan sekarang peringatan itu harus hilang.

05:48.840 --> 05:50.440
Kami menggunakan semua yang kami inginkan.

05:50.460 --> 05:51.270
Itu dia.

05:51.270 --> 05:52.020
Sempurna.

05:52.210 --> 05:53.950
Jadi sekarang fungsi maju sudah siap.

05:54.080 --> 05:55.740
Dan selamat.

05:55.800 --> 05:57.300
Tubuh juga siap.

05:57.540 --> 05:59.070
Jadi sekarang kita punya otak kita.

05:59.190 --> 06:05.760
Kami memiliki tubuh kami dan oleh karena itu kami siap untuk mengumpulkan mereka untuk membuat masa depan AI kami masa depan

06:05.760 --> 06:08.900
saya akan terdiri dari tidak lain dari otak dan tubuh.

06:08.970 --> 06:14.160
Dan itulah yang memiliki kecerdasan dan tubuh untuk memainkan tindakan yang akan menjadi tindakan

06:14.160 --> 06:16.610
yang tepat untuk bermain berkat kecerdasannya.

06:16.620 --> 06:22.060
Tapi ingat sebelum kita harus melatih kecerdasannya dan itulah yang akan kita lakukan sebagian

06:22.070 --> 06:25.180
untuk melatih mata dengan pembelajaran keren yang konvolusional.

06:25.200 --> 06:25.500
Baiklah.

06:25.500 --> 06:28.470
Jadi mari kita buat AI di jerat berikutnya.

06:28.490 --> 06:31.810
Ini lagi akan menjadi kelas dua fungsi yang saya pikir.

06:31.950 --> 06:34.510
Dan yang ini membutuhkan dua atau tiga tutorial.

06:34.680 --> 06:35.660
Jadi saya tidak sabar.

06:35.670 --> 06:36.780
Ini akan menyenangkan.

06:36.780 --> 06:37.930
Dan sampai saat itu aku.