WEBVTT

00:00.630 --> 00:04.800
สวัสดีและยินดีต้อนรับกลับสู่หลักสูตรการเรียนรู้อย่างลึกล้ำวันนี้เรากำลังพูดถึง Max pooling

00:04.800 --> 00:07.380
และเรามีสไลด์ที่น่าตื่นเต้นมากขึ้นมา

00:07.500 --> 00:10.930
และแม้แต่ความประหลาดใจเป็นพิเศษในตอนท้ายของบทช่วยสอน

00:11.010 --> 00:12.440
ดังนั้นเรามาเริ่มกันเลย

00:12.450 --> 00:15.860
คำถามแรกคืออะไรที่รวมกำไรกันแล้วทำไมเราถึงต้องการมัน

00:16.050 --> 00:19.650
ทีนี้เพื่อตอบคำถามนั้นเรามาดูภาพเหล่านี้ในภาพเหล่านี้

00:19.650 --> 00:20.780
เรามีเสือชีตาห์

00:20.790 --> 00:23.680
ในความเป็นจริงมันเป็นเสือชีต้าที่แน่นอนเหมือนกันในภาพแรก

00:23.680 --> 00:29.640
ภาพนั้นอยู่ในตำแหน่งที่เหมาะสมและเธอมองตรงไปที่คุณในภาพที่สอง

00:29.640 --> 00:30.660
มันหมุนไปเล็กน้อย

00:30.660 --> 00:32.710
และภาพที่สามบีบอัดเล็กน้อย

00:32.790 --> 00:41.450
และสิ่งที่อยู่ตรงนี้คือเราต้องการให้เครือข่ายประสาทเทียมสามารถรับรู้เสือชีตาห์ในทุก ๆ ภาพ

00:41.460 --> 00:43.230
ในความเป็นจริงนี่เป็นเพียงเสือชีตาห์ตัวเดียว

00:43.230 --> 00:45.070
เกิดอะไรขึ้นถ้าเรามีนักกีฬาที่แตกต่างกันมากมาย

00:45.090 --> 00:46.120
นี่คือเสือชีต้า

00:46.180 --> 00:47.250
เขาเป็นเสือชีตาห์

00:47.400 --> 00:53.130
นี่คือเสือชีตาห์อีกตัวของเขา

00:53.130 --> 01:01.110
Ashira Ishida

01:01.110 --> 01:10.700
cheetah ของเขาและเขาเป็นเสือชีตาห์และเราต้องการให้เครือข่ายประสาทรับรู้ทั้งหมดของนักแม่นปืนเหล่านี้เป็นคนขี้โกงและจะทำเช่นนั้นได้อย่างไร ภาพที่พวกเขาเหมือนใบหน้าของพวกเขาอยู่ในตำแหน่งที่แตกต่างกันของภาพที่มีคนอยู่ทางขวามือบางคนที่มุมซ้ายหรือคนที่อยู่ตรงกลาง

01:11.010 --> 01:14.280
พวกมันต่างกันเล็กน้อยและพื้นผิวก็แตกต่างกันเล็กน้อย

01:14.280 --> 01:16.200
แสงแตกต่างกันเล็กน้อย

01:16.200 --> 01:29.700
มีความแตกต่างเล็ก ๆ น้อย ๆ

01:29.700 --> 01:40.890
มากมายดังนั้นหากเครือข่ายประสาทเทียมมองหาคุณสมบัติบางอย่างเช่นคุณสมบัติที่โดดเด่นของเสือชีตาห์คือน้ำตาที่อยู่บนใบหน้าที่เกิดจากดวงตาหรือเงาเงาที่ดูเหมือนน้ำตา รูปแบบที่เกิดขึ้นจากดวงตาของมันลงมานั้นอยู่ที่ด้านข้างของจมูกและดูเหมือนน้ำตาที่เป็นลักษณะเฉพาะของเสือชีต้า

01:40.890 --> 01:53.370
แต่ถ้ามันกำลังมองหาคุณสมบัติที่มันเรียนรู้จากเสือชีตาห์บางตัวในตำแหน่งที่แน่นอนหรือรูปร่างหรือรูปร่างหรือพื้นผิวที่แน่นอน

01:53.460 --> 02:01.410
ดังนั้นเราต้องตรวจสอบให้แน่ใจว่าเครือข่ายประสาทของเรามีคุณสมบัติที่เรียกว่า spatial

02:01.440 --> 02:10.170
invariance ซึ่งหมายความว่ามันไม่สนใจว่าคุณสมบัติจะไม่ได้อีกครั้งเท่าที่คันซึ่งเป็นส่วนหนึ่งของภาพเพราะเราเราถ่าย

02:10.520 --> 02:23.400
เมื่อพิจารณาถึงแผนที่ของเราเราก็ไม่ดีกับ convolutional ของเราที่นั่น แต่มันไม่จำเป็นต้องสนใจว่าฟีเจอร์นั้นจะเอียงบ้างไหมถ้าฟีเจอร์นั้นมีความแตกต่างในพื้นผิวเล็กน้อยหากฟีเจอร์นั้นอยู่ใกล้กับฟีเจอร์มากขึ้น

02:23.400 --> 02:30.210
สัมพันธ์กับญาติ

02:30.210 --> 02:39.930
ดังนั้นหากคุณสมบัตินั้นผิดเพี้ยนไปเล็กน้อยเครือข่ายประสาทของเราจะต้องมีความยืดหยุ่นในระดับหนึ่งเพื่อให้สามารถค้นหาคุณลักษณะนั้นได้

02:40.050 --> 02:42.690
และนั่นคือสิ่งที่รวมทุกอย่างเกี่ยวกับ

02:42.690 --> 02:45.140
ดังนั้นเรามาดูวิธีการรวมกำไรกัน

02:45.180 --> 02:51.090
นี่คือแผนที่คุณลักษณะของเราเพื่อให้เราได้ทำการ convolutions ของเราแล้วและเราได้ทำส่วนนั้นเสร็จแล้วและตอนนี้เรากำลังทำงานร่วมกับ convolutional

02:51.090 --> 02:52.680
ที่นั่น

02:52.680 --> 02:53.880
ตอนนี้เรากำลังจะใช้การรวมกำไรกัน

02:53.880 --> 02:54.690
มันทำงานอย่างไร

02:54.690 --> 02:56.420
เรากำลังจะนำแอปกลับมารวมกัน

02:56.670 --> 03:03.440
มีหลายประเภทการเล่นที่สอดคล้องกันหมายถึงการรวมกำไรสูงสุดรวมกำไรบางส่วนและจะแสดงความคิดเห็นในส่วนท้ายของเรื่อง

03:03.540 --> 03:11.040
แต่สำหรับตอนนี้เราเพิ่งใช้

03:11.040 --> 03:26.310
Max ร่วมกันดังนั้นเราจึงใช้กล่องขนาดสองคูณสองพิกเซลเช่นนั้นและไม่ต้องเป็นสองต่อสองคุณสามารถเลือกกล่องขนาดใดก็ได้ Tauriel และคุณวางไว้ที่มุมบนซ้ายมือแล้วคุณจะพบค่าสูงสุดในกล่องนั้นจากนั้นคุณบันทึกเฉพาะค่านั้นและคุณไม่สนใจอีกสามค่า

03:26.310 --> 03:31.830
ดังนั้นในกล่องของคุณคุณมีค่าสี่ค่าคุณไม่สนใจค่าสามค่าคุณเก็บค่าสูงสุดไว้ซึ่งเป็นค่าหนึ่งในกรณีนี้

03:31.830 --> 03:36.210
จากนั้นคุณย้ายกล่องของคุณไปทางด้านขวาโดยย่างเท้าคุณเลือกกางเกงอีกครั้ง

03:36.210 --> 03:42.880
ดังนั้นที่นี่เราเลื่อนไปก้าวเท้าของสองและนั่นคือสิ่งที่คุณ psyched ปกติคุณสามารถพูดเหมือนก้าวของคุณสามารถเลือก

03:42.990 --> 03:52.440
ดังนั้นจึงมีกล่องซ้อนกันคุณสามารถเลือกการนัดหยุดงานชนิดใดก็ได้ที่คุณต้องการแม้กระทั่งสามกล่องหากคุณต้องการ แต่เรากำลังเลือกก้าวเดินสองช่องที่นี่และนั่นคือสิ่งที่ใช้กันทั่วไป

03:52.470 --> 04:00.080
และจากนั้นคุณทำซ้ำตามขั้นตอนที่คุณบันทึกไว้สูงสุดที่นี่ถ้าคุณข้ามไปและไม่สำคัญว่าคุณจะทำสิ่งที่คุณทำต่อไป

04:00.090 --> 04:05.690
ดังนั้นคุณยังคงบันทึกค่าสูงสุดไว้ที่นี่ 0 ตรงนี้ค่าสูงสุดคือสี่

04:05.700 --> 04:11.380
นี่คือค่าสูงสุดถึงที่นี่ค่าสูงสุดคือ 1 0 1 หรือ 2 และ 1

04:11.400 --> 04:13.970
ดังนั้นคุณจะเห็นสิ่งต่าง ๆ เกิดขึ้น

04:13.980 --> 04:18.890
ก่อนอื่นเรายังคงสามารถรักษาคุณสมบัติไว้ได้

04:19.080 --> 04:23.730
จำนวนสูงสุดที่เป็นตัวแทนเพราะเรารู้ว่าข้อสรุปของ Lehre ทำงานอย่างไร

04:23.730 --> 04:31.480
เรารู้ว่าจำนวนสูงสุดหรือจำนวนมากในแผนที่คุณลักษณะของคุณจะแสดงถึงสถานที่ที่คุณพบความคล้ายคลึงกันใกล้เคียงที่สุดกับสถานที่จริง

04:31.650 --> 04:38.250
แต่ด้วยการรวมคุณสมบัติเหล่านี้เราเป็นคนแรกที่กำจัด

04:38.250 --> 04:49.410
75 เปอร์เซ็นต์ของข้อมูลที่ไม่ใช่คุณสมบัติที่ไม่ใช่สิ่งสำคัญที่เรามองหาเพราะเราแค่สามพิกเซลจากสี่ .

04:49.710 --> 04:51.510
ดังนั้นเราจะได้รับ 25 เปอร์เซ็นต์เท่านั้น

04:51.510 --> 05:04.160
แล้วก็เพราะเราใช้พิกเซลสูงสุดที่เราหรือค่าที่เรามีดังนั้นเราจึงพิจารณาความเพี้ยน

05:04.160 --> 05:16.550
ดังนั้นตัวอย่างเช่นสองภาพที่ยกตัวอย่างเช่นน้ำตาของสิบแปดมงกุฎที่อยู่ในดวงตาในภาพหนึ่งมีบิตไปทางซ้ายหรือหมุนไปทางซ้ายเล็กน้อยและอีกอันหนึ่งมีบิต

05:16.580 --> 05:23.800
และเป็นวิธีที่พวกเขาควรจะเป็นหรือวิธีที่เราชอบถ้าคุณใช้หนึ่งเป็นฐานและอีกคนมีบิตหมุนไปทางซ้าย

05:24.060 --> 05:26.570
คุณสมบัติ puled จะเหมือนกันทุกประการ

05:26.570 --> 05:36.050
ดังนั้นคุณสามารถดูได้ที่นี่ถ้าเรากำลังพูดถึงน้ำตาของสิบแปดมงกุฎแล้วสมมติว่านี่คือสี่และนี่คือที่ที่มันอยู่ที่นี่แล้วถ้ามันหมุนเล็กน้อย

05:36.050 --> 05:38.270
ตัวอย่างเช่นสี่จบลงที่นี่

05:38.390 --> 05:46.270
จากนั้นเมื่อเราทำการรวมกำไรเราจะยังคงได้รับแผนที่คุณลักษณะของพูลเดียวกันและนั่นคือหลักการที่อยู่เบื้องหลัง

05:46.430 --> 05:52.340
มันเป็นคำอธิบายคร่าวๆอีกครั้ง

05:52.340 --> 06:02.330
แต่ก็เป็นจุดรวมที่เรายังคงสามารถรักษาคุณสมบัติและบัญชีสำหรับความเป็นไปได้เชิงพื้นที่หรือเนื้อสัมผัสหรือการบิดเบือนอื่น ๆ

06:02.420 --> 06:07.370
และนอกเหนือจากทั้งหมดที่เรากำลังลดขนาดเพื่อให้มีประโยชน์อื่น

06:07.370 --> 06:13.520
ดังนั้นเราจึงได้เรากำลังรักษาคุณสมบัติที่เราแนะนำค่าคงที่เชิงพื้นที่เราลดขนาดลง

06:13.520 --> 06:19.700
75% ซึ่งใหญ่มากซึ่งจะช่วยเราในการประมวลผล

06:19.870 --> 06:25.970
และยิ่งไปกว่านั้นประโยชน์อีกประการของการรวมกำไรคือเรากำลังลดจำนวนพารามิเตอร์ดังนั้นเราจึงลดอีกครั้งโดย 75

06:26.690 --> 06:35.270
เปอร์เซ็นต์หรือลดจำนวนพารามิเตอร์ที่จะเข้าสู่ Lares สุดท้ายของเครือข่ายประสาทดังนั้นเราจึงป้องกันไม่ให้เกิดการล้น

06:35.300 --> 06:42.580
มันเป็นประโยชน์ที่สำคัญมากของการรวมกำไรที่เรากำลังลบข้อมูลและนั่นเป็นสิ่งที่ดี

06:42.590 --> 06:50.660
นั่นเป็นสิ่งที่ดีเพราะวิธีการที่แบบจำลองของเราไม่สามารถพอดีกับข้อมูลนั้นได้เพราะโดยเฉพาะอย่างยิ่งเพราะข้อมูลนั้นไม่ดีและจำได้ว่าตอนเริ่มต้นเรากำลังพูดถึงแม้สำหรับมนุษย์ในฐานะมนุษย์เป็นสิ่งสำคัญที่จะต้องดู

06:50.690 --> 07:02.520
คุณสมบัติตรงข้ามกับเสียงรบกวนอื่น ๆ ที่เข้ามาในดวงตาของเรา

07:02.780 --> 07:12.470
สิ่งเดียวกันสำหรับเครือข่ายประสาทเทียมพวกเขาโดยไม่สนใจการก่อตัวที่ไม่สำคัญที่ไม่จำเป็นซึ่งเรากำลังช่วยป้องกันไม่ให้เกิดการล้น

07:12.500 --> 07:14.590
ดังนั้นเราไปที่นั่นคือสิ่งที่รวมกำไรกัน

07:14.600 --> 07:21.500
และคำถามที่นี่คือแน่นอนว่าเหตุใด WiMax

07:21.710 --> 07:26.780
จึงรวมกันได้หลายประเภทและมีขนาดกว้างที่กว้างเกินไปที่มีขนาดสองคูณสองพิกเซลจำนวนมากของสิ่งเหล่านี้

07:26.780 --> 07:33.980
และในบันทึกนั้นฉันอยากจะแนะนำคุณกับรายงานการวิจัยที่น่ารักนี้ที่เรียกว่าการประเมินผลการดำเนินการรวมกันในสถาปัตยกรรม convolutional เพื่อการจดจำวัตถุโดย Dominic Scherrer

07:33.980 --> 07:41.100
จาก University of Bonn

07:41.180 --> 07:47.540
มีลิงค์และความงามเกี่ยวกับบทความนี้คือมันง่ายมาก ๆ

07:47.550 --> 07:51.530
ตรงไปตรงมาดังนั้นหากคุณไม่เคยอ่านบทความวิจัยมาก่อนสิ่งที่คุณต้องการให้มันเป็นไป

07:51.530 --> 07:54.440
นี่คือสถานที่ที่ดีในการเริ่มต้นมันสั้นมาก

07:54.440 --> 07:55.400
เพียง 10 หน้า

07:55.400 --> 07:56.810
อ่านง่ายมาก

07:57.080 --> 08:07.040
และบวกกับสิทธิประโยชน์พิเศษคือตอนนี้เราได้พูดถึงการบิดและการรวมคุณจะรู้สึกสบายใจกับทุกสิ่งที่พวกเขากำลังพูดถึงในบทความนี้ในคุณ

08:07.100 --> 08:11.880
นี่เป็นวิธีที่ยอดเยี่ยมในการเสริมกำลังจริงและฉันขอแนะนำให้ตรวจสอบบทความนี้

08:11.930 --> 08:18.050
ฉันจะใช้เวลาอ่านประมาณ 20 นาทีและคุณสามารถข้ามส่วนที่ 2

08:18.050 --> 08:19.880
ซึ่งเรียกว่างานที่เกี่ยวข้องได้

08:19.880 --> 08:21.230
แค่อย่าอ่านส่วนนั้น

08:21.290 --> 08:23.950
ตรงไปจากตอนที่ 1 ถึงตอนที่ 3

08:24.020 --> 08:29.600
และสิ่งหนึ่งที่คุณจำเป็นต้องรู้เกี่ยวกับกระดาษนี้พวกเขาพูดถึงแนวคิดที่เรียกว่า subsampling ซึ่งเป็นการ subsampling

08:30.360 --> 08:33.230
นั้นโดยทั่วไปแล้วรวม

08:33.230 --> 08:36.260
ดังนั้นโปรดจำไว้ว่าเรามาที่นี่อย่างไร

08:36.280 --> 08:37.400
เรากำลังทำอย่างสูงสุด

08:37.400 --> 08:43.250
ดังนั้นใน Squarer ของเราที่ใช้ค่าสูงสุดจึงมีแนวคิดที่เรียกว่า Mean pooling

08:43.250 --> 08:48.590
หรือมีการดึงบางอย่างในขณะที่คุณมีค่าเหล่านี้สูงกว่าค่า pooling เฉลี่ยหรือ Meaning

08:48.650 --> 08:53.890
pooling คุณเอาค่าเฉลี่ยออกจากค่าเหล่านี้ ของผู้ชายรวมกำไร

08:53.900 --> 09:00.840
มันเป็นวิธีการทั่วไปที่ใช้ในการหาค่าเฉลี่ยของค่าเหล่านี้

09:00.860 --> 09:06.620
และคุณสามารถอ่านเพิ่มเติมในกระดาษได้ แต่อย่างอื่นลองคิดว่ามันเป็นการรวมกำไรโดยเฉลี่ยเมื่อคุณอ่านกระดาษ

09:06.920 --> 09:12.310
และนั่นคือที่ที่คุณสามารถรับข้อมูลเพิ่มเติมเกี่ยวกับหัวข้อนี้และตอนนี้เรามาสรุปกันว่าเราไปที่ไหน

09:12.320 --> 09:14.440
ดังนั้นจึงมีภาพอินพุตของเรา

09:14.870 --> 09:18.960
จากนั้นเราใช้การดำเนินการสังสรร

09:19.070 --> 09:24.230
และตอนนี้ไปยังแผนที่คุณลักษณะแต่ละรายการที่เราได้รับเราได้ใช้ Pullinger

09:24.260 --> 09:32.160
ดังนั้นเราจึงได้ทำวิวัฒนาการสองขั้นตอนและรวมกำไรกันแล้วตอนนี้เรากำลังจะทำสิ่งที่สนุกมากสิ่งที่น่าตื่นเต้น

09:32.220 --> 09:40.340
เรากำลังจะทดลองกับสิ่งนี้ดังนั้นนี่เป็นภาพหน้าจอที่ฉันถ่ายจากเครื่องมือที่สร้างโดย Adam Harley ตั้งแต่ตอนที่เขาอยู่ที่วิทยาการคอมพิวเตอร์ของมหาวิทยาลัย

09:40.340 --> 09:49.750
Ryerson และตอนนี้เขาอยู่ที่ Carnegie Mellon ฉันคิดว่ากำลังทำหน้าของเขาอยู่

09:50.060 --> 09:53.150
และเครื่องมือที่ยอดเยี่ยมเพื่อให้เปิดขึ้นมาดูกัน

09:53.270 --> 09:55.780
ดังนั้นคุณสามารถค้นหาได้คุณสามารถค้นหาได้จริงผ่าน Google

09:55.780 --> 09:57.500
คุณต้องรู้บทบาทของคุณ

09:57.500 --> 10:03.790
มันเป็นเรื่องยากที่จะค้นหาผ่าน Google เพราะไม่มีข้อความใด ๆ เหมือนที่เราเป็นในปีนี้

10:03.930 --> 10:08.350
ฉันจะเริ่มดูเอกสารของ Reierson และสิ่งนี้

10:08.510 --> 10:21.330
และโดยทั่วไปนี่คือสิ่งที่เรากำลังทำอยู่ แต่เห็นภาพดังนั้นที่นี่คุณต้องวาดตัวเลขเพื่อบอกว่าฉันวาดเลขสี่แล้วเครื่องมือนี้จะใส่หมายเลขสี่ตรงนี้

10:21.340 --> 10:22.960
นั่นคือภาพของคุณ

10:22.960 --> 10:26.620
ในขั้นตอนแรกของเรานี่คือขั้นตอนการโน้มน้าวใจ

10:26.800 --> 10:27.100
ขวา.

10:27.100 --> 10:30.390
และนี่คือขั้นตอนการรวมกำไรและการรวมกำไรโดยวิธีนี้เรียกว่าการสุ่มตัวอย่าง

10:30.390 --> 10:33.770
ดังนั้นการดึงและการสุ่มตัวอย่างจึงเป็นสิ่งเดียวกัน

10:33.930 --> 10:39.190
ดังนั้นคุณจะเห็นได้ว่ามันใช้วิธีการโน้มน้าวจากนั้นนำมาใช้ร่วมกันและคุณสามารถดูว่ามันทำงานอย่างไร

10:39.190 --> 10:45.020
คุณสามารถดูประเภทของความเชื่อมั่นที่ได้นำไปใช้หรือตัวกรองประเภทใดที่นำไปใช้ในลักษณะที่ปรากฏ

10:45.130 --> 10:47.630
คุณสมบัติอะไรที่กำลังมองหา

10:47.830 --> 10:53.340
แล้วก็ใช้การรวมกำไรกันเพื่อลดขนาดและคุณจะเห็นได้ว่านี่เป็นสิ่งสำคัญ

10:53.380 --> 11:01.090
ดังนั้นคุณจะเห็นได้ว่านี่คือภาพที่ได้รับความเชื่อถือและนี่คือภาพที่เป็น puled และคุณยังสามารถเห็นคุณสมบัติเดียวกันเป็นเพียงข้อมูลน้อยลง

11:01.090 --> 11:05.830
แต่คุณสมบัติเดียวกันที่ถูกต้องยังคงอยู่

11:05.830 --> 11:08.110
นั่นเป็นส่วนสำคัญ

11:08.350 --> 11:16.960
และยิ่งไปกว่านั้นถ้าคุณรู้ว่าทั้งสี่นั้นเหมือนหมุนไปทางด้านข้างเล็กน้อยมันก็ยังคงสามารถรับ Lares ที่คล้ายกันได้

11:17.050 --> 11:19.810
หลังจากนั้นก็มีตัวอักษรมากขึ้นเรายังไม่ได้พูดถึง

11:19.810 --> 11:26.840
ดังนั้นเขาจึงมีถ้ำอีกแห่งหนึ่งที่นี่ซึ่งเราจะไม่มี

11:27.130 --> 11:30.730
แล้วเขาก็มีถ้ำที่น่าสงสารอีกแห่ง แต่โดยทั่วไปเขาก็แค่ทำซ้ำกระบวนการเดียวกัน

11:31.000 --> 11:34.880
แล้วหลังจากนั้นนี่คือสิ่งที่เรากำลังจะพูดคุยกันต่อไปในหลักสูตร

11:34.910 --> 11:37.610
เขามี Lares ที่เชื่อมต่ออย่างสมบูรณ์และอื่น ๆ

11:38.080 --> 11:39.880
แต่คุณสามารถเล่นกับสิ่งนั้นได้อย่างแน่นอน

11:39.880 --> 11:49.410
ดังนั้นถ้าฉันลบที่คุณชอบถ้าฉันวาด 7 คุณจะเห็นว่าจริง ๆ แล้วบอกคุณว่าการเดาคือการเดาคือนี่คือ 7

11:49.570 --> 11:52.850
และครั้งที่สองคาดเดาโอกาสที่สองคือสาม

11:53.050 --> 11:56.440
ดังนั้นคุณสามารถวาดสิ่งที่ท้าทายและดูว่ามันสามารถหยิบมันได้หรือไม่

11:56.440 --> 12:03.730
สมมุติว่าถ้าฉันวาดบางอย่างที่ดูเหมือน 0 แต่มันไม่ใช่ 0 ที่เสร็จแล้วมันจะหยิบมันขึ้นมาคราวนี้ไม่ได้หยิบมันขึ้นมา

12:03.730 --> 12:06.190
ดูเหมือนว่า 9 กับภาพ

12:06.190 --> 12:08.550
ถ้าหากฉันชอบทำมันให้สำเร็จ

12:08.560 --> 12:14.430
ดังนั้นตอนนี้มันจึงคิดว่าเป็น 0 หรือ 9 และคุณสามารถเห็นตรงนี้ว่ามีอะไรสว่างขึ้น 0

12:14.460 --> 12:16.600
แต่เราจะพูดถึงส่วนนั้นด้วยความสงสัย

12:16.720 --> 12:20.030
ทำอย่างอื่นมากกว่าสมมติว่าเช่น 8

12:20.260 --> 12:23.780
ฉันคิดว่ามันค่อนข้างยากสำหรับตอนนี้ที่รับ 8

12:23.800 --> 12:31.570
คุณจะเห็นได้ว่ามันกลายเป็น 8 แล้วหลังจากนั้นมันก็หยุดการจดจำได้การหยุดจะทำให้มนุษย์เราเข้าใจ

12:31.570 --> 12:32.150
ขวา.

12:32.170 --> 12:34.390
คุณสมบัติเหล่านี้ที่ใช้งานได้

12:34.570 --> 12:38.710
แต่ในขณะเดียวกันก็จำได้อย่างถูกต้องว่ามันคือ 8

12:39.100 --> 12:42.540
ดังนั้นลองเล่นกับแน่นอนว่าคุณสามารถวาดหน้ายิ้มได้

12:42.550 --> 12:43.460
จะเกิดอะไรขึ้น

12:44.310 --> 12:50.950
ดูเหมือนว่าเครื่องมือนี้จะมีสามถึงสามเพราะเครื่องมือนี้ได้รับการฝึกฝนโดยใช้ตัวเลขตั้งแต่ 0 ถึงเก้าเท่านั้น

12:51.120 --> 13:12.570
ดังนั้นจึงต้องจดจำสิ่งที่มีอยู่และจดจำสามสิ่งนี้ในชีวิตเมื่อคุณเห็นสิ่งที่เป็นผลไม้ชนิดหนึ่งที่คุณไม่เคยเห็นมาก่อนเช่นแอปเปิ้ลสังขยาหรืออะไรบางอย่างและคุณคิดว่ามันเป็นแบบนั้น ลูกแพร์เพราะคุณไม่เคยเห็นใครมาก่อนที่คุณจะไม่รู้ว่าจะแบ่งมันเป็นสิ่งเดียวกันที่นี่หรือไม่ดังนั้นจึงไม่ได้ฝึกฝนบนใบหน้าที่ยิ้มแย้มจริง ๆ

13:12.570 --> 13:20.480
และนั่นเป็นเหตุผลว่าทำไมมันถึงคิดว่ามันเป็นต้นไม้

13:20.490 --> 13:25.770
ดังนั้นคุณจะไปเป็นเครื่องมือที่ทรงพลังมากมันจะเป็นประโยชน์สำหรับคุณที่จะเล่นมันจริง ๆ

13:26.130 --> 13:29.430
เมื่อคุณวางเมาส์เหนือพิกเซลพิกเซลที่จะแสดง

13:29.430 --> 14:03.730
มันแสดงให้คุณเห็นว่าตัวตรวจจับคุณลักษณะนั้นหยิบพิกเซลนั้นขึ้นมาเพื่อให้คุณสามารถดูว่าพิกเซลเหล่านั้นมาจากที่ใดและเพื่อให้คุณสามารถดูว่าตัวกรองนั้นเป็นอย่างไรเช่นผ่านภาพอย่างที่เราพูดถึงและแน่นอนและที่นี่ คุณจะเห็นว่าคุณสามารถเห็นการรวมกำไรที่คุณเห็นได้ว่าการดึงเสร็จสิ้นด้วยการดึงเสร็จแล้วด้วยขนาดสี่เหลี่ยมจัตุรัสขนาดเล็กสองคูณสองและคุณจะเห็นว่ามันเป็นก้าวที่สองเช่นเดียวกับที่เราได้กล่าวถึงในวันนี้

14:03.960 --> 14:09.240
ดังนั้นจะมีการเล่นหรือมีการเล่นกับที่และฉันหวังว่าคุณจะสนุกกับเซสชั่นวันนี้

14:09.240 --> 14:10.610
ฉันหวังว่าจะได้พบคุณอีกในครั้งต่อไป

14:10.620 --> 14:12.470
และจนกว่าจะสนุกกับการเรียนรู้ลึก
