นอกจากนักโทโพโลจี มีใครเห็นแก้วกาแฟเหมือนกับโดนัทอีกบ้าง

นอกจากนักโทโพโลจี มีใครเห็นแก้วกาแฟเหมือนกับโดนัทอีกบ้าง

มีมุกตลกคณิตศาสตร์อันหนึ่งที่คนชอบแซวกันคือ นักโทโพโลจีนั้นเห็นแก้วกาแฟเหมือนกับโดนัท

ซึ่งอาจจะไม่ได้จริงขนาดนั้น หมายถึงว่า คงไม่มีนักโทโพโลจีหรือแม้แต่นักคณิตศาสตร์คนไหนเดินเข้าร้านโดนัทแล้วสั่งว่าขอแก้วกาแฟใบนั้นหน่อย มันประหลาดเกิน เพราะเราทุกคนรู้อยู่แล้วว่าสองอย่างนี้ไม่ใช่ของอย่างเดียวกัน ถ้วยกาแฟเอาไว้ใส่กาแฟ โดนัทเอาไว้กิน วัสดุ หน้าที่ รสชาติ พื้นผิว และประสบการณ์ที่เรามีกับมันต่างกันหมด แต่ใช่ฮะ ในทางโทโพโลจี เราสามารถมองว่าแก้วกาแฟและโดนัทนั้นเหมือนกันได้จริง ๆ

จุดสำคัญอยู่ที่คำว่า “เหมือนกัน” ฮะ มันอยู่ที่ว่าคุณให้ความหมายคำว่าเหมือนกันไว้ยังไง เพราะถ้าคุณบอกว่าของสองอย่างนั้นเหมือนกันแปลว่ารูปร่างหน้าตาต้องเหมือนกันเป้ะ ๆ งั้นทำไมคุณถึงเห็นวัตถุสองชิ้นในรูปข้างล่างนี้เป็นแก้วกาแฟเหมือนกันล่ะ

เห็นประเด็นไหมฮะ ว่าจริง ๆ แล้วเวลาคุณบอกว่าของสองอย่าง “เหมือนกัน” นั้น เราอาจไม่ได้กำลังบอกว่ามันเหมือนกันเป้ะ ๆ ทุกกระเบียดนิ้ว แต่ขอให้มัน “มีสมบัติบางอย่างที่เหมือนกัน” อย่างในที่นี้ก็คือ หน้าที่การใช้งาน ซึ่งคือเอาไว้ใส่กาแฟเหมือนกัน

ทีนี้ ถ้าผมเพิ่มแก้วกาแฟเข้าไปอีกใบ คุณอาจสรุปว่า ทั้งหมดก็ยังเป็นแก้วกาแฟเหมือนกันเหมือนเดิม แต่ใบใหม่นั้นต่างออกไปหน่อย ตรงที่มันไม่มีหู

แปลว่าตอนนี้คุณเพิ่มสมบัติที่คุณสนใจมาอีกข้อแล้วนะ จากแค่หน้าที่การใช้งาน คราวนี้คุณสนใจ “ความมีหู” แล้วด้วย ซึ่งในความจริงคุณอาจจะสนใจสมบัติอะไรก็ได้ถูกไหมฮะ อาจจะเป็นสมบัติกว้าง ๆ อย่างสี พื้นผิว หรือเริ่มละเอียดขึ้นอย่างวัสดุที่ใช้ หรือแม้แต่ประเทศที่ผลิต

เวลานักโทโพโลจีมองวัตถุก็ประมาณนั้นแหละฮะ แต่สมบัติที่พวกเขาสนใจนั้นหยาบกว่านั้นมาก นั่นคือพวกเขาสนใจแค่ว่ามันมีจำนวนชิ้นและจำนวนรูเท่ากันหรือเปล่า และนั่นจึงทำให้ทั้งแก้วกาแฟและโดนัทนั้นดูเหมือนกัน เพราะมันมีหนึ่งรูเหมือนกัน

จริง ๆ จะพูดว่านักโทโพโลจีสนใจจำนวนรูของวัตถุก็ไม่ถูกเสียทีเดียว สิ่งที่พวกเขาสนใจจริง ๆ คือถ้าเราจินตนาการว่าวัตถุนั้นทำจากยางนิ่ม ๆ ที่คลึง ยืด บิด ดึง หรือหดได้ โดยไม่ตัด ไม่ฉีก ไม่เจาะรูเพิ่ม และไม่เอาอะไรไปปะ เราจะเปลี่ยนมันจากรูปร่างหนึ่งไปเป็นอีกรูปร่างหนึ่งได้หรือไม่มากกว่า

ของสองสิ่งที่สามารถคลึง ๆ จากอันหนึ่งไปเป็นอีกอันหนึ่งได้นั้นเราเรียกว่ามัน homeomorphic กัน โดยการคลึงที่ว่านี้นั้นทำได้ทั้งยืด หด บิด ดัด ตราบใดที่ไม่ทำให้ผิวขาด ไม่เอาสองส่วนที่แยกกันมาติดกัน ไม่เจาะรูใหม่ และไม่อุดรูเดิม ก็ถือว่าโอเคหมด นั่นจึงทำให้บางครั้งโทโพโลจีจึงถูกเรียกว่า เรขาคณิตของยาง

ด้วยเหตุนี้ โดนัทกับถ้วยกาแฟจึง homeomorphic หรือที่เรียกกันแบบลำลองว่าเหมือนกันในทางโทโพโลจี เพราะโดนัทมีรูตรงกลางหนึ่งรู ส่วนถ้วยกาแฟมีรูตรงหูจับหนึ่งรู ถ้าเราจินตนาการว่าถ้วยกาแฟทำจากยางนิ่ม ๆ เราสามารถค่อย ๆ คลึง บิด ยืด และคลึงมันให้กลายเป็นรูปร่างคล้ายโดนัทได้ โดยไม่ต้องฉีก ไม่ต้องตัด ไม่ต้องเจาะรูเพิ่ม และไม่ต้องปะรูเดิม จำนวนรูยังคงเป็นหนึ่ง มันยังคงเป็นวัตถุชิ้นเดียว และโครงสร้างเชิงโทโพโลยียังคงเหมือนเดิม

นึกถึงตอนเราเรียนเรขาคณิตในชั้นมัธยมต้นก็ได้ฮะ ตอนนั้นเรามีคอนเซ็ปเรื่องการเท่ากันทุกประการ ที่หมายถึงรูปร่างที่ต้องเท่ากันเป้ะ ๆ สามารถเอามาซ้อนทับกันได้พอดี กับคอนเซ็ปเรื่องความคล้าย ที่มองแค่รูปร่างหน้าตาของมันว่าเหมือนกันแต่ยอมให้ขนาดต่างกันได้

ดังนั้นเราอาจจะมองว่า homeomorphic หรือการเหมือนกันในเชิงโทโพโลจีนั้นก็แค่วิธีมองว่ารูปเรขาคณิตสองอันเหมือนกันในความหมายที่หยาบขึ้นเท่านั้นเอง

อ่านมาถึงตรงนี้ คุณอาจจะกำลังคิดว่า โอเค เข้าใจก็ได้ว่าเหมือนกันในที่นี้คือมีสมบัติอย่างพวกจำนวนรูเหมือนกัน แต่ในโลกความเป็นจริงอ่ะ มีใครมองวัตถุแบบนี้จริง ๆ หรอ ส่วนใหญ่เราก็น่าจะมองรูปร่างจริง ๆ ของมันมากกว่าหรือเปล่า ใครจะมามัวนับจำนวนรู หรือสนใจสมบัติอะไรที่หยาบขนาดนั้น

คำตอบก็คือ มี และไม่ใช่ใครอื่นเลย แต่คือคุณเอง คุณนั่นแหละ

มนุษย์เห็นสิ่งต่าง ๆ แบบไหน

งานวิจัยด้านการรับรู้วัตถุของคุณเออร์วิง บีเดอร์แมน ในปี 1987 เสนอทฤษฎี Recognition-by-components ที่ว่า สมองอาจไม่ได้จำวัตถุด้วยการเก็บภาพทั้งภาพแบบตรง ๆ แต่แยกวัตถุออกเป็นชิ้นส่วนสามมิติพื้นฐานจำนวนไม่มากนักที่เขาเรียกว่า geons เช่น ทรงกระบอก กรวย กล่อง หรือส่วนโค้ง แล้วดูว่าชิ้นส่วนเหล่านี้ประกอบกันอย่างไร

ถ้าสมองกู้คืนโครงสร้างของชิ้นส่วนหลัก ๆ และความสัมพันธ์ระหว่างชิ้นส่วนเหล่านั้นได้ เราก็สามารถจำวัตถุได้ แม้วัตถุนั้นจะถูกหมุน เปลี่ยนมุมมอง หรือถูกบังบางส่วนก็ตาม

ที่มาภาพ: kamila.medium.com

พูดง่าย ๆ คือ เวลาคุณเห็นแก้วกาแฟ สมองอาจไม่ได้ถามว่า “ภาพนี้เหมือนแก้วใบเดิมเป๊ะไหม” แต่มันอาจถามว่า มีส่วนที่เป็นภาชนะไหม มีปากเปิดไหม มีหูจับไหม และชิ้นส่วนเหล่านี้วางอยู่อย่างสัมพันธ์กันแบบแก้วหรือเปล่า ถ้าความสัมพันธ์หลัก ๆ ยังอยู่ ต่อให้แก้วใบนั้นสูงขึ้น เตี้ยลง หมุนไปอีกมุมหนึ่ง หรือเปลี่ยนสีไป สมองก็ยังรู้ว่ามันคือแก้ว

อีกหลักฐานหนึ่งคืองานของคุณหลิน เฉิน ในปี 1982 ที่ชื่อ Topological Structure in Visual Perception งานวิจัยชิ้นนี้ตั้งคำถามว่า เวลาเรามองภาพแว้บเดียว ระบบการมองเห็นไวต่อความแตกต่างแบบใดเป็นพิเศษ ระหว่างรายละเอียดทางเรขาคณิต หรือโครงสร้างรวมเชิงโทโพโลยี

คุณเฉินทำการทดลองโดยฉายภาพให้ผู้เข้าร่วมดูในเวลาที่สั้นมาก แล้วให้แยกแยะความแตกต่างของรูปภาพบางชุด รูปบางคู่ต่างกันที่รายละเอียดเรขาคณิต แต่ยังมีโครงสร้างเชิงโทโพโลยีเหมือนกัน ขณะที่รูปบางคู่ต่างกันที่โครงสร้างเชิงโทโพโลยี เช่น จากวงปิดเป็นวงเปิด จากมีรูเป็นไม่มีรู หรือจากเชื่อมต่อกันเป็นแยกจากกัน

ผลที่ได้คือ ผู้เข้ารับการทำลองเหมือนจะไวต่อความต่างเชิงโทโพโลยีมากเป็นพิเศษ ต่อให้ภาพปรากฏเพียงแวบเดียว ความต่างอย่าง “มีรูหรือไม่มีรู” หรือ “เชื่อมกันหรือไม่เชื่อมกัน” ก็ถูกจับได้เด่นกว่าความต่างทางรูปร่างบางชนิด

งานวิจัยสองชิ้นนี้ไม่ได้กำลังจะสรุปว่าการมองเห็นของมนุษย์เป็นโทโพโลจีล้วน ๆ แบบเดียวกับในคณิตศาสตร์ เพราะในชีวิตจริงสมองยังใช้ข้อมูลเรื่องสี แสงเงา ขอบ ระยะ ความลึก และรายละเอียดอื่น ๆ อีก แต่มันชี้ให้เห็นว่าโครงสร้างเชิงโทโพโลยีบางอย่างอาจเป็นข้อมูลที่ระบบการมองเห็นให้ความสำคัญมากตั้งแต่ช่วงต้นของการรับรู้

ตัวอักษร A หน้าตาเป็นแบบไหน

ผมลองสร้างสถานการณ์สมมติง่าย ๆ ว่า คุณกำลังคุยกับใครสักคนที่ไม่รู้ภาษาอังกฤษ แล้วคุณต้องอธิบายให้เขาฟังว่าตัวอักษร A นั้นหน้าตาเป็นยังไง

คุณอาจจะเริ่มจากการอธิบายว่า ตัว A เนี่ย มันมีหน้าตาเป็นสามเหลี่ยมนะ สามเหลี่ยมหน้าจั่ว ที่มีขายาว ๆ ออกมาข้างล่างสองข้าง

เขาก็พยักหน้าหงึก ๆ แล้วก็ถามว่า แล้วนี่คือตัวอะไร

คุณก็จะแบบ อ่าาาา นี่ก็ A เหมือนกัน แล้วเขาก็จะถามคุณกลับว่า ไม่ใช่นี่นา นี่ไม่ใช่สามเหลี่ยมมีขาด้วยซ้ำ มันเหมือนครึ่งวงกลมมีขามากกว่า

เริ่มเห็นประเด็นไหมฮะ ว่าถึงแม้คุณจะจำว่า A คือสามเหลี่ยมมีขาสองข้าง แต่ถึงมันไม่ใช่สามเหลี่ยมคุณก็ยังดูออกอยู่ดีว่าเป็นตัว A อย่างในรูปข้างล่างนี้คุณรู้ว่าทั้งหมดนี้คือตัว A แม้ว่ารูปร่างของมันจะไม่ได้เหมือนกันเป้ะ ๆ ด้วยซ้ำ

เพราะจริง ๆ แล้วสิ่งที่คุณรับรู้จริง ๆ เวลามองอะไรสักอย่างนั้นไม่ใช่ทุกอย่างที่มันเป็น แต่คือ “โครงคร่าว ๆ” ของสิ่งต่าง ๆ ต่างหาก

นี่เป็นเรื่องธรรมดามากจนเราแทบไม่รู้สึกว่ามันน่าประหลาดใจ แต่จริง ๆ แล้วมันแปลกมาก เพราะถ้าเรายึดความเหมือนแบบเท่ากันทุกประการ ตัว A คนละฟอนต์แทบจะไม่ใช่สิ่งเดียวกันเลย แต่เหมือนสมองเราจะไม่ได้ทำงานแบบนั้น มันไม่ได้ต้องการให้ตัวอักษรเหมือนกันทุกเส้น ทุกมุม ทุกความยาว แต่มันต้องการแค่ให้โครงสร้างสำคัญบางอย่างยังอยู่พอที่จะจัดสิ่งที่เห็นเข้าไปในกลุ่มของตัวอักษรเดิมได้

งานวิจัยด้านสมองและการรับรู้จำนวนมากสนใจว่า มนุษย์จำตัวอักษรได้อย่างไร ทั้งที่ตัวอักษรเดียวกันอาจปรากฏในฟอนต์ ขนาด ตำแหน่ง น้ำหนักเส้น หรือลักษณะตัวพิมพ์ที่ต่างกันมาก ความสามารถนี้เรียกว่า font-invariant recognition หรือการรู้จำตัวอักษรได้แม้รูปลักษณ์ภายนอกจะเปลี่ยนไป

งานของคุณลาร์สันในปี 2004 เสนอว่าสมองอาจอาศัย Distinctive Features หรือลักษณะเด่นของตัวอักษร เช่น เส้นตั้ง เส้นนอน เส้นเฉียง จุดตัด ช่องว่าง และความสัมพันธ์ระหว่างส่วนประกอบต่าง ๆ เพื่อระบุตัวอักษร

สอดคล้องกับงานของคุณเดอฮานในปี 2005 ที่เสนอโมเดล Local Combination Detector ซึ่งมองว่าการอ่านเกิดจากการประมวลผลเป็นลำดับชั้น ตั้งแต่เส้นและขอบ ไปสู่จุดบรรจบของเส้น ชิ้นส่วนของตัวอักษร ตัวอักษร และลำดับของตัวอักษรในคำ ก็คือสมองไม่ได้จำตัวอักษรเป็นภาพทั้งก้อน แต่ค่อย ๆ รวมองค์ประกอบย่อยให้กลายเป็นโครงสร้างที่มีความหมาย

งานของคุณสเวดในปี 2011 สนับสนุนสมมติฐานนี้เพิ่มเติม โดยพบว่าสมองส่วนที่เกี่ยวข้องกับการอ่าน โดยเฉพาะบริเวณที่มักเรียกว่า Visual Word Form Area ตอบสนองต่อโครงสร้างของเส้นและการประกอบกันของเส้น เช่น จุดตัด รอยต่อ และรูปแบบอย่าง T, L หรือ Y อย่างมีนัยสำคัญ องค์ประกอบเหล่านี้ไม่ใช่ตัวอักษรทั้งตัว แต่เป็นชิ้นส่วนสำคัญที่ช่วยให้สมองแยกแยะรูปหนึ่งออกจากอีกรูปหนึ่งได้

งานของคุณรอธไลน์และคุณแรปป์ในปี 2017 เสนอไปไกลกว่านั้น พวกเขาเสนอแนวคิดเรื่อง Allograph Representations หรือภาพในหัวของรูปตัวอักษร คือเขาเสนอว่าสมองอาจไม่ได้กระโดดจากเส้นดำ ๆ บนกระดาษไปสู่ความคิดว่า “นี่คือตัว A” ทันที แต่มีภาพตัว A ในอุดมคติอยู่ในหัว และเอาสิ่งที่เราเห็นไปเทียบว่ามันคล้ายกับภายตัว A ในหัวไหม ถ้าใช่ จึงสรุปว่า “นี่คือตัว A”

แต่ความสามารถนี้ก็มีขอบเขต ตัวอักษรไม่ได้ถูกอ่านจากรายละเอียดทุกเส้นแบบเป๊ะ ๆ ก็จริง แต่โครงสร้างสำคัญบางอย่างยังต้องชัดพอให้สมองแยกแยะได้ เช่น O กับ C อาจมีเส้นโค้งคล้ายกันมาก แต่ O เป็นวงปิด ส่วน C เป็นเส้นเปิด ดังนั้นถ้าเราเขียน C ให้ปลายเกือบแตะกัน ความต่างนี้ก็จะเริ่มพร่าและทำให้อ่านสับสนได้

กรณีเดียวกันเกิดขึ้นกับตัวอักษรหลายคู่ เช่น O กับ 0, I กับ l, rn กับ m, p กับ q, b กับ d หรือในภาษาไทยอย่าง ถ กับ ภ, ค กับ ด, บ กับ ป เมื่อฟอนต์หรือลายมือทำให้ช่องว่าง หัว หาง ทิศทางของเส้น หรือการเชื่อมต่อบางจุดเปลี่ยนไป ความต่างที่เคยใช้แยกตัวอักษรก็อาจอ่อนลงจนสมองลังเลได้

ทั้งหมดนี้ทำให้เห็นว่า สมองไม่ได้อ่านตัวอักษรด้วยการจำภาพเป๊ะ ๆ แต่มันอาศัยวิธีมองแบบโทโพโลจี คือการดึงลักษณะเด่นหลายระดับออกจากภาพ ตั้งแต่เส้น ขอบ จุดตัด รูปปิด ช่องว่าง ทิศทาง และความสัมพันธ์ระหว่างส่วนประกอบ แล้วประเมินว่าโครงสร้างที่เห็นยังอยู่ในขอบเขตของตัวอักษรเดิมหรือไม่

พูดให้กว้างกว่านั้นคือ เราไม่ได้รับรู้โลกอย่างละเอียดเท่าที่คิด เราเห็นโลกผ่านโครง ผ่านความสัมพันธ์ ผ่านสมบัติบางอย่างที่ยังคงอยู่ท่ามกลางความเปลี่ยนแปลง การที่เรารู้แก้วกาแฟคนละทรงก็ยังเป็นแก้วกาแฟ คนคนหนึ่งยังเป็นคนเดิมแม้เขาจะเปลี่ยนทรงผม หรือจำเพลงเดิมได้แม้มันจะถูกเรียงเรียงใหม่ แปลว่าสมองของเราทุกคนนั้นแอบเป็นนักโทโพโลจีอยู่นิด ๆ

ไม่ใช่เพราะเรามองถ้วยกาแฟเป็นโดนัทจริง ๆ แต่เพราะเรามองโลกด้วยคำถามที่คล้ายกันว่า รายละเอียดอะไรเปลี่ยนได้ และโครงสร้างอะไรที่ต้องดำรงไว้ เพื่อให้สิ่งหนึ่งยังเป็นสิ่งเดิมสำหรับเราอยู่

แหล่งอ้างอิง
https://psycnet.apa.org/record/1987-20898-001
https://www.science.org/doi/10.1126/science.7134969
https://www.sciencedirect.com/science/article/pii/S1364661303001347
https://link.springer.com/article/10.3758/s13414-011-0220-9
https://psycnet.apa.org/doiLanding?doi=10.1037%2Fxhp0000384
https://lavalle.pl/planning/book.pdf
https://arxiv.org/abs/0807.3161