AI#1 - เพราะทุกอย่างคือตัวเลข

สำหรับใครที่บังเอิญผ่านเข้ามาอ่านบทความนี้และไม่รู้จักผมมาก่อน ผมไม่ใช่นัก AI นัก Machine Learning นัก Computer Science นัก Data Science หรือว่าอะไรก็ตามที่คุณใช้เรียกคนที่ทำงานเกี่ยวกับ AI ดังนั้นบทความซีรีส์นี้ไม่ได้กำลังจะมาสอนคุณสร้างโมเดล AI หรืออะไรทำนองนั้นแน่นอน ผมจะมาชวนคุณคุยคณิตศาสตร์เหมือนที่ทำมาตลอดนั่นแหละ
สำหรับใครที่รู้จัก AI ดีอยู่แล้ว คุณน่าจะรู้ดีว่าคณิตศาสตร์นั้นสำคัญแค่ไหนในงานด้านนี้ เผลอ ๆ จะต้องพูดว่าคณิตศาสตร์คือทั้งหมดของ AI เลยด้วยซ้ำ แต่สำหรับใครที่ไม่ได้ข้องเกี่ยวกับ AI มากนัก หรืออยู่ในฐานะผู้ใช้ AI เสียมากกว่า ไม่แปลกที่คุณจะนึกภาพไม่ออกว่า AI ที่คุณใช้ถามคำถามหรือ gen รูปภาพมันเกี่ยวอะไรกับคณิตศาสตร์ สิ่งนี้ก็คงคล้าย ๆ กับที่บางคนไม่รู้มาก่อนว่าเบื้องหลังอาหารจานอร่อยสักจานในร้านอาหารนั้นมีองค์ความรู้ทางวิทยาศาสตร์ซ่อนอยู่เยอะแยะไปหมด
ใช่ฮะ ในฐานะคนกิน คุณอาจจะไม่ต้องรู้หรอกว่ามันมีวิทยาศาสตร์อะไรอยู่เบื้องหลังอาหารจานโปรดของคุณบ้าง เชฟจะทำมายังไงก็ทำเถอะ ขอแค่คุณกินแล้วอร่อยก็พอ แต่ในฐานะของคนที่อยากทำอาหารเองบ้าง ไม่ว่าจะทำกินเองที่บ้าน หรือเปิดร้านแข่ง การรู้วิทยาศาสตร์เบื้องหลังความอร่อยเหล่านั้นก็อาจจะสำคัญ
โควทที่ผมมักจะยกเสมอเวลาพูดเรื่องนี้มาจากทวิตของคุณ Bindu Reddy CEO และ Co-Founder ของ Abacus.AI ที่ว่า

Machine Learning นั้นเหมือนเวทมนตร์ จนกระทั่งคุณเข้าใจคณิตศาสตร์ของมัน
สำหรับคอมพิวเตอร์ ทุกอย่างเป็นตัวเลขครับ หมายถึงว่า ตัวเลขคือสิ่งเดียวที่คอมพิวเตอร์อ่านออก ดังนั้นถ้าคุณอยากสื่อสารกับคอมพิวเตอร์ คุณต้องใช้ตัวเลข
คุณอาจจะบอกว่า ไม่เห็นจริงเลย เดี๋ยวนี้คอมพิวเตอร์ไม่ได้พูดคุยกับเราด้วยเฉพาะตัวเลขแล้วซะหน่อย เรา prompt เอาก็ได้ ใส่เสียง ใส่รูป หรือคุยกับคอมพิวเตอร์ได้ด้วยรูปแบบอื่นเยอะแยะไปหมด ก็ต้องบอกว่า ทั้งใช่และไม่ใช่ฮะ
ส่วนที่ใช่ก็คือ ใช่แล้ว เดี๋ยวนี้เทคโนโลยีมันทำให้เราสามารถสื่อสารกับคอมพิวเตอร์ได้หลากหลายมากขึ้นก็จริง แต่รูปแบบเหล่านั้นที่คุณรู้สึกว่าหลากหลายนั้น แท้จริงแล้วมันเป็นเพียงหน้ากากที่ใส่เพื่อให้มนุษย์เข้าใจเฉย ๆ เพราะสำหรับคอมพิวเตอร์แล้ว ทุกอย่างยังคงเป็นตัวเลขเสมอ
เอาง่าย ๆ อย่างรูปภาพ ผมน่าจะเคยพูดในเพจหลายรอบแล้วว่ารูปภาพคือตัวเลข แต่ละพิกเซลก็จะเก็บค่าสีของมันไว้ ถ้าเป็นขาวดำก็ใช้เลขหนึ่งตัว ถ้าเป็นภาพสีในระบบ RGB ก็ใช้เลข 3 ตัวเพื่อแสดงค่าสีแดง สีเขียว และสีน้ำเงิน
ดังนั้นที่เราเห็นคอมพิวเตอร์หรือมือถือแสดงรูปภาพสักรูปขึ้นมา สำหรับเรามันอาจจะเป็นรูปภาพ แต่สำหรับคอมพิวเตอร์ นั่นคือตัวเลข
ถ้ารูปภาพยังเป็นตัวเลข ก็ไม่มีอะไรให้ต้องพูดถึงเสียง เพราะเรารู้กันดีว่าเสียงเป็นคลื่น ดังนั้นคอมพิวเตอร์มันไม่ได้เก็บเสียง แต่มันเก็บตัวเลขที่แทนคลื่นเสียงนั้น และปล่อยออกมาเวลาเราเปิดฟัง
ของที่ดูจากมองว่าเป็นตัวเลขยากหน่อยคือคำและข้อความ ผมไม่ได้กำลังหมายถึงการเก็บตัวอักษรแต่ละตัวเป็นตัวเลขนะฮะ อันนั้นไม่ยาก แต่ผมกำลังพูดถึงความหมายของคำแต่ละคำ นึกถึงเวลาที่เรา prompt คุยกับ generative AI แล้วมันตอบสนองออกมาได้ตรงตามความต้องการของเรา สิ่งนี้เกิดขึ้นได้เพราะคอมพิวเตอร์รับรู้ความหมายของสิ่งที่เรา prompt ไปด้วยการมองความหมายของคำหรือข้อความที่เราพิมพ์ลงไปเป็นตัวเลข
ผมเคยเขียนโพสท์เรื่อง ‘เวกเตอร์ของคำศัพท์’ ไว้ละเอียด ๆ ใครสนใจลองตามไปอ่านกันดูได้

ดังนั้นจึงไม่น่าแปลกใจที่คณิตศาสตร์จะมีบทบาทเยอะมากในงานด้านคอมพิวเตอร์ เหล่าผู้บุกเบิกวิชาด้านคอมพิวเตอร์ส่วนใหญ่ก็เป็นนักคณิตศาสตร์เสียด้วยซ้ำ ตั้งแต่คอมพิวเตอร์ยุคแรก ๆ อย่างพวกเครื่องถอดรหัส มาจนถึงเทคโนโลยีล้ำ ๆ อย่างในทุกวันนี้
พีชคณิตเชิงเส้นหรือ Linear Algebra เป็นคณิตศาสตร์แขนงหนึ่งที่ว่าด้วยเวกเตอร์และเมทริกซ์ จริง ๆ พูดให้ครอบคลุมคือมันคือศาสตร์ที่ศึกษาเกี่ยวกับเครื่องมือที่เอาไว้จัดการอะไรก็ตามที่มีมิติเยอะ ๆ
พอพูดว่ามิติหลายคนอาจจะคุ้นเคยกับคำว่ามิติในฟิสิกส์ ที่หมายถึงกว้าง ยาว หรือลึก แต่หมายถึงจำนวนของตัวเลขที่เราใช้ประกอบกันขึ้นมาเพื่ออธิบายสิ่งนั้น เช่น ถ้าเราเก็บข้อมูลอายุ เพศ น้ำหนัก และส่วนสูงของใครสักคน แบบนี้ก็คือ 4 มิติ ดังนั้นในมุมมองนี้รูปภาพสีขนาด 500x500 พิกเซลนั้นก็จะเป็นวัตถุที่อยู่ใน 750,000 มิติ เพราะมันประกอบขึ้นมาจากตัวเลขทั้งหมด 750,000 ตัวนั่นเอง

สำหรับเราที่เป็นมนุษย์ ถ้าผมส่งรูปใบหน้าคนไปให้คุณดูสักรูปแล้วถามว่าตรงไหนคือตา คุณสามารถชี้ได้ไม่ยากเลยถูกไหมฮะ ตาก็คือตาไง เรารู้ดีอยู่แล้วว่าตรงไหนคือตา แต่ถ้าเราต้องการบอกให้คอมพิวเตอร์ทำสิ่งเดียวกัน คราวนี้ไม่ง่ายแล้ว เพราะเราจะอธิบายให้คอมพิวเตอร์ฟังยังไงดีว่าตรงไหนคือตา โดยเฉพาะเมื่อเราต้องอธิบายจากสิ่งที่คอมพิวเตอร์มันเห็น ซึ่งคือชุดของตัวเลขจำนวนมหาศาล เราจะอธิบายมันยังไงว่าตัวเลขที่เรียงกันแบบไหนคือตา ซึ่งต้องเป็นวิธีการบอกมันที่ใช้ได้กับรูปหน้าทุกรูปด้วยนะ ไม่ใช่แค่หน้าใดหน้าหนึ่งเท่านั้น
คณิตศาสตร์ครับ คณิตศาสตร์ทั้งนั้นเลย
บทความนี้เป็นตอนแรกของ A Little Deeper Conversation on AI ซีรีส์บทความ 8 ตอน ที่จะพาคุณดำดิ่งสู่คณิตศาสตร์เบื้องหลังความฉลาดของปัญญาประดิษฐ์ในทุกวันนี้
ผู้ที่สนใจสามารถสมัครสมาชิกเพื่ออ่านบทความที่สอง ในห้องเรียนวิชาแยกหมากับแมว ได้เลย

และอ่านตอนถัด ๆ ไปได้ทุกวันจันทร์