AI#1 - เพราะทุกอย่างคือตัวเลข

AI#1 - เพราะทุกอย่างคือตัวเลข

สำหรับใครที่บังเอิญผ่านเข้ามาอ่านบทความนี้และไม่รู้จักผมมาก่อน ผมไม่ใช่นัก AI นัก Machine Learning นัก Computer Science นัก Data Science หรือว่าอะไรก็ตามที่คุณใช้เรียกคนที่ทำงานเกี่ยวกับ AI ดังนั้นบทความซีรีส์นี้ไม่ได้กำลังจะมาสอนคุณสร้างโมเดล AI หรืออะไรทำนองนั้นแน่นอน ผมจะมาชวนคุณคุยคณิตศาสตร์เหมือนที่ทำมาตลอดนั่นแหละ

สำหรับใครที่รู้จัก AI ดีอยู่แล้ว คุณน่าจะรู้ดีว่าคณิตศาสตร์นั้นสำคัญแค่ไหนในงานด้านนี้ เผลอ ๆ จะต้องพูดว่าคณิตศาสตร์คือทั้งหมดของ AI เลยด้วยซ้ำ แต่สำหรับใครที่ไม่ได้ข้องเกี่ยวกับ AI มากนัก หรืออยู่ในฐานะผู้ใช้ AI เสียมากกว่า ไม่แปลกที่คุณจะนึกภาพไม่ออกว่า AI ที่คุณใช้ถามคำถามหรือ gen รูปภาพมันเกี่ยวอะไรกับคณิตศาสตร์ สิ่งนี้ก็คงคล้าย ๆ กับที่บางคนไม่รู้มาก่อนว่าเบื้องหลังอาหารจานอร่อยสักจานในร้านอาหารนั้นมีองค์ความรู้ทางวิทยาศาสตร์ซ่อนอยู่เยอะแยะไปหมด

ใช่ฮะ ในฐานะคนกิน คุณอาจจะไม่ต้องรู้หรอกว่ามันมีวิทยาศาสตร์อะไรอยู่เบื้องหลังอาหารจานโปรดของคุณบ้าง เชฟจะทำมายังไงก็ทำเถอะ ขอแค่คุณกินแล้วอร่อยก็พอ แต่ในฐานะของคนที่อยากทำอาหารเองบ้าง ไม่ว่าจะทำกินเองที่บ้าน หรือเปิดร้านแข่ง การรู้วิทยาศาสตร์เบื้องหลังความอร่อยเหล่านั้นก็อาจจะสำคัญ

โควทที่ผมมักจะยกเสมอเวลาพูดเรื่องนี้มาจากทวิตของคุณ Bindu Reddy CEO และ Co-Founder ของ Abacus.AI ที่ว่า

Machine Learning นั้นเหมือนเวทมนตร์ จนกระทั่งคุณเข้าใจคณิตศาสตร์ของมัน

สำหรับคอมพิวเตอร์ ทุกอย่างเป็นตัวเลขครับ หมายถึงว่า ตัวเลขคือสิ่งเดียวที่คอมพิวเตอร์อ่านออก ดังนั้นถ้าคุณอยากสื่อสารกับคอมพิวเตอร์ คุณต้องใช้ตัวเลข

คุณอาจจะบอกว่า ไม่เห็นจริงเลย เดี๋ยวนี้คอมพิวเตอร์ไม่ได้พูดคุยกับเราด้วยเฉพาะตัวเลขแล้วซะหน่อย เรา prompt เอาก็ได้ ใส่เสียง ใส่รูป หรือคุยกับคอมพิวเตอร์ได้ด้วยรูปแบบอื่นเยอะแยะไปหมด ก็ต้องบอกว่า ทั้งใช่และไม่ใช่ฮะ

ส่วนที่ใช่ก็คือ ใช่แล้ว เดี๋ยวนี้เทคโนโลยีมันทำให้เราสามารถสื่อสารกับคอมพิวเตอร์ได้หลากหลายมากขึ้นก็จริง แต่รูปแบบเหล่านั้นที่คุณรู้สึกว่าหลากหลายนั้น แท้จริงแล้วมันเป็นเพียงหน้ากากที่ใส่เพื่อให้มนุษย์เข้าใจเฉย ๆ เพราะสำหรับคอมพิวเตอร์แล้ว ทุกอย่างยังคงเป็นตัวเลขเสมอ

เอาง่าย ๆ อย่างรูปภาพ ผมน่าจะเคยพูดในเพจหลายรอบแล้วว่ารูปภาพคือตัวเลข แต่ละพิกเซลก็จะเก็บค่าสีของมันไว้ ถ้าเป็นขาวดำก็ใช้เลขหนึ่งตัว ถ้าเป็นภาพสีในระบบ RGB ก็ใช้เลข 3 ตัวเพื่อแสดงค่าสีแดง สีเขียว และสีน้ำเงิน

ที่มาภาพ: exponenta

ดังนั้นที่เราเห็นคอมพิวเตอร์หรือมือถือแสดงรูปภาพสักรูปขึ้นมา สำหรับเรามันอาจจะเป็นรูปภาพ แต่สำหรับคอมพิวเตอร์ นั่นคือตัวเลข

ถ้ารูปภาพยังเป็นตัวเลข ก็ไม่มีอะไรให้ต้องพูดถึงเสียง เพราะเรารู้กันดีว่าเสียงเป็นคลื่น ดังนั้นคอมพิวเตอร์มันไม่ได้เก็บเสียง แต่มันเก็บตัวเลขที่แทนคลื่นเสียงนั้น และปล่อยออกมาเวลาเราเปิดฟัง

ของที่ดูจากมองว่าเป็นตัวเลขยากหน่อยคือคำและข้อความ ผมไม่ได้กำลังหมายถึงการเก็บตัวอักษรแต่ละตัวเป็นตัวเลขนะฮะ อันนั้นไม่ยาก แต่ผมกำลังพูดถึงความหมายของคำแต่ละคำ นึกถึงเวลาที่เรา prompt คุยกับ generative AI แล้วมันตอบสนองออกมาได้ตรงตามความต้องการของเรา สิ่งนี้เกิดขึ้นได้เพราะคอมพิวเตอร์รับรู้ความหมายของสิ่งที่เรา prompt ไปด้วยการมองความหมายของคำหรือข้อความที่เราพิมพ์ลงไปเป็นตัวเลข

ผมเคยเขียนโพสท์เรื่อง ‘เวกเตอร์ของคำศัพท์’ ไว้ละเอียด ๆ ใครสนใจลองตามไปอ่านกันดูได้

คณิตศาสตร์อย่างที่ควรจะเป็น
ตอนเราเรียนเรื่องเวกเตอร์สมัยเด็ก ครูก็มักจะยกตัวอย่างเวกเตอร์ในวิชาฟิสิกส์ อย่างพวกทิศทางการเคลื่อนที่ ความเร็ว แรง อะไรแบบนี้ แต่คำถามคือนอกจากในฟิสิกส์ เวกเตอร์อยู่ในไหนอีกบ้าง

ดังนั้นจึงไม่น่าแปลกใจที่คณิตศาสตร์จะมีบทบาทเยอะมากในงานด้านคอมพิวเตอร์ เหล่าผู้บุกเบิกวิชาด้านคอมพิวเตอร์ส่วนใหญ่ก็เป็นนักคณิตศาสตร์เสียด้วยซ้ำ ตั้งแต่คอมพิวเตอร์ยุคแรก ๆ อย่างพวกเครื่องถอดรหัส มาจนถึงเทคโนโลยีล้ำ ๆ อย่างในทุกวันนี้ 

พีชคณิตเชิงเส้นหรือ Linear Algebra เป็นคณิตศาสตร์แขนงหนึ่งที่ว่าด้วยเวกเตอร์และเมทริกซ์ จริง ๆ พูดให้ครอบคลุมคือมันคือศาสตร์ที่ศึกษาเกี่ยวกับเครื่องมือที่เอาไว้จัดการอะไรก็ตามที่มีมิติเยอะ ๆ

พอพูดว่ามิติหลายคนอาจจะคุ้นเคยกับคำว่ามิติในฟิสิกส์ ที่หมายถึงกว้าง ยาว หรือลึก แต่หมายถึงจำนวนของตัวเลขที่เราใช้ประกอบกันขึ้นมาเพื่ออธิบายสิ่งนั้น เช่น ถ้าเราเก็บข้อมูลอายุ เพศ น้ำหนัก และส่วนสูงของใครสักคน แบบนี้ก็คือ 4 มิติ ดังนั้นในมุมมองนี้รูปภาพสีขนาด 500x500 พิกเซลนั้นก็จะเป็นวัตถุที่อยู่ใน 750,000 มิติ เพราะมันประกอบขึ้นมาจากตัวเลขทั้งหมด 750,000 ตัวนั่นเอง

ที่มาภาพ: medium

สำหรับเราที่เป็นมนุษย์ ถ้าผมส่งรูปใบหน้าคนไปให้คุณดูสักรูปแล้วถามว่าตรงไหนคือตา คุณสามารถชี้ได้ไม่ยากเลยถูกไหมฮะ ตาก็คือตาไง เรารู้ดีอยู่แล้วว่าตรงไหนคือตา แต่ถ้าเราต้องการบอกให้คอมพิวเตอร์ทำสิ่งเดียวกัน คราวนี้ไม่ง่ายแล้ว เพราะเราจะอธิบายให้คอมพิวเตอร์ฟังยังไงดีว่าตรงไหนคือตา โดยเฉพาะเมื่อเราต้องอธิบายจากสิ่งที่คอมพิวเตอร์มันเห็น ซึ่งคือชุดของตัวเลขจำนวนมหาศาล เราจะอธิบายมันยังไงว่าตัวเลขที่เรียงกันแบบไหนคือตา ซึ่งต้องเป็นวิธีการบอกมันที่ใช้ได้กับรูปหน้าทุกรูปด้วยนะ ไม่ใช่แค่หน้าใดหน้าหนึ่งเท่านั้น

คณิตศาสตร์ครับ คณิตศาสตร์ทั้งนั้นเลย


บทความนี้เป็นตอนแรกของ A Little Deeper Conversation on AI ซีรีส์บทความ 8 ตอน ที่จะพาคุณดำดิ่งสู่คณิตศาสตร์เบื้องหลังความฉลาดของปัญญาประดิษฐ์ในทุกวันนี้

ผู้ที่สนใจสามารถสมัครสมาชิกเพื่ออ่านบทความที่สอง ในห้องเรียนวิชาแยกหมากับแมว ได้เลย

AI#2 - ในห้องเรียนวิชาแยกหมากับแมว
แม้ว่าบทความซีรีส์นี้จะตั้งชื่อว่า A Little Deeper Conversation on AI แต่เนื้อหาส่วนใหญ่ที่ผมจะเล่านั้นเกี่ยวกับคณิตศาสตร์ Machine Learning หรือ ML มากกว่า แล้วสองอันนี้ต่างกันยังไง คำว่า AI หรือ Artificial Intelligence นั้นแปลว่

และอ่านตอนถัด ๆ ไปได้ทุกวันจันทร์