ทฤษฎีเกม

Prisoner’s Dilemma ของการใช้ AI แทนคน

ช่วงสัปดาห์ก่อนเห็นคนแชร์ paper ที่ชื่อ The AI Layoff Trap โดยคุณ Brett Hemenway Falk จาก University of Pennsylvania และคุณ Gerry Tsoukalas จาก Boston University กันพอสมควร

ซึ่งสารภาพว่าผมเพิ่งมีเวลาได้อ่าน

ประเด็นหลักของ paper นี้คือ เขาสนใจสถานการณ์ในปัจจุบันที่บริษัทหลายแห่งเริ่มใช้ AI มาแทนคน เพราะมันช่วยลดต้นทุน ถ้า AI ทำงานแทนคนได้ บริษัทก็จะจ่ายค่าจ้างน้อยลง กำไรก็จะสูงขึ้น แต่ปัญหาคือคนที่ถูกเลิกจ้างไม่ได้เป็นแค่ “ต้นทุนแรงงาน” แต่ยังเป็น “ผู้บริโภค” ในระบบเศรษฐกิจด้วยน่ะสิ

ดังนั้นเมื่อคนตกงาน รายได้หาย กำลังซื้อก็หาย ไม่มีใครซื้อของ แล้วก็วนกลับมาทำให้รายได้ของบริษัทลดลง และกลายเป็นว่า การใช้ AI แทนคนนั้นไม่ได้ทำร้ายแค่แรงงาน แต่ทำร้ายเจ้าของบริษัทด้วย

ถ้าอย่างนั้น คำถามที่น่าสนใจคือ เมื่อทุกคนเห็นพ้องต้องกันว่าการใช้ AI แทนคนจะพาเรามุ่งไปสู่หายนะเช่นนี้ ทำไมบริษัทต่าง ๆ ถึงไม่หยุดใช้ AI กันล่ะ

สถานการณ์นี้เหมือนกับปัญหาหนึ่งในวิชาทฤษฎีเกม (Game Theory) ที่เรียกว่า ภาวะกลืนไม่เข้าคายไม่ออกของนักโทษ (Prisoner’s Dilemma) ที่มีอยู่ว่า มีผู้ร้ายอยู่สองคน ทำความผิด แต่ไม่มีหลักฐาน ปัญหาคือทั้งคู่ถูกสอบสวนแยกกัน และโดนตำรวจล่อให้แต่ละคนสารภาพ โดยยื่นข้อเสนอว่า ถ้าคุณสารภาพ คุณจะได้รับการลดโทษ

แน่นอนว่าทางออกที่ดีที่สุดสำหรับทั้งคู่คือการร่วมกันมือปิดปากเงียบ เพราะถ้าไม่มีใครสารภาพ เมื่อไม่มีหลักฐาน พวกเขาทั้งคู่ก็จะรอดไปด้วยกัน แต่ปัญหาคือ เราจะแน่ใจได้ยังไงว่าเพื่อนอีกคนไม่ได้สารภาพไปแล้วล่ะ ถ้าเราเป็นคนเดียวที่ปิดปาก เราก็จะซวยอยู่คนเดียวสิ

นั่นแหละฮะจึงทำให้ปัญหานี้น่าสนใจขึ้นมา เพราะในโลกของทฤษฎีเกม ผู้เล่นแต่ละคนไม่ได้ตัดสินใจจากคำถามว่า “อะไรดีที่สุดสำหรับทุกคน” แต่เป็นคำถามที่ว่า “เมื่อคนอื่นเลือกแบบหนึ่งแล้ว อะไรดีที่สุดสำหรับเรา”

ผู้ที่มีชื่อเสียงจากการศึกษาเรื่องนี้คือคุณ John Nash และเขาได้เสนอแนวคิดสำคัญที่เรียกว่า Nash Equilibrium หรือดุลยภาพแบบแนช ซึ่งคือสถานการณ์ที่ผู้เล่นทุกคนเลือกกลยุทธ์ของตัวเองแล้ว และไม่มีใครอยากเปลี่ยนใจฝ่ายเดียว เพราะถ้าเปลี่ยนคนเดียว ตัวเองจะไม่ได้ผลลัพธ์ที่ดีขึ้น

ใน prisoner’s dilemma นั้น ดุลยภาพแบบแนชไม่ใช่การที่ทั้งสองคนร่วมมือกัน ทั้งที่การร่วมมือกันอาจทำให้ทั้งคู่ได้ผลลัพธ์ที่ดีกว่า แต่ดุลยภาพกลับคือการที่ทั้งสองคนต่างเลือกหักหลังกันและกัน

ทำไมถึงเป็นเช่นนั้น

ลองคิดแยกเป็นสองกรณี ถ้าอีกฝ่ายปิดปาก การสารภาพก็จะดีกว่าสำหรับเรา และถ้าอีกฝ่ายเลือกสารภาพ การสารภาพก็ยังจะดีกว่าสำหรับเราอยู่ดี แปลว่าไม่ว่าอีกฝ่ายจะทำอะไร การสารภาพก็เป็นตัวเลือกที่ดูดีที่สุดในระดับปัจเจก สุดท้ายทั้งสองคนเลยสารภาพพร้อมกัน ทั้งที่ผลลัพธ์รวมที่ออกมานั้นแย่กว่าการปิดปากทั้งคู่

นี่คือจุดที่น่าสนใจมากของสมดุลแบบแนช เพราะมันทำให้เราเห็นว่า ผลลัพธ์ที่จะเกิดขึ้นจริงจากแรงจูงใจ กับนผลลัพธ์ที่ดีที่สุดสำหรับทุกคนนั้นเป็นคนละเรื่องกัน

และนี่แหละคือเหตุผลว่าทำไมสถานการณ์แบบ prisoner’s dilemma ถึงเกิดซ้ำ ๆ ในโลกจริงได้ แม้ทุกคนจะรู้ว่าทางที่ดีกว่าคืออะไร แต่ถ้าโครงสร้างแรงจูงใจยังบอกว่าการหักหลังปลอดภัยกว่า สุดท้ายทุกคนก็อาจไหลไปสู่ผลลัพธ์ที่แย่กว่าร่วมกัน

ตัวอย่างคลาสสิกที่สุดคือเรื่องสิ่งแวดล้อม ทุกประเทศรู้ว่าการปล่อยคาร์บอนมากเกินไปจะทำให้โลกร้อน และถ้าทุกประเทศช่วยกันลดการปล่อยคาร์บอน โลกก็จะดีขึ้นในภาพรวม แต่ปัญหาคือการลดคาร์บอนมีต้นทุน ประเทศที่ลดก่อนอาจเสียเปรียบทางเศรษฐกิจ ขณะที่ประเทศที่ไม่ลดอาจยังได้ประโยชน์จากการผลิตถูกกว่า สุดท้ายทุกประเทศจึงมีแรงจูงใจให้รอคนอื่นลดไปก่อน ส่วนเราขอรับผลประโยชน์จากเขาดีกว่า และถ้าทุกคนคิดแบบนี้ โลกทั้งใบก็จะแย่ลง

หรือในวงการโฆษณาก็คล้ายกัน หลายบริษัทอาจรู้ว่า ถ้าไม่มีใครทุ่มงบโฆษณามากเกินไป ทุกคนก็ประหยัดต้นทุนได้ แต่ถ้าคู่แข่งลงโฆษณาหนักแล้วเราไม่ลง เราอาจถูกกลบจนคนลืมแบรนด์ สุดท้ายทุกบริษัทเลยต้องทุ่มงบแข่งกัน ทั้งที่ในภาพรวม เงินจำนวนมากอาจไม่ได้ทำให้ตลาดโตขึ้นเท่าไร แค่ทำให้แต่ละเจ้าต้องจ่ายแพงขึ้นเพื่อรักษาตำแหน่งเดิม

แก่นของ prisoner’s dilemma จึงไม่ใช่แค่เรื่องความเห็นแก่ตัวเพียงอย่างเดียว แต่เป็นเรื่องของโครงสร้างแรงจูงใจที่ทำให้การตัดสินใจที่ดูมีเหตุผลในระดับปัจเจก กลับสร้างผลลัพธ์ที่แย่ในระดับส่วนรวม

ที่มาภาพ: https://www.socialsciencespace.com/2015/05/the-game-theorist-john-nash-1928-2015/

เรื่องการใช้ AI แทนคนก็เหมือนกัน คือ paper นี้เขาสรุปว่า ทุกบริษัทต่างรู้ดีว่าการที่ทุกบริษัทเอา AI มาใช้แทนคนนั้นจะพาทั้งระบบให้มุ่งไปสู่ความชิบหาย และทุกคนควรจะเลิกทำเช่นนั้น แต่ใครจะเป็นคนเลิกล่ะ แล้วฉันเลิกแล้วคนอื่นไม่เลิกล่ะ แถมถ้ามีคนอื่นเลิกก่อน ถ้าเราไม่เลิกก็จะยิ่งดีกับเราด้วยซ้ำ

พอตามทันไหมฮะ

ถ้าอย่างงั้นทางออกคืออะไร

paper ลองพิจารณาหลายนโยบายเพื่อปรับโครงสร้างแรงจูงใจ เพื่อขยับให้จุดที่เป็นสมดุลของแนชนั้นเข้าใกล้ภาวะที่ทั้งสังคมได้ประโยชน์สูงสุดมากที่สุด โดยใช้เครื่องมือหลายอย่าง เช่น

การทำ upskilling / retraining ซึ่งคือการฝึกทักษะใหม่ให้คนที่ถูก AI แทนที่ เพื่อให้กลับไปมีรายได้เร็วขึ้น
การทำ UBI หรือรายได้พื้นฐานถ้วนหน้า ที่รัฐจ่ายเงินให้ทุกคนเพื่อให้คนยังมีกำลังซื้อแม้ตกงาน
การเก็บ capital income tax หรือภาษีจากกำไรหรือรายได้ของเจ้าของทุน ซึ่ง paper มองว่าไม่แก้แรงจูงใจในการใช้ AI โดยตรง
การสร้าง worker equity หรือการให้แรงงานมีส่วนแบ่งในกำไรหรือหุ้นของบริษัท เพื่อให้ผลประโยชน์จาก AI ไหลกลับไปหาแรงงานบางส่วน
การทำ Coasean bargaining หรือการให้บริษัทต่าง ๆ ตกลงกันเองว่าจะไม่ automate เกินไป แต่ปัญหาคือแต่ละบริษัทยังมีแรงจูงใจให้เบี้ยวข้อตกลง
และ automation tax หรือภาษีต่อการใช้ AI แทนแรงงาน

ซึ่ง paper สรุปว่ามีแต่ automation tax เท่านั้นแหละ ที่พอจะเวิร์กในสถานการณ์นี้

ไอเดียคือ ถ้าบริษัทหนึ่งใช้ AI แล้วทำให้กำลังซื้อของทั้งตลาดหายไป บริษัทนั้นควรต้องจ่ายต้นทุนส่วนที่ตัวเองโยนไปให้คนอื่นกลับเข้ามาในระบบ ภาษีนี้จึงทำให้ต้นทุนส่วนตัวของบริษัทใกล้เคียงกับต้นทุนจริงของสังคมมากขึ้น

ถ้าออกแบบได้ถูกต้อง ภาษีนี้จะทำให้บริษัทใช้ AI มาแทนคนในระดับที่เหมาะสมในภาพรวม ไม่ใช่ระดับที่แต่ละบริษัทอยากทำเมื่อคิดแค่ผลประโยชน์ของตัวเอง และรายได้จากภาษีอาจเอาไปใช้กับการช่วยคนที่ถูกแทนที่ เพื่อทำให้กำลังซื้อที่หายไปกลับมาเร็วขึ้น

ซึ่งผมไม่ใช่ผู้เชี่ยวชาญด้านเศรษฐศาสตร์อ่ะเนอะ ก็เลยน่าจะแสดงความเห็นอะไรมากไม่ได้ แต่สิ่งที่ต้องไม่ลืมก็คือ เขาทำทั้งหมดนี้บนโมเดล และโลกจริงนั้นซับซ้อนกว่าโมเดลมาก ทั้งเรื่องตลาดแรงงาน งานใหม่ที่อาจเกิดขึ้น ความเร็วของการปรับตัว และการใช้ AI ที่ไม่ได้มีแค่การแทนคนอย่างเดียว

แต่ผมคิดว่า paper นี้ก็น่าสนใจดี เพราะมันชี้ให้เห็นมุมที่สำคัญมากอย่างนึง ว่าสถานการณ์จริง ๆ ของปัญหาเรื่องการใช้ AI แทนคนนี้อาจจะไม่ใช่ “ไม่มีใครรู้ว่ากำลังเกิดอะไรขึ้น” แต่เป็น “ทุกคนรู้แหละ แต่ไม่มีใครมีแรงจูงใจให้หยุดมัน” มากกว่า

และแรงจูงใจที่ว่านั้นอาจต้องเป็นกฎหมาย หรือมาตรการบางอย่างจากทางรัฐ ซึ่งก็ไม่แน่ใจเหมือนกันว่าเข้าใจเรื่องนี้มากแค่ไหน

และเช่นเดิม ใครที่อยากสนับสนุนเพจเว็บไซต์ของเรา ให้ผลิตคอนเทนต์คณิตศาสตร์แบบนี้ต่อไป ก็สามารถสมัครเป็นสมาชิกรายเดือนได้โดยกดปุ่ม 'สมัครสมาชิก' ได้เลยนะฮะ

เอกสารอ้างอิง
https://arxiv.org/pdf/2603.20617
https://www.britannica.com/science/game-theory/The-prisoners-dilemma
https://www.investopedia.com/articles/investing/110513/utilizing-prisoners-dilemma-business-and-economy.asp
http://math.uchicago.edu/~shmuel/AAT-readings/Econ%20segment/Osborne,%20Game%20Theory,%20nash.pdf
https://www.schroders.com/en/global/individual/insights/what-the-prisoners-dilemma-tells-us-about-climate-change/

Prisoner’s Dilemma ของการใช้ AI แทนคน

Read next

มอง Insider ด้วยคณิตศาสตร์

เกม XO นั้นน่าเบื่อมาก ถึงจะเพิ่มเป็น 3 มิติแล้วก็เถอะ

จะเกิดอะไรขึ้นเมื่อบนชายหาดมีร้านไอติมมากกว่า 2 ร้าน