ฉันเป็นคน independent อะไรที่อยู่ในกระแสฉันไม่ทำหรอกนะ
Independence หรือความเป็นอิสระ เป็นคอนเซ็ปที่สำคัญในวิชาสถิติ ที่นักเรียนมักจะเข้าใจผิดกันอยู่บ่อย ๆ ซึ่งอาจจะเป็นเพราะสับสนกับภาษาปาก
เพราะเวลาพูดว่าคำว่าอิสระในภาษาปาก มันแอบให้ภาพการไม่เป็นเกิดสิ่งนั้นอีก เช่นเป็นอิสระจากการถูกคุมขัง ก็คือไม่ถูกคุมขัง หรือเป็นอิสระจากการศึกษา ก็คือเรียนจบแล้ว หรืออะไรประมาณนี้
แต่ในสถิติ คำว่าอิสระจากอะไรสักอย่าง ไม่ได้แปลว่า 'ไม่เกิดสิ่งนั้น' แต่แปลว่า 'ไม่ว่าสิ่งนั้นจะเกิดหรือไม่เกิด ก็ไม่ได้มีผลอะไรกับฉัน' ต่างหาก
เช่นถ้าบอกว่าใครสักคนแต่งตัวแบบเป็นอิสระจากกระแส ไม่ได้แปลว่าเขาห้ามแต่งตัวเหมือนหรือต่างจากกระแส แต่แปลว่าเขาจะแต่งแบบไหนก็ได้ ไม่ว่ามันจะอยู่หรือไม่อยู่ในกระแสก็ตาม
พูดให้เป็นคณิตศาสตร์หน่อย เราจะพูดว่าเหตุการณ์ A นั้นเป็นอิสระจาก B เมื่อ
P(A|B) = P(A)
ซึ่งแปลว่า ความน่าจะเป็นที่ A จะยังคงเท่าเดิม ไม่ว่า B จะเกิดหรือไม่ก็ตาม หรือพูดในอีกมุมคือ การเกิดหรือไม่เกิด B นั้นไม่ได้ส่งผลอะไรต่อโอกาสเกิด B แม้แต่น้อย โดยสิ่งที่สำคัญคือ เราจะพูดว่าเป็นอิสระลอย ๆ ไม่ได้ ต้องบอกด้วยว่าเป็นอิสระจากอะไร
ส่วนสถานการณ์ที่ถ้าเกิด B แล้วจะไม่เกิด A แน่นอนนั้นเรียกว่าเหตุการณ์ที่ไม่เกิดร่วมกัน หรือ disjoint event ต่างหาก
ซึ่งเอาจริงพอลองคิดดี ๆ คำว่าอิสระในความหมายทางสถิตินี้ก็สอดคล้องกับโลกความเป็นจริงอยู่นะ กลับมาที่ตัวอย่างเรื่องการแต่งตัวเมื่อตะกี้ก็ได้ ถ้าใครสักคนเป็นคนที่จะไม่ยอมแต่งตัวตามกระแสเด็ดขาด เราจะเรียกว่าเขาเป็นอิสระจากกระแสได้จริง ๆ หรอ การไม่ยอมทำตามอะไรสักอย่าง ก็แปลว่าเราถูกสิ่งนั้นควบคุมอยู่ในทางตรงกันข้ามหรือเปล่า
หรือการพูดว่าใครสักคนเป็นอิสระจากการศึกษา ก็ไม่ได้แปลว่าเขาห้ามเรียนหนังสือต่ออีกเลยนี่นา เขาแค่ไม่ได้ถูกบังคับให้เรียน แต่ก็ไม่ได้ถูกบังคับให้ไม่เรียนเหมือนกัน จะเรียนก็ได้ ไม่เรียนก็ได้ ถูกไหมฮะ
การเข้าใจความหมายของความเป็นอิสระต่อกันให้ถูกต้องนั้นสำคัญมากต่อมุมมองต่าง ๆ ในโลกความเป็นจริง เช่นหากเราเข้าใจว่าหวยแต่งวดนั้นเป็นอิสระต่อกัน แต่อัตราการเสียชีวิตบนท้องถนนแต่ละเดือนนั้นไม่ เราจะเข้าใจทันทีว่าทำไมสถิติถึงใช้ทำนายหวยไม่ได้ แต่ใช้ทำนายอัตราการเสียชีวิตบนท้องถนนได้
ในกรณีของหวย หวยแต่ละงวดไม่ได้จดจำอะไรจากงวดก่อนหน้าเลย โอกาสของเลขแต่ละตัวจึงเท่าเดิมทุกครั้ง ต่อให้เลขเดิมเพิ่งออกไป งวดถัดไปก็ไม่ได้มีโอกาสออกน้อยลงหรือมากขึ้น หรือพูดแบบคณิตศาสตร์ก็คือ ผลของงวดนี้เป็นอิสระจากงวดก่อนหน้า ทำให้ข้อมูลอดีตไม่ได้ช่วยอะไรในการทำนายอนาคต
แต่ในทางกลับกัน อัตราการเสียชีวิตบนท้องถนนไม่ได้เกิดแบบสุ่มล้วน ๆ มันมีโครงสร้าง มีปัจจัยที่ค่อนข้างต่อเนื่องอยู่ เช่น จำนวนรถบนถนน พฤติกรรมการขับขี่ สภาพเศรษฐกิจ นโยบายความปลอดภัย หรือแม้แต่ฤดูกาล สิ่งเหล่านี้ไม่ได้หายไปเมื่อจบเดือน แต่มักจะค่อย ๆ เปลี่ยน ทำให้ข้อมูลในอนาคตนั้นไม่ได้อิสระจากข้อมูลในอดีต
การเข้าใจว่าอะไรบ้างที่อิสระและไม่อิสระต่อกัน จะทำให้เราเข้าใจว่าทำไมโพลล์บางครั้งถึงไม่แม่น ทำไมตอนตรวจโควิดซ้ำ ๆ ถึงควรใช้ชุดตรวจคนละยี่ห้อ เข้าใจว่าปรากฎการณ์นักบาสที่กำลังมือขึ้น (hot hand) นั้นไม่มีอยู่จริง และปรากฎการณ์อะไรต่อมิอะไรอีกมากมาย
และเช่นเดิม ใครที่อยากสนับสนุนเพจเว็บไซต์ของเรา ให้ผลิตคอนเทนต์คณิตศาสตร์แบบนี้ต่อไป ก็สามารถสมัครเป็นสมาชิกรายเดือนได้โดยกดปุ่ม 'สมัครสมาชิก' ได้เลยนะฮะ
เอกสารอ้างอิง
https://www.probabilitycourse.com/chapter1/1_4_1_independence.php
https://www.chinadaily.com.cn/a/202502/21/WS67b7bf78a310c240449d66c0.html
https://online.stat.psu.edu/stat200/lesson/1/1.2/1.2.1
https://thedecisionlab.com/biases/hot-hand-fallacy