ในการเป็น Data Scientist คุณไม่สามารถเลี่ยงคณิตศาสตร์ได้ เพราะมันคือเครื่องมือในการวินิจฉัยปัญหา ส่งผลต่อการเลือกกระบวนการวิเคราะห์ และช่วยให้เราเข้าใจว่า "ทำไม" เราถึงได้ผลลัพธ์แบบนั้น
- การเลือกขั้นตอน (Procedures): ช่วยให้รู้ว่าควรใช้สูตรหรือวิธีการใดเพื่อให้ได้คำตอบที่แม่นยำที่สุด
- การแก้ปัญหา (Troubleshooting): เมื่อระบบคำนวณค่าที่ "เป็นไปไม่ได้" ออกมา คณิตศาสตร์จะช่วยให้เราพบจุดบกพร่อง
- ความรวดเร็ว: บางครั้งการคำนวณด้วยมือ (Conceptual Level) เร็วกว่าการรอคอมพิวเตอร์ประมวลผล
เปรียบเสมือนรากฐานของทุกอย่าง ช่วยในการรวมคะแนนจากหลายปัจจัยมาเป็นผลลัพธ์เดียว เช่น
- สมการรายได้ (Salary Example): yi=β0+β1x1i+β2x2i+β3x3i+ϵi
- yi: ผลลัพธ์ (เช่น เงินเดือน)
- β0: ค่าคงที่พื้นฐาน (Intercept)
- β1,β2,...: สัมประสิทธิ์หรือน้ำหนักของแต่ละปัจจัย (เช่น อายุงาน, ทักษะ)
- ϵi: ค่าความคลาดเคลื่อน (Error Term)
"เครื่องจักรชอบเมทริกซ์" พีชคณิตเชิงเส้นช่วยให้เราจัดการกับข้อมูลมหาศาลได้ในรูปแบบที่กะทัดรัด
- Scalar: ตัวเลขเดี่ยว
- Vector: แถวหรือคอลัมน์ของตัวเลข (ตัวแทนของตัวแปร)
- Matrix: ตารางตัวเลข (แถวและคอลัมน์) ที่รวมข้อมูลของหลายคนและหลายตัวแปรไว้ด้วยกัน
- ประโยชน์: ช่วยให้คอมพิวเตอร์คำนวณข้อมูลนับล้านชุดพร้อมกันได้อย่างรวดเร็ว
ใช้เมื่อเรามีตัวแปรที่ไม่ทราบค่าหลายตัวที่สัมพันธ์กัน (เช่น x ขึ้นอยู่กับ y และ y ขึ้นอยู่กับ x)
- ตัวอย่างการขายเคส iPhone: หากเรารู้ยอดขายรวมและรายได้รวม เราสามารถใช้ระบบสมการหาได้ว่าขายสินค้าแต่ละราคาไปกี่ชิ้น
- การหาคำตอบ: ทำได้ทั้งการคำนวณทางพีชคณิตและการวาดกราฟเพื่อหา "จุดตัด" (Intersection) ซึ่งคือคำตอบของระบบนั่นเอง
แคลคูลัสคือพื้นฐานของสถิติเกือบทุกประเภท และจำเป็นมากหากข้อมูลมีการเปลี่ยนแปลงตามเวลา
- Differential Calculus: วัดอัตราการเปลี่ยนแปลง ณ เวลาใดเวลาหนึ่ง (ความชันของเส้นโค้ง)
- Integral Calculus: คำนวณปริมาณสะสมจากอัตราการเปลี่ยนแปลง
นี่คือจุดที่คณิตศาสตร์มาเจอกับโลกแห่งความเป็นจริง เพื่อใช้ในการ "ทำเงิน" หรือ "ลดต้นทุน"
- ตัวอย่างการตั้งราคาแอปหาคู่: เราใช้แคลคูลัส (การหาอนุพันธ์หรือ Derivative) เพื่อหาจุดที่ "รายได้รวมสูงสุด" * โดยการหาจุดที่ความชันของกราฟรายได้เท่ากับ 0 (จุดสูงสุดของโค้ง) เพื่อบอกว่าควรตั้งราคาสมาชิกเท่าไหร่ถึงจะได้กำไรมากที่สุด (แม้ราคาจะถูกลง แต่ยอดขายที่เพิ่มขึ้นอาจทำเงินได้มากกว่า)
"เป้าหมายของ Data Science คือการหา 'ความหมาย' (Meaning) จากข้อมูลเพื่อการตัดสินใจที่ถูกต้อง คณิตศาสตร์คือทางผ่านไปสู่ความหมายนั้น และเชื่อเถอะ... คุณทำได้!"