Mode (yếu vị) là giá trị hoặc nhóm giá trị xuất hiện với tần số cao nhất trong một tập dữ liệu. Trong thống kê cơ bản, mode là một trong ba đại lượng đo xu hướng trung tâm cốt lõi, bên cạnh trung bình cộng (mean) và trung vị (median). Điểm đặc biệt của mode: đây là đại lượng duy nhất có thể dùng được cho cả dữ liệu định tính (màu sắc, sở thích, nghề nghiệp) — điều mà mean và median không làm được.
Mode Là Gì? Định Nghĩa Trong Thống Kê
Mode (hay còn gọi là yếu vị hoặc giá trị thường gặp nhất) là giá trị xuất hiện nhiều lần nhất trong tập dữ liệu. Nếu không có giá trị nào lặp lại (mỗi giá trị chỉ xuất hiện một lần), tập dữ liệu đó không có mode.
Ký hiệu: Mode thường được viết là Mo hoặc Md (không nhầm với Median).
Ví dụ đơn giản:
Điểm kiểm tra của 8 học sinh: 6, 7, 7, 8, 7, 9, 8, 7
Đếm tần số: 6→1 lần, 7→4 lần, 8→2 lần, 9→1 lần
Mode = 7 (xuất hiện 4 lần, nhiều nhất)
Cách Tìm Mode Trong Tập Dữ Liệu
Bước 1: Lập bảng tần số
Đếm số lần xuất hiện của mỗi giá trị. Giá trị có tần số cao nhất là mode.
Bước 2: Xác định loại mode
- Unimodal (một đỉnh): Có đúng một giá trị có tần số cao nhất.
- Bimodal (hai đỉnh): Có hai giá trị cùng có tần số cao nhất.
- Multimodal (nhiều đỉnh): Có từ 3 mode trở lên.
- Không có mode: Mọi giá trị đều xuất hiện đúng một lần.
Unimodal, Bimodal Và Multimodal Là Gì?
Unimodal — Dữ liệu một đỉnh
Dữ liệu: 3, 4, 5, 5, 5, 6, 7, 8
Mode = 5 (xuất hiện 3 lần). Đây là phân phối unimodal — phổ biến nhất trong thực tế.
Bimodal — Dữ liệu hai đỉnh
Dữ liệu: 2, 3, 3, 4, 5, 6, 6, 7, 8
Mode = 3 và 6 (mỗi giá trị xuất hiện 2 lần). Phân phối bimodal thường gặp khi có hai nhóm khác nhau trong dữ liệu.
Ví dụ thực tế: Chiều cao của dân số gồm cả nam và nữ thường có phân phối bimodal — một đỉnh cho chiều cao nam trung bình (~168cm) và một đỉnh cho nữ (~156cm).
Multimodal — Dữ liệu nhiều đỉnh
Dữ liệu: 1, 2, 2, 3, 4, 4, 5, 6, 6, 7
Mode = 2, 4 và 6 (mỗi giá trị xuất hiện 2 lần). Phân phối multimodal thường chỉ có ý nghĩa khi có lý do rõ ràng cho các nhóm con.
Ví Dụ Tính Mode Trong Thực Tế
Ví dụ 1: Khảo sát sở thích màu sắc
| Màu sắc | Số người chọn | Tần suất (%) |
|---|---|---|
| Xanh lam | 45 | 45% |
| Đỏ | 28 | 28% |
| Xanh lá | 17 | 17% |
| Vàng | 10 | 10% |
| Tổng | 100 | 100% |
Mode = Xanh lam (45 người chọn, nhiều nhất). Đây là ví dụ điển hình dữ liệu định tính — không thể tính mean hay median, chỉ có thể dùng mode.
Ví dụ 2: Số giày phổ biến nhất
Một cửa hàng giày ghi lại size giày bán trong tuần: 38, 39, 40, 40, 40, 41, 41, 42, 39, 40, 43, 40
Đếm: 38→1, 39→2, 40→5, 41→2, 42→1, 43→1
Mode = 40 — cửa hàng nên nhập nhiều hàng size 40 nhất.
Đây là ứng dụng mode trong quản lý tồn kho — thực tế hơn nhiều so với size trung bình.
Ví dụ 3: Điểm thi phổ biến nhất trong lớp
Điểm cuối kỳ của 20 học sinh: 5, 6, 6, 7, 7, 7, 7, 8, 8, 8, 8, 8, 9, 9, 9, 10, 10, 6, 7, 8
Đếm: 5→1, 6→3, 7→5, 8→6, 9→3, 10→2
Mode = 8 — điểm 8 phổ biến nhất trong lớp.
Giáo viên có thể dùng mode để đánh giá: nếu mode thấp hơn kỳ vọng, đề thi có thể quá khó.
So Sánh Mode, Mean Và Median
| Tiêu chí | Mode (Yếu vị) | Mean (Trung bình) | Median (Trung vị) |
|---|---|---|---|
| Định nghĩa | Giá trị lặp nhiều nhất | Tổng / n | Giá trị giữa (đã sắp xếp) |
| Dùng cho dữ liệu định tính | ✅ Có | ❌ Không | ✅ Thứ tự (ordinal) |
| Ảnh hưởng bởi outlier | ❌ Không | ✅ Rất cao | ❌ Thấp |
| Phải sắp xếp dữ liệu | Không (chỉ đếm) | Không | ✅ Có |
| Có thể có nhiều giá trị | ✅ Có (bimodal…) | ❌ Luôn một giá trị | ❌ Luôn một giá trị |
| Có thể không tồn tại | ✅ Có thể | ❌ Luôn tồn tại | ❌ Luôn tồn tại |
| Ứng dụng | Khảo sát, phân loại, thời trang, bán lẻ | Điểm thi, tài chính, khoa học | Thu nhập, nhà đất, y tế |
Ứng Dụng Thực Tế Của Mode Trong Kinh Doanh Và Cuộc Sống
Ngành thời trang và bán lẻ
Các thương hiệu thời trang phân tích mode của size quần áo để quyết định số lượng sản xuất mỗi size. Nếu size M là mode, nhà máy sẽ sản xuất nhiều size M hơn.
Marketing và khảo sát khách hàng
Khi hỏi “Bạn thích kênh mua sắm nào?” với các lựa chọn: Online / Cửa hàng / Ứng dụng di động — câu trả lời phổ biến nhất (mode) sẽ là kênh cần đầu tư nhiều nhất.
Y tế và dịch tễ học
Nhóm tuổi phổ biến nhất (modal age group) mắc một bệnh nào đó giúp cơ quan y tế tập trung nguồn lực vào nhóm nguy cơ cao nhất.
Phân tích kết quả khảo sát Likert
Thang đo Likert (1=Rất không đồng ý → 5=Rất đồng ý) cho ra dữ liệu thứ tự. Mode của các câu trả lời cho biết mức độ phổ biến nhất của phản hồi.
Mode Trong Excel Và Google Sheets
=MODE(A1:A20)— trả về mode duy nhất (nếu nhiều mode, chỉ trả về mode nhỏ nhất)=MODE.MULT(A1:A20)— trả về tất cả các mode (nhập bằng Ctrl+Shift+Enter trong Excel cũ)=COUNTIF(A1:A20, MODE(A1:A20))— đếm tần số của mode
Lưu ý: Với dữ liệu định tính (văn bản), Excel không có hàm MODE trực tiếp. Dùng COUNTIF kết hợp MAX và INDEX/MATCH để tìm giá trị văn bản xuất hiện nhiều nhất.
Mode Và Phần Trăm Trong Phân Tích Dữ Liệu
Khi phân tích kết quả khảo sát, mode thường được trình bày kèm tần suất (%) để thấy mức độ phổ biến:
Ví dụ: “Size M là size phổ biến nhất, chiếm 35% tổng doanh số” — con số 35% chính là tần suất tương đối của mode.
Để tính nhanh các tỉ lệ phần trăm này, hãy dùng công cụ tính phần trăm — tiện lợi cho mọi bài toán phân tích dữ liệu hàng ngày.
Câu Hỏi Thường Gặp (FAQ)
Tập dữ liệu có thể không có mode không?
Có. Nếu tất cả các giá trị trong tập dữ liệu xuất hiện đúng một lần (không có giá trị nào lặp lại), tập đó không có mode. Ví dụ: 2, 5, 8, 11, 14 — không giá trị nào lặp lại, không có mode.
Khi có 2 mode (bimodal), mode nào đúng?
Cả hai đều đúng. Phân phối bimodal có hai mode, và cả hai đều là câu trả lời hợp lệ. Ví dụ: nếu điểm thi có hai nhóm thường gặp là 6 và 9, đây có thể là dấu hiệu của hai nhóm học sinh có trình độ khác nhau.
Mode khác gì so với giá trị trung bình trong bài toán thực tế?
Mean cho biết giá trị “tổng hợp” trung bình của toàn bộ dữ liệu. Mode cho biết giá trị “phổ biến nhất”. Trong bài toán định giá sản phẩm: mean giá có thể là 350.000đ, nhưng mode là 299.000đ — nghĩa là mức giá được chọn mua nhiều nhất là 299.000đ, thông tin hữu ích hơn cho định giá marketing.
Mode có thể âm không?
Hoàn toàn có thể. Mode chỉ là giá trị xuất hiện nhiều nhất — có thể là số âm, số thập phân, hoặc bất kỳ giá trị nào. Ví dụ: nhiệt độ thay đổi hàng ngày tháng 12 ở Hà Nội có thể có mode là -2°C nếu đây là mức nhiệt độ xuất hiện nhiều ngày nhất.
Tại sao mode ít được dạy hơn mean và median trong chương trình phổ thông?
Mean và median có tính chất toán học phong phú hơn (dùng được trong phép tính tiếp theo, có công thức rõ ràng), nên thường được ưu tiên trong giáo dục phổ thông. Nhưng trong thực tế kinh doanh và marketing, mode thường quan trọng không kém — đặc biệt với dữ liệu định tính và hành vi người dùng.
Kết Luận
Mode (yếu vị) là đại lượng thống kê đơn giản nhưng có ứng dụng thực tiễn sâu rộng, đặc biệt trong bối cảnh dữ liệu định tính ngày càng phổ biến (dữ liệu người dùng, khảo sát, hành vi tiêu dùng). Hiểu rõ mode, biết khi nào có bimodal/multimodal, và so sánh mode với mean/median sẽ giúp bạn phân tích dữ liệu toàn diện hơn.
Để nắm trọn bộ công cụ thống kê mô tả, đọc thêm về phương sai và độ lệch chuẩn — đo lường sự phân tán — và cách lập bảng tần số để tổ chức dữ liệu trước khi tìm mode. Xem thêm tổng quan tại hướng dẫn thống kê cơ bản.
🔢 Dùng ngay công cụ tính % tại phantram.online — Tính tần suất tương đối (%) của mode và các giá trị trong tập dữ liệu của bạn!