Tần suất là tỉ lệ (hoặc phần trăm) biểu thị mức độ xuất hiện của một giá trị trong tập dữ liệu so với tổng số quan sát. Còn tần số là số lần một giá trị xuất hiện. Cặp khái niệm tần số — tần suất là nền tảng để lập bảng tần số và vẽ biểu đồ cột — hai công cụ cốt lõi trong thống kê cơ bản. Hiểu rõ tần suất và tần số giúp bạn tóm tắt tập dữ liệu lớn thành dạng dễ đọc, phân tích và trình bày.
Tần Số Và Tần Suất Là Gì? Phân Biệt Rõ Ràng
Tần số (Frequency) là gì?
Tần số là số lần (số lượt) một giá trị cụ thể xuất hiện trong tập dữ liệu. Tần số là con số tuyệt đối, thường ký hiệu là f hoặc n.
Ví dụ: Trong danh sách điểm: 5, 6, 7, 7, 8, 7, 9, 6, 7, 8
Tần số của điểm 7 = 4 (xuất hiện 4 lần)
Tần suất (Relative Frequency) là gì?
Tần suất tương đối là tỉ lệ của tần số so với tổng số quan sát, thường tính theo phần trăm. Tần suất cho biết “giá trị này chiếm bao nhiêu % trong toàn bộ dữ liệu?”
Tần suất (%) = (Tần số / Tổng số quan sát) × 100%
Ví dụ tiếp: Điểm 7 có tần số 4, tổng = 10
Tần suất điểm 7 = (4/10) × 100% = 40%
Tần suất tích lũy (Cumulative Frequency) là gì?
Tần suất tích lũy là tổng tần suất của một giá trị và tất cả các giá trị nhỏ hơn nó. Nó cho biết “bao nhiêu % dữ liệu có giá trị ≤ X?”
Hướng Dẫn Lập Bảng Tần Số Step-by-Step
Ví dụ 1: Điểm kiểm tra toán của 20 học sinh
Dữ liệu gốc (raw data):
7, 5, 8, 9, 7, 6, 8, 7, 10, 5, 6, 7, 8, 9, 7, 6, 8, 5, 7, 9
Bước 1: Xác định tất cả giá trị có thể xuất hiện: 5, 6, 7, 8, 9, 10
Bước 2: Đếm tần số mỗi giá trị:
5 → đếm: 5, 5, 5 → tần số = 3
6 → đếm: 6, 6, 6 → tần số = 3
7 → đếm: 7, 7, 7, 7, 7, 7 → tần số = 6
8 → đếm: 8, 8, 8, 8 → tần số = 4
9 → đếm: 9, 9, 9 → tần số = 3
10 → đếm: 10 → tần số = 1
Bước 3: Lập bảng tần số đầy đủ:
| Điểm (xᵢ) | Tần số (fᵢ) | Tần suất (%) | Tần số tích lũy | Tần suất tích lũy (%) |
|---|---|---|---|---|
| 5 | 3 | 15% | 3 | 15% |
| 6 | 3 | 15% | 6 | 30% |
| 7 | 6 | 30% | 12 | 60% |
| 8 | 4 | 20% | 16 | 80% |
| 9 | 3 | 15% | 19 | 95% |
| 10 | 1 | 5% | 20 | 100% |
| Tổng | 20 | 100% | – | – |
Đọc hiểu bảng:
- Điểm 7 là điểm phổ biến nhất (mode = 7), chiếm 30% học sinh.
- 60% học sinh đạt điểm ≤ 7 (tần suất tích lũy của điểm 7).
- 80% học sinh đạt điểm ≤ 8 — chỉ 20% đạt 9-10.
Bảng Tần Số Nhóm — Khi Dữ Liệu Liên Tục
Khi dữ liệu liên tục hoặc có nhiều giá trị khác nhau, ta nhóm vào các khoảng (class intervals). Ví dụ: điểm thi 0-100, chiều cao, cân nặng.
Ví dụ 2: Khảo sát thời gian học bài mỗi ngày (phút) của 30 học sinh
Dữ liệu: 45, 60, 30, 90, 120, 75, 60, 45, 80, 100, 30, 55, 70, 90, 60, 45, 85, 110, 50, 70, 60, 40, 95, 75, 60, 55, 80, 100, 45, 65
Chọn khoảng nhóm: 30 phút (0-30, 31-60, 61-90, 91-120)
| Khoảng thời gian (phút) | Tần số | Tần suất (%) | Tần suất tích lũy (%) |
|---|---|---|---|
| 30 – 60 | 12 | 40% | 40% |
| 61 – 90 | 11 | 36.7% | 76.7% |
| 91 – 120 | 7 | 23.3% | 100% |
| Tổng | 30 | 100% | – |
Nhận xét: 40% học sinh học dưới 1 giờ/ngày. 76.7% học dưới 90 phút/ngày. Chỉ 23.3% học trên 90 phút.
Biểu Đồ Cột (Histogram) Từ Bảng Tần Số
Bảng tần số là nền tảng để vẽ biểu đồ cột (bar chart cho dữ liệu rời rạc, histogram cho dữ liệu liên tục). Các đặc điểm cần chú ý:
- Trục ngang (X): Các giá trị hoặc khoảng giá trị
- Trục dọc (Y): Tần số hoặc tần suất (%)
- Chiều cao cột: Thể hiện tần số hoặc tần suất của mỗi giá trị
- Đường tần suất tích lũy (ogive): Đường cong nối các điểm tần suất tích lũy
Đọc biểu đồ cột như thế nào?
- Cột cao nhất = giá trị có tần số lớn nhất = mode
- Hình dạng phân phối: chuẩn (hình chuông), lệch trái, lệch phải, bimodal
- Khoảng trống giữa các cột có thể là outlier hoặc khoảng thiếu dữ liệu
Ứng Dụng Tần Suất Trong Thực Tế
Khảo sát khách hàng
Sau khi thu thập đánh giá sản phẩm từ 500 khách hàng (thang 1-5), lập bảng tần số cho thấy phần lớn (68%) đánh giá 4-5 sao — thông tin trực tiếp về mức độ hài lòng, hữu ích hơn nhiều so với chỉ nhìn vào điểm trung bình.
Phân tích kết quả thi quốc gia
Bộ GD-ĐT công bố bảng phân phối điểm thi THPT — đây chính là bảng tần suất. Từ đây có thể thấy: bao nhiêu % học sinh đạt 7+ điểm, điểm nào phổ biến nhất, phổ điểm của từng môn.
Phân tích hành vi người dùng website
Bảng tần số thời gian truy cập: bao nhiêu % người dùng ở lại dưới 1 phút (bounce rate), 1-3 phút, trên 3 phút. Thông tin này quyết định chiến lược cải thiện UX.
Cách Lập Bảng Tần Số Trong Excel
- Dữ liệu rời rạc: Dùng COUNTIF cho từng giá trị:
=COUNTIF($A$1:$A$20, B1) - Dữ liệu nhóm: Dùng FREQUENCY array formula:
{=FREQUENCY(data, bins)}(nhập Ctrl+Shift+Enter) - Tần suất (%): Chia tần số cho tổng:
=C2/SUM($C$2:$C$7)*100 - Tần số tích lũy: Cộng dồn:
=D2+C3(từ hàng 3 trở xuống) - Biểu đồ: Chọn dữ liệu → Insert → Bar Chart hoặc Histogram
Tần Suất Và Tỉ Lệ Phần Trăm — Liên Hệ Mật Thiết
Tần suất tương đối thực chất chính là tỉ lệ phần trăm. Mỗi khi bạn nói “40% học sinh đạt điểm 7”, bạn đang dùng tần suất theo dạng phần trăm. Đây là ngôn ngữ thống kê phổ biến nhất trong báo cáo và trình bày dữ liệu.
Để tính nhanh tần suất (%) từ tần số, hãy dùng công cụ tính phần trăm tại phantram.online — nhập tần số và tổng số quan sát, ra ngay tần suất %.
Đọc thêm về cách ứng dụng phần trăm trong phân tích thống kê tại bài: Tỉ lệ phần trăm trong thống kê.
Câu Hỏi Thường Gặp (FAQ)
Tần số và tần suất khác nhau ở điểm nào?
Tần số là con số tuyệt đối (số lần xuất hiện). Tần suất là con số tương đối (tỉ lệ so với tổng). Ví dụ: điểm 7 có tần số 6 và tần suất 30% (trong tổng 20 học sinh). Khi so sánh giữa các nhóm có kích thước khác nhau, phải dùng tần suất, không dùng tần số.
Bảng tần số nhóm nên có bao nhiêu khoảng?
Quy tắc Sturges: Số khoảng ≈ 1 + 3.322 × log₁₀(n). Với n = 30: ≈ 5-6 khoảng. Với n = 100: ≈ 7-8 khoảng. Thực tế, thường chọn 5-10 khoảng sao cho mỗi khoảng có ít nhất 5 quan sát.
Tần suất tích lũy dùng để làm gì?
Tần suất tích lũy cho biết “bao nhiêu % dữ liệu có giá trị ≤ X”. Ứng dụng: tìm phân vị (percentile), median (điểm có tần suất tích lũy = 50%), Q1 (25%) và Q3 (75%). Đường ogive (đường tần suất tích lũy) giúp trực quan hóa phân phối tích lũy.
Histogram và biểu đồ cột có khác nhau không?
Có. Biểu đồ cột (bar chart) dùng cho dữ liệu rời rạc hoặc định tính — các cột không chạm nhau. Histogram dùng cho dữ liệu liên tục được nhóm — các cột chạm nhau vì các khoảng liên tiếp. Đây là phân biệt kỹ thuật quan trọng trong trình bày dữ liệu.
Tần suất tích lũy và phân vị liên hệ như thế nào?
Trực tiếp. Phân vị thứ p (p-th percentile) là giá trị có tần suất tích lũy = p%. Median = phân vị 50%, Q1 = phân vị 25%, Q3 = phân vị 75%. Bảng tần suất tích lũy là công cụ đọc phân vị trực tiếp mà không cần sắp xếp toàn bộ dữ liệu.
Kết Luận
Bảng tần số và tần suất là bước đầu tiên và quan trọng nhất trong mọi phân tích dữ liệu. Từ bảng tần số, bạn có thể xác định mode, ước tính median, vẽ biểu đồ, và nhận diện phân phối dữ liệu. Đây là nền tảng để tiến lên các phân tích phức tạp hơn như kiểm định giả thuyết và phân tích hồi quy.
Xem lại tổng quan đầy đủ về tất cả các đại lượng thống kê tại hướng dẫn thống kê cơ bản từ A-Z.
🔢 Dùng ngay công cụ tính % tại phantram.online — Tính nhanh tần suất (%) từ tần số và tổng số quan sát, phục vụ lập bảng tần số chính xác!