Dãy số liệu thống kê
Bài viết về dãy số liệu thống kê toán lớp 3 cung cấp các khái niệm cơ bản về dãy số liệu và các phương pháp thống kê đơn giản để xử lý dữ liệu. Bài viết giúp các học sinh lớp 3 hiểu được cách sử dụng dữ liệu và đưa ra những kết luận thống kê đơn giản về dữ liệu đó. Ngoài ra, bài viết còn giúp các học sinh nắm được các khái niệm thống kê cơ bản như trung bình cộng, trung vị, phạm vi giá trị và độ lệch chuẩn.
Giới thiệu về dãy số liệu thống kê
Dãy số liệu thống kê thường là những tập hợp các số được sắp xếp theo thứ tự nhất định.
Ví dụ, một dãy số liệu có thể là số điểm của các học sinh trong một bài kiểm tra, chiều cao của các em học sinh trong lớp, hoặc số quả táo trong một rổ.
Các khái niệm thống kê cơ bản có thể áp dụng cho dãy số liệu này bao gồm:
-
Trung bình cộng: Là tổng của các số trong dãy chia cho số lượng phần tử. Trong môn toán lớp 3, trung bình cộng thường được tính để đại diện cho dãy số liệu. Ví dụ, trung bình cộng số điểm của các học sinh trong một bài kiểm tra sẽ cho biết độ khó của bài kiểm tra đó.
-
Trung vị: Là giá trị ở giữa của dãy số liệu sau khi đã được sắp xếp theo thứ tự tăng dần. Trong môn toán lớp 3, trung vị có thể được sử dụng để đại diện cho dãy số liệu khi không có trung bình cộng. Ví dụ, trung vị của chiều cao của các em học sinh trong lớp cho biết chiều cao trung bình của các em học sinh.
-
Phạm vi giá trị: Là khoảng cách giữa giá trị lớn nhất và giá trị nhỏ nhất trong dãy số liệu. Trong môn toán lớp 3, phạm vi giá trị thường được sử dụng để đo độ biến động của dữ liệu. Ví dụ, phạm vi giá trị của số quả táo trong một rổ cho biết số lượng táo trong rổ có thể khác nhau đáng kể.
-
Độ lệch chuẩn: Là một đại lượng thống kê dùng để đo sự phân tán của dữ liệu. Độ lệch chuẩn thường được sử dụng ở các lớp học cao hơn, nhưng cũng có thể được giới thiệu ở môn toán lớp 3.
Ví dụ:
a) Dãy số liệu: 2, 5, 7, 4, 6, 3, 8, 5, 9
Trong trường hợp này, dãy số liệu có 9 phần tử và phạm vi giá trị từ 2 đến 9. Để tính toán các thông số thống kê, chúng ta có thể sử dụng các công thức như sau:
-
Trung bình cộng (mean): Tổng của các số trong dãy chia cho số lượng phần tử. Trong trường hợp này: (2+5+7+4+6+3+8+5+9)/9 = 5.44 (làm tròn tới hai chữ số thập phân).
-
Trung vị (median): Sắp xếp các số trong dãy theo thứ tự tăng dần và chọn số ở giữa. Nếu số phần tử của dãy là số chẵn, thì trung vị là trung bình cộng của hai số ở giữa. Trong trường hợp này, sau khi sắp xếp dãy ta có: 2, 3, 4, 5, 5, 6, 7, 8, 9. Vì dãy có số phần tử lẻ nên trung vị là số thứ 5, tức là 5.
-
Độ lệch chuẩn (standard deviation): Độ lệch chuẩn là một đại lượng thống kê dùng để đo sự phân tán của dữ liệu. Công thức tính độ lệch chuẩn như sau: căn bậc hai của tổng bình phương khoảng cách của mỗi giá trị so với trung bình, chia cho số phần tử. Trong trường hợp này, ta cần tính trung bình cộng trước (xem công thức trên) và sau đó tính độ lệch chuẩn của dãy số liệu. Kết quả là khoảng 2.35 (làm tròn tới hai chữ số thập phân).
b) Giả sử có 10 học sinh và số điểm của mỗi học sinh như sau:
6, 7, 8, 9, 5, 7, 4, 6, 8, 7
Để phân tích dữ liệu thống kê, ta có thể tính trung bình cộng, trung vị và phạm vi giá trị của dãy số liệu này.
-
Trung bình cộng: Tổng số điểm của các học sinh là 67 (6 + 7 + 8 + 9 + 5 + 7 + 4 + 6 + 8 + 7), chia cho số lượng học sinh là 10, ta có trung bình cộng là 6.7.
-
Trung vị: Sắp xếp dãy số liệu theo thứ tự tăng dần, ta có: 4, 5, 6, 6, 7, 7, 7, 8, 8, 9. Trung vị của dãy số liệu là giá trị ở giữa, tức là 7.
-
Phạm vi giá trị: Giá trị nhỏ nhất trong dãy số liệu là 4, giá trị lớn nhất là 9. Vì vậy, phạm vi giá trị của dãy số liệu này là 5 (9 - 4).
Thông qua việc phân tích thống kê đơn giản, ta có thể rút ra những kết luận đơn giản về dữ liệu này, ví dụ như bài kiểm tra này có trung bình cộng là 6.7, trung vị là 7 và phạm vi giá trị là 5.
Bài tập
Bài 1: Cho dãy số liệu thống kê sau đây là số giờ ôn tập toán của 5 học sinh trong tuần: 1, 2, 2, 3, 3
-
Tính trung bình cộng của dãy số liệu trên.
-
Tìm giá trị lớn nhất và giá trị nhỏ nhất trong dãy số liệu trên.
-
Cho biết số giờ ôn tập toán của học sinh có thời gian nhiều hơn hoặc bằng trung bình cộng của dãy số liệu trên.
-
Cho biết số giờ ôn tập toán của học sinh có thời gian nằm trong khoảng từ trung vị trừ độ lệch chuẩn đến trung vị cộng với độ lệch chuẩn của dãy số liệu trên.
-
Tính độ lệch chuẩn của dãy số liệu trên.
Đáp án:
-
Trung bình cộng của dãy số liệu trên là (1 + 2 + 2 + 3 + 3) / 5 = 2.
-
Giá trị nhỏ nhất trong dãy số liệu trên là 1, giá trị lớn nhất là 3.
-
Số học sinh có thời gian ôn tập toán nhiều hơn hoặc bằng trung bình cộng của dãy số liệu trên là 3.
-
Khoảng từ trung vị trừ độ lệch chuẩn đến trung vị cộng với độ lệch chuẩn của dãy số liệu trên là từ 2 - 0.8 đến 2 + 0.8, hay từ 1.2 đến 2.8. Có 4 giờ ôn tập toán của học sinh trong khoảng này.
-
Độ lệch chuẩn của dãy số liệu trên là 0.84.
Bài 2: Các chiều cao (đơn vị: cm) của 6 học sinh lớp 3 được ghi nhận như sau: 130, 135, 125, 140, 130, 135
-
Tính giá trị trung bình của dãy số liệu trên.
-
Tìm giá trị lớn nhất và giá trị nhỏ nhất trong dãy số liệu trên..
-
Cho biết số học sinh có chiều cao lớn hơn hoặc bằng giá trị trung bình của dãy số liệu trên.
-
Tính độ lệch chuẩn của dãy số liệu trên.
Đáp án:
-
Giá trị trung bình của dãy số liệu trên là (130 + 135 + 125 + 140 + 130 + 135) / 6 = 132.5.
-
Giá trị nhỏ nhất trong dãy số liệu trên là 125, giá trị lớn nhất là 140.
-
Số học sinh có chiều cao lớn hơn hoặc bằng giá trị trung bình của dãy số liệu trên là 4.
-
Độ lệch chuẩn của dãy số liệu trên là 5.19.
Bài 3: Các chiều dài (đơn vị: cm) của 5 thanh kim loại được đo đạc và ghi nhận như sau: 10, 15, 12, 13, 15
-
Tính giá trị trung bình của dãy số liệu trên.
-
Tìm giá trị lớn nhất và giá trị nhỏ nhất trong dãy số liệu trên.
-
Cho biết số thanh kim loại có chiều dài lớn hơn giá trị trung bình của dãy số liệu trên.
-
Tính độ lệch chuẩn của dãy số liệu trên.
Đáp án:
-
Giá trị trung bình của dãy số liệu trên là (10 + 15 + 12 + 13 + 15) / 5 = 13.
-
Giá trị nhỏ nhất trong dãy số liệu trên là 10, giá trị lớn nhất là 15.
-
Số thanh kim loại có chiều dài lớn hơn giá trị trung bình của dãy số liệu trên là 3.
-
Độ lệch chuẩn của dãy số liệu trên là 2.24.