Phần 12g . XÁC SUẤT THỐNG KÊ - Độ đo phân tán tương đối .
DANH MỤC CÔNG CỤ GIẢI TOÁN TRỰC TUYẾN MATHEMATICA WOLFRAM | ALPHA .
Giới thiệu .
Bạn đọc truy cập vào đường dẫn http://cohtrantmed.yolasite.com/widgets-tructuyen để sử dụng các widgets giải toán trực tuyến W|A Mathematica theo chỉ mục trong danh sách dưới đây .
Những widgets này đã được tác giả sắp xếp theo từng môn học và cấp lớp theo ký hiệu như sau :
D : Đại số . Ví dụ D8.1 widget dùng cho Đại số lớp 8 , mục 1 - Khai triển , rút gọn biểu thức đại số .
H : Hình học . Ví dụ H12.3 widget dùng cho Hình học lớp 12 , mục 3 - Viết phương trình tham số của đường thẳng trong không gian .
G : Giải tích . Ví dụ : G11.7 widget dùng cho Giải tích lớp 11 , mục 7 - Tính đạo hàm cấp cao của hàm số
GI : Giải tích cao cấp I . Ví dụ GI.15 widget dùng cho Giải tích cao cấp I , mục 15 - Khai triển hàm số bằng đa thức TAYLOR
GII : Giải tích cao cấp II .
++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
ĐẠI SỐ 8
D8.1 Khai triển , rút gọn biểu thức đại số
D8.2 Rút gọn phân thức
D8.3 Phân tích thừa số
D8.4 Nhân 2 đa thức
D8.5 Khai triển tích số ( có thể dùng để khai triển Newton )
D8.6 Phân tích thừa số
++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
ĐẠI SỐ 10
D10.1 Giải phương trình nguyên Diophante
D10.2 Giải phương trình tuyệt đối
D10.3 Giải phương trình chứa tham số
D10.4 Giải phương trình đại số
D10.5 Giải phương trình từng bước
D10.6 Giải bất phương trình minh hoạ bằng đồ thị
D10.8 Tính giá trị biểu thức hàm số
D10.9 Giải bất phương trình đại số và minh hoạ bằng đồ thị
D10.10 Giải bất phương trình đại số - tìm miền nghiệm
D10.11 Giải phương trình đại số
D10.12 Giải phương trình vô tỷ
D10.13 Giải phương trình minh hoạ từng bước
D10.14 Giải phương trình dạng hàm ẩn
D10.15 Giải hệ thống phương trình tuyến tính , phi tuyến
D10.16 Giải hệ phương trình
D10.17 Vẽ miền nghiệm của bất phương trình đại số
D10.19 Tối ưu hoá hàm 2 biến với các ràng buộc
D10.20 Tìm giao điểm của đồ thị hàm số và trục hoành Ox , trục tung Oy
HÌNH HỌC 10
H10.1 Tính diện tích tam giác trong hệ toạ độ Oxy
H10.3 Khảo sát conic ( đường tròn , Ellipse , Parabola , Hyperbola )
H10.2 Tính khoảng cách từ 1 điểm đến đường thẳng trong Oxy
++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
ĐẠI SỐ 11
D11.1 Thuật chia Euclide dùng cho số và đa thức ( HORNER )
D11.2 Tính tổng nghịch đảo của n số tự nhiên
D11.6 Khai triển nhị thức Newton
GIẢI TÍCH 11
G11.1 Tính gíá trị một chuỗi số theo n
G11.2 Đa thức truy hồi
G11.3 Khảo sát tính hội tụ của chuỗi số
G11.4 Tính giới hạn của chuỗi số khi $n \rightarrow \infty$
G11.5 Tìm hàm số ngược của hàm số cho trước
G11.6 Tìm đạo hàm của hàm số hợp - giải thích
G11.7 Tính đạo hàm cấp cao của hàm số
G11.8 Tìm giới hạn của hàm số
G11.9 Tìm giới hạn của hàm số
G11.10 Tính đạo hàm hàm số có dạng U/V
G11.11 Tìm đạo hàm của hàm số cho trước
G11.12 Tìm đạo hàm của hàm số cho trước
G11+12.1 Tính đạo hàm ,tích phân , giới hạn , vẽ đồ thị
LƯỢNG GIÁC 11
L11.1 Giải phương trình lượng giác
L11.2 Giải phương trình lượng giác trên một đoạn
L11.3 Tìm chu kỳ của hàm số tuần hoàn
L11.4 Khai triển công thức lượng giác
++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
ĐẠI SỐ 12
D12.1 Cấu trúc của số phức
D12.1 Giải phương trình mũ
D12.3 Giải phương trình chứa tham số
D12.4 Giải phương trình bất kỳ ( Bậc 2 , 3 , ... , mũ , log , căn thức )
D12.5 Giải phương trình mũ
GIẢI TÍCH 12
G12.1 Vẽ đồ thị biểu diễn phương trình
G12.2 Khảo sát hàm số hữu tỷ
G12.3 Vẽ đồ thị trong toạ độ cực (Polar)
G12.4 Tìm cực trị của hàm số
G12.5 Vẽ đồ thị hàm số 2D
G12.6 Tìm đạo hàm cấp 2 của hàm số
G12.7 Vẽ nhiều hàm số - Basic plot. To plot two or more functions, enter {f1(x), f2(x),...}
G12.8 Tìm điểm uốn của hàm số cho trước
G12.9 Tìm nghiệm của các phương trình y = 0 , y ' = 0 , y " = 0
G12.10 Tính tích phân bất định
G12.11 Tính tích phân bất định minh hoạ từng bước
G12.12 Tính tích phân bất định minh hoạ từng bước
G12.13 Tìm đường tiệm cận của hàm số
G12.14 Tính diện tích hình phẳng giới hạn bởi 2 đường cong (C1) , (C2)
G12.15 Tìm giao điểm của hàm số đa thức và trục hoành Ox - Vẽ đồ thị .
G12.16 Tính thể tích vật thể tròn xoay giới hạn bởi (C1) , (C2)
G12.17 Vẽ đồ thị hàm số ( có đường tiệm cận )
G12.18 Vẽ đồ thị 2D , 3D
G12.19 Tìm hoành độ giao điểm giữa 2 đường cong (C1) , (C2)
G12.20 Vẽ đường cong tham số 3D
G12.21 Tính diện tich mặt tròn xoay
G12.22 Tích thể tích vật tròn xoay (C) , trục Ox , x =a , x= b
G12.23 Thể tích vật tròn xoay
G12.24 Tích thể tích vật tròn xoay (C1) , (C2) , trục OX , x = a , x = b
G12.25 Khảo sát hàm số đơn giản
G12.26 Tìm cực trị của hàm số
G12.27 Tìm nguyên hàm của hàm số
G12.28 Tính tích phân xác định
HÌNH HỌC 12
H12.1 Tính khoảng cách 2 điểm trong 2D , 3D
H12.2 Viết phương trình mặt phẳng qua 3 điểm trong không gian
H12.3 Viết phương trình tham số của đường thẳng trong không gian
H12.4 Tìm công thức thể tích , diện tích hình không gian
H12.5 Vẽ đồ thị 2D , mặt 3D
H12.6 Tích có hướng 2 vector
++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
GIẢI TÍCH CAO CẤP
GI.1 Vẽ đồ thị , mặt 3D
GI.2 Vẽ đồ thị , mặt 3D
GI.3 Tích phân 2 lớp
GI.5 Tích phân kép
GI.6 Tích phân bội 3
GI.7 Tích phân bội 3
GI.8 Tích phân suy rộng
GI.9 Chuỗi và dãy số
GI.10 Các bài toán cơ bản trong vi tích phân
GI.11 Vẽ hàm từng khúc ( piecewise ) - dùng để xét tính liên tục của hàm số
GI.12 Tính đạo hàm và tích phân một hàm số cho trước
GI.13 Vẽ đồ thị hàm số trong hệ toạ độ cực
GI.14 Tính đạo hàm riêng
GI.15 Khai triển hàm số bằng đa thức TAYLOR
GI.16 Tính tổng chuỗi số n = 1...$\infty$
GI.17 Vẽ đồ thị 3 hàm số
++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
Bài viết sau đây mô tả các khái niệm toán học và hướng dẫn tính toán chi tiết bằng công cụ trực tuyến , bạn đọc có thể tham khảo những nội dung chính yếu được đề cập đến trong giáo trình toán phổ thông cùng với các ví dụ minh họa .
Một số website hữu ích phục vụ cho việc giảng dạy và học tập môn toán :
http://quickmath.com/
http://analyzemath.com/
http://www.intmath.com/
http://www.mathportal.org
https://www.mathway.com/
https://www.symbolab.com/
http://www.graphsketch.com/
http://www.meta-calculator.com/online/?home
http://cohtrantmed.yolasite.com/widgets-tructuyen
12. XÁC SUẤT - THỐNG KÊ - Độ đo phân tán tương đối .
12.7 Các khái niệm về độ đo tương đối .
12.7.1 Hệ số khoảng giá trị - Coefficient of Range .
a. Khoảng giá trị .
Như đã biết khoảng giá trị dựa trên hai quan sát cực lớn nhất và nhỏ nhất . Nó không có ý nghĩa lớn đối với việc quan sát các giá trị trung tâm dữ liệu và là độ đo phân tán rất yếu không thể đưa ra kết luận về sự phân tán tổng thể của các quan sát đối với trung tâm của tập hợp các quan sát này.
Hãy khảo sát ba nhóm dữ liệu thuộc 3 tổ có khoảng giá trị tương tự nhau :
Tổ I : 20, 40, 40, 40, 40, 40, 60
Tổ II: 20, 20, 20, 40, 60, 60, 60
Tổ III: 20, 30, 40, 40, 40, 50, 60
Khoảng giá trị của 3 tổ đều là 60 - 20 = 40. Tuy nhiên ở tổ I có sự tập trung các giá trị ở trung tâm. Trong tổ II các giá trị rất gần với hai cực và ở tổ III giá trị dữ liệu gần như được phân bố đều trong khoảng từ 20 đến 60. Khoảng giá trị không giải thích được những khác biệt trong ba nhóm dữ liệu trên . Tính khiếm khuyết về khoảng giá trị này cũng không thể được loại bỏ ngay cả khi chúng ta tính toán hệ số khoảng giá trị vốn là một độ đo tương đối về phân tán. Nếu tính toán khoảng giá trị của một mẫu, chúng ta sẽ không thể rút ra được bất kỳ kết luận gì về khoảng giá trị của tổng thể.
b. Hệ số khoảng giá trị .
Đây là một độ đo tương đối về sự phân tán dựa trên giá trị của khoảng - cũng được gọi là hệ số khoảng phân tán.
CR = (xMax-xmin)/(xMax + xmin)
Khoảng (xMax-xmin) được chuẩn hóa bằng tổng (xMax+xmin)
Ví dụ 1. Xét hai tập hợp A,B với các quan sát sau đây . Tập hợp A chứa điểm số môn Khoa học ( điểm trên 25) của năm học sinh và tập hợp B chứa điểm số môn Văn học ( điểm trên 100 ) cũng của những học sinh này
A-Khoa học : 10, 15, 18, 20, 20 ( trên 25 điểm )
B-Văn học : 30, 35, 40, 45, 50 ( trên 100 điểm )
Các giá trị khoảng và hệ số khoảng được tính như sau:
Tập hợp A và B có khoảng giá trị tương ứng là 10 và 20. Rõ ràng có vẻ như tập hợp B có độ phân tán lớn hơn. Nhưng điều này thực ra lại không đúng . Khoảng giá trị 20 của tập hợp B là đối với các quan sát lớn và khoảng giá trị 10 của tập hợp A là dành cho các quan sát nhỏ. Như vậy 20 và 10 không thể so sánh với nhau trực tiếp . Cơ sở của chúng không giống nhau. Các điểm số môn Khoa học tính trên 25 và điểm số môn Văn học là trên 100. Do đó, thật không có ý nghĩa khi so sánh 10 với 20. Khi chuyển đổi hai giá trị này thành hệ số khoảng , chúng ta thấy rằng hệ số khoảng của tập hợp A là lớn hơn hơn so với B. Như vậy có sự phân tán (hoặc sự biến thiên) lớn hơn đối với các dữ liệu trong tập hợp A. Điểm số của các học sinh viên môn Văn học là ổn định hơn điểm số của họ trong môn Khoa học.
Ví dụ 2. So sánh hai bảng lương nhân viên ở phân xưởng I và II , ta có bảng số liệu sau (đơn vị USD /tuần)
PXI : 1400, 1450, 1520, 1380, 1485, 1495, 1575, 1440
PXII : 1200, 1550, 1450, 1300, 1520, 1425, 1650, 1150
Tính CR tiền lương của mỗi phân xưởng .
*Truy cập https://www.easycalculation.com/statistics/range-of-coefficient.php
Nhập dữ liệu vào calci sau , click Calculate
CR của PXI là 0.066
CR của PXII là 0.179
Ví dụ 3. Điều tra mẫu về trọng lượng sinh viên của lớp , ta có bảng số liệu sau (đơn vị kg )
59.5−62.5 : 5 người
62.5−65.5 : 18 người
65.5−68.5 : 42 người
68.5−71.5 : 27 người
71.5−74.5 : 8 người
Tính CR trọng lượng sinh viên .
CR = (xMax-xmin)/(xMax + xmin) = (74.5-59.5)/ (74.5+59.5) =0,1119
12.7.2 Hệ số độ lệch tứ phân vị - Coefficient of Quartile Deviation .
a. Độ lệch tứ phân vị .
Dựa trên tứ phân vị thứ nhất Q1 và tứ phân vị thứ ba Q3. Sai biệt Q3-Q1còn được gọi là khoảng liên tứ phân vị . Đại lượng (Q3-Q1)/2 được gọi là nửa khoảng tứ phân vị hoặc độ lệch tứ phân vị QD .
QD = IQR/2
Độ lệch tứ phân vị là một độ đo sự phân tán tuyệt đối tốt hơn một chút so với khoảng giá trị. Nhưng độ đo này lại bỏ qua các quan sát trên các tia mà chỉ lưu ý đến các quan sát hộp . Nếu chúng ta lấy mẫu khác nhau từ một tổng thể và tính toán độ lệch tứ phân vị của chúng , thì các giá trị này là tương đối khác biệt. Điều này được gọi là dao động lấy mẫu. Độ lệch tứ phân vị không phải là một độ đo phổ biến về sự phân tán và việc tính toán từ các dữ liệu mẫu không giúp chúng ta rút ra bất kỳ kết luận nào về độ lệch tứ phân vị tổng thể.
b. Hệ số độ lệch tứ phân vị .
Một độ đo phân tán tương đối dựa trên độ lệch tứ phân vị được gọi là hệ số độ lệch tứ phân vị. Nó được định nghĩa là CQD
Hệ số độ lệch tứ phân vị CQD= (Q3-Q1)/(Q3 + Q1)
Hệ số này độc lập với bất kỳ đơn vị đo lường nào , và có thể được sử dụng để so sánh sự phân tán trong hai hoặc nhiều tập hợp dữ liệu.
Ví dụ 4. Khảo sát sản lượng lúa mì trên 20 mẫu Anh được đưa ra như sau :
1120, 1240, 1320, 1040, 1080, 1200, 1440, 1360, 1680, 1730,
1785, 1342, 1960, 1880, 1755, 1720, 1600, 1470, 1750, 1885 (đơn vị Kg).
Tìm độ lệch tứ phân vị và hệ số độ lệch tứ phân vị.
*Truy cập http://www.alcula.com/calculators/statistics/quartiles/
Nhập dữ liệu
1120, 1240, 1320, 1040, 1080, 1200, 1440, 1360, 1680, 1730,
1785, 1342, 1960, 1880, 1755, 1720, 1600, 1470, 1750, 1885
Click Submit Data
Độ lệch tứ phân vị QD = (Q3-Q1)/2 = (1753.75-1260)/2 = 246.875
Hệ số độ lệch tứ phân vị CQD= (Q3-Q1)/(Q3 + Q1) = (1753.75-1260)/ (1753.75+1260) = 0.1638
Ví dụ 5. Trọng lượng hạt bắp thu được trên mẫu gồm 60 luống được cho như sau (đơn vị tính kg)
9.50,9.65,9.80,9.90,10.05,10.15,10.20,10.25,10.26,10.30,
10.28,10.27,10.30,10.55,10.65,10.70,10.74,10.72,10.71,10.75,
10.76,10.80,10.78,11.20,11.22,10.90,11.08,11.22,10.96,10.85,
11.20,10.85,10.96,11.20,10.88,10.80,11.25,11.46,11.30,11.28,
11.67,11.40,11.55,11.65,11.70,11.74,11.72,11.71,11.25,11.49,
11.75,11.86,11.90,12.20,12.17,12.24,12.25,12.65,12.70,13.10
Tìm độ lệch tứ phân vị và hệ số độ lệch tứ phân vị.
*Truy cập http://www.socscistatistics.com/descriptive/histograms/Default.aspx
Nhập dữ liệu và sửa chữa
Number of Classes : 8
Lowest Class Value : 9.25
Click Edit Histogram
*Truy cập http://www.socscistatistics.com/descriptive/bar/Default.aspx
Nhập dữ liệu như hình vẽ , Click Create Bar Chart
Lập bảng phân phối tần số tích lũy
Tính tứ phân vị theo công thức sau
$Q_1=V\left ( \frac{1.n}{4} \right )^{th}=x_{min_1}+\frac{h}{f}\left ( \frac{1.n}{4}-f_{C1} \right )$
$Q_2=V\left ( \frac{2.n}{4} \right )^{th}=x_{min_2}+\frac{h}{f}\left ( \frac{2.n}{4}-f_{C2} \right )$
$Q_3=V\left ( \frac{3.n}{4} \right )^{th}=x_{min_3}+\frac{h}{f}\left ( \frac{3.n}{4}-f_{C3} \right )$
Với n = 60
Tính $Q_1=V\left ( \frac{1.60}{4} \right )^{th}=x_{min_1}+\frac{h}{f}\left ( \frac{1.60}{4}-f_{C1} \right )$
Tra dữ liệu thứ hạng 15 trên bảng phân phối tần số tích lũy , giá trị này thuộc khoảng [10.25,10.75]
$x_{min_1}=10.25 ; h = 10.75-10.25=0.50 ; f = 12 ; f_{C1}=7$
$Q_1=V\left ( 15 \right )^{th}=10.25+\frac{0.5}{12}\left ( 15-7 \right )$=10.5833
Tính $Q_2=V\left ( \frac{2.60}{4} \right )^{th}=x_{min_2}+\frac{h}{f}\left ( \frac{2.60}{4}-f_{C2} \right )$
Tra dữ liệu thứ hạng 30 trên bảng phân phối tần số tích lũy , giá trị này thuộc khoảng [10.75,11.25]
$x_{min_2}=10.75 ; h = 11.25-10.75=0.50 ; f = 17 ; f_{C2}=19$
$Q_2=V\left ( 30 \right )^{th}=10.75+\frac{0.5}{17}\left ( 30-19 \right )$=11.0735
Tính $Q_3=V\left ( \frac{3.60}{4} \right )^{th}=x_{min_3}+\frac{h}{f}\left ( \frac{3.60}{4}-f_{C3} \right )$
Tra dữ liệu thứ hạng 45 trên bảng phân phối tần số tích lũy , giá trị này thuộc khoảng [11.25,11.75]
$x_{min_3}=11.25 ; h = 11.75-11.25=0.50 ; f = 14 ; f_{C3}=36$
$Q_3=V\left ( 45 \right )^{th}=11.25+\frac{0.5}{14}\left ( 45-36 \right )$=11.5714
Độ lệch tứ phân vị QD = (Q3-Q1)/2 = (11.5714-10.5833)/2 =0.49405
Hệ số độ lệch tứ phân vị CQD= (Q3-Q1)/(Q3 + Q1) = (11.5714-10.5833)/ (11.5714+10.5833) = 0.04460
Bạn cũng có thể tính các tứ phân vị Q1,Q2,Q3 với dữ liệu dạng rời rạc như sau
*Truy cập http://www.alcula.com/calculators/statistics/quartiles/
Nhập dữ liệu
9.50,9.65,9.80,9.90,10.05,10.15,10.20,10.25,10.26,10.30,
10.28,10.27,10.30,10.55,10.65,10.70,10.74,10.72,10.71,10.75,
10.76,10.80,10.78,11.20,11.22,10.90,11.08,11.22,10.96,10.85,
11.20,10.85,10.96,11.20,10.88,10.80,11.25,11.46,11.30,11.28,
11.67,11.40,11.55,11.65,11.70,11.74,11.72,11.71,11.25,11.49,
11.75,11.86,11.90,12.20,12.17,12.24,12.25,12.65,12.70,13.10
Click Submit Data
*Truy cập http://www.alcula.com/calculators/statistics/interquartile-range/
Độ lệch tứ phân vị QD = (Q3-Q1)/2 = 1.0025/2 =0.5013 ~ 0.49405
Hệ số độ lệch tứ phân vị CQD= (Q3-Q1)/(Q3 + Q1) = 1.0025/ (11.665+10.6625) = 0.0449 ~ 0.04460
12.7.3 Hệ số độ lệch trung bình - Coefficient of Mean Deviation .
a. Độ lệch trung bình .
Độ lệch trung bình MD được xác định là giá trị trung bình của các độ lệch tuyệt đối của các quan sát từ một trung bình nào đó phù hợp - có thể là trung bình cộng $\bar{x}$, trung vị Median hoặc thường số Mode . Sai biệt | x-trung bình |được gọi là độ lệch tuyệt đối . Giá trị trung bình của những độ lệch tuyệt đối được gọi là độ lệch trung bình hoặc độ lệch tuyệt đối trung bình .
Do đó đối với dữ liệu mẫu trong đó trung bình phù hợp là $\bar{x}$, độ lệch trung bình là
$MD=\frac{1}{N}\sum_{k=1}^{N}|x-\bar{x}|$
Đối với dữ liệu mẫu có phân phối tần số và trung bình phù hợp là $\bar{x}$, độ lệch trung bình là
$MD=\sum_{k=1}^{N}f_k|x-\bar{x}|/\sum_{k-1}^{N}f_k$
Đối với dữ liệu mẫu có phân phối tần số và trung bình phù hợp là Median (trung vị) , độ lệch trung bình là
$MD=\sum_{k=1}^{N}f_k|x-Median|/\sum_{k-1}^{N}f_k$
Đối với dữ liệu mẫu có phân phối tần số và trung bình phù hợp là Mod (thường số) , độ lệch trung bình là
$MD=\sum_{k=1}^{N}f_k|x-Mode|/\sum_{k-1}^{N}f_k$
Đối với dữ liệu tổng thể có phân phối tần số và trung bình phù hợp là $\mu$ , độ lệch trung bình là
$MD=\sum_{k=1}^{N}f_k|x-\mu|/\sum_{k-1}^{N}f_k$
Độ lệch trung bình là độ đo về sự phân tán tuyệt đối tốt hơn so với độ lệch khoảng và độ lệch tứ phân vị.
Một nhược điểm trong độ lệch trung bình là việc sử dụng độ lệch tuyệt đối | x-trung bình | , điều này dường như có vẻ không hợp lý. Lý do là tổng $\sum (x-\bar{x})$ luôn bằng không. Thậm chí nếu chúng ta sử dụng trung vị Median hoặc thường số Mode thay cho $\bar{x}$ , thì các tổng $\sum (x- Median)$ hoặc $\sum (x-Mode)$ cũng sẽ là 0 hoặc xấp xỉ 0 . Do đó, định nghĩa của độ lệch trung bình chỉ có thể áp dụng trên các độ lệch tuyệt đối.
Độ lệch trung bình dựa trên tất cả các quan sát, một tính chất mà các độ lệch khoảng và độ lệch tứ phân vị không có và công thức độ lệch trung bình là phương pháp đo lường sự thay đổi của dữ liệu tốt hơn. Bất kỳ trung bình phù hợp nào trong số các giá trị trung bình, trung vị hoặc thường số đều có thể được sử dụng trong tính toán nhưng giá trị của độ lệch trung bình là nhỏ nhất nếu tính theo trung vị. Một số nhược điểm khác của các độ lệch trung bình là nó không thể được sử dụng trong suy luận thống kê.
b. Hệ số độ lệch trung bình .
Một độ đo phân tán tương đối dựa trên độ lệch trung bình được gọi là hệ số của độ lệch trung bình hoặc hệ số phân tán CMD . Nó được định nghĩa là tỷ số giữa độ lệch trung bình và trung bình phù hợp ( đã được sử dụng trong việc tính toán độ lệch trung bình ) .Như vậy
CMD=Hệ số MD (trung bình Mean) = Độ lệch trung bình theo trung bình / trung bình
CMD=Hệ số MD (trung vị Median) = Độ lệch trung bình theo Median / Median
CMD=Hệ số M.D (thường số Mode) = Độ lệch trung bình theo Mode / Mode
Ví dụ 6. Khảo sát số điểm ghi trong môn bóng rổ của nhóm 9 học sinh được cho như sau
(đơn vị tính : Điểm )
15,7,10,7,4,9,12,7,9
Tìm độ lệch trung bình và hệ số độ lệch trung bình.
*Truy cập https://www.easycalculation.com/statistics/mean-median-mode.php
Nhập 15,7,10,7,4,9,12,7,9 click Calculate
Trung bình : $\bar{x}=8.9$
Trung vị : Median = 9
Thường số : Mode = 7
Lập bảng tính
Độ lệch trung bình (theo trung bình) là
$MD=\frac{1}{N}\sum_{k=1}^{N}|x-\bar{x}|=21.11/9=2.3456$
Độ lệch trung bình (theo trung vị) là
$MD=\frac{1}{N}\sum_{k=1}^{N}|x-Median|=21/9=2.3333$
Độ lệch trung bình (theo thường số) là
$MD=\frac{1}{N}\sum_{k=1}^{N}|x-Mode|=23/9=2.5556$
CMD=Hệ số MD (trung bình Mean) = Độ lệch trung bình theo trung bình / trung bình = 2.3456/8.9=0,2636
CMD=Hệ số MD (trung vị Median) = Độ lệch trung bình theo Median / Median = 2.3333/9 = 0,2593
CMD=Hệ số M.D (thường số Mode) = Độ lệch trung bình theo Mode / Mode = 2.5556/7 = 0,3651
Ví dụ 7. Khảo sát số điểm ghi trong môn bóng rổ của 2 nhóm mỗi nhóm 9 học sinh được cho như sau
(đơn vị tính : Điểm )
Nhóm A : 15,7,10,7,4,9,12,7,9
Nhóm B : 11,9,7,8,8,9,10,9,9
Tìm độ lệch trung bình và hệ số độ lệch trung bình (theo trung bình) của 2 nhóm - So sánh kết quả 2 nhóm .
B1.
Tính toán số liệu cho nhóm A : Đã khảo sát ở ví dụ 6. , ta có
Trung bình : $\bar{x}=8.9$
Trung vị : Median = 9
Thường số : Mode = 7
Tính toán số liệu cho nhóm B :
*Truy cập https://www.easycalculation.com/statistics/mean-median-mode.php
Nhập 11,9,7,8,8,9,10,9,9 click Calculate
Trung bình : $\bar{x}=8.9$
Trung vị : Median = 9
Thường số : Mode =9
*Truy cập https://www.easycalculation.com/statistics/mean-absolute-deviation.php
Nhập 11,9,7,8,8,9,10,9,9 vào cửa sổ dưới đây
click Calculate
Ta có
Trung bình : $\bar{x}=8.9$
MD = 0.81478
(Xem hình sau)
B2.
Tính hệ số độ lệch trung bình (theo trung bình) của 2 nhóm - So sánh kết quả 2 nhóm .
Độ lệch trung bình (theo trung bình) của nhóm A là
$MD=\frac{1}{N}\sum_{k=1}^{N}|x-\bar{x}|=21.11/9=2.3456$
CMD=Hệ số MD (trung bình Mean) = Độ lệch trung bình theo trung bình / trung bình = 2.3456/8.9=0,2636
Độ lệch trung bình (theo trung bình) của nhóm B là
$MD=\frac{1}{N}\sum_{k=1}^{N}|x-\bar{x}|=7.3330/9=0.81478$
CMD=Hệ số MD (trung bình Mean) = Độ lệch trung bình theo trung bình / trung bình = 0.81478/8.9=0.0915
Vì CMD của nhóm B nhỏ hơn CMD của nhóm A nên điểm số của B ổn định hơn .
12.7.4 Hệ số biến thiên - Coefficient of Variation (CV) .
Trong lý thuyết xác suất và thống kê, hệ số biến thiên (Coefficient of Variation - CV), còn được gọi là độ lệch chuẩn tương đối (relative standard deviation-RSD), là một độ đo tiêu chuẩn về sự phân tán của một phân bố xác suất hoặc phân phối tần số. Nó thường được thể hiện như là một tỷ lệ bách phân , và được định nghĩa là tỷ số giữa độ lệch chuẩn $\sigma$ với giá trị trung bình $\mu$ (hoặc $|\mu |$). Các CV ( hoặc RSD) được sử dụng rộng rãi trong hóa phân tích để diễn tả sự chính xác và sự lặp lại của một khảo nghiệm nào đó . Hệ số biến thiên cũng được sử dụng phổ biến trong các lĩnh vực như cơ khí hoặc vật lý khi thực hiện các nghiên cứu về đảm bảo chất lượng và độ đo ANOVA .
$CV = \frac{\sigma}{\mu}$
Hệ số biến thiên được tính toán chỉ cho dữ liệu đo trên thang tỷ lệ, vì đây là những phép đo mà chỉ có thể lấy các giá trị không âm , và nó cho thấy mức độ biến đổi trong mối quan hệ với trung bình của tổng thể. Hệ số biến thiên có thể không có bất kỳ ý nghĩa nào cho dữ liệu trên một quy mô khoảng .
Ví dụ 8. Dữ liệu về chiều cao và trọng lượng của 5 sinh viên được cho như sau . Hãy so sánh độ phân tán của 2 loại dữ liệu .
N=5
Chiều cao 172 , 168 , 164 ,170 ,176 ( đơn vị cm)
Trọng lượng 62 , 57 ,58 ,64 ,64 (đơn vị kg)
Vì đơn vị 2 loại dữ liệu khác nhau để so sánh độ phân tán ta cần phải tính CV của 2 loại
CV của chiều cao
$\mu=(164+168+170+172+176)/5=170$
$\sigma={(164−170)^2+(168−170)^2+(170−170)^2+(172−170)^2+(176−170)^2}/5=4.47$
CV1 = (4.47/170)x100% = 2.63%
CV của trọng lượng
$\mu=(57+58+62+64+64)/5=61$
$\sigma={(57−61)^2+(58−61)^2+(62−61)^2+(64−61)^2+(64−61)^2}/5=3.31
CV2 = (3.31/61)x100% = 5.4%
Bằng cách so sánh CV1 và CV2 , chúng ta biết được độ phân tán của trọng lượng lớn hơn so với chiều cao .
*Truy cập https://www.easycalculation.com/statistics/coefficient-of-variance.php
Nhập 172 , 168 , 164 ,170 ,176 vào Calci dưới đây , click Calculate
CV còn được dùng để so sánh 2 tập dữ liệu có đơn vị khác nhau hoặc 2 tập dữ liệu có cùng đơn vị nhưng khác nhau về kich thước .
Ví dụ 9. Giá trung bình và độ lệch chuẩn của cổ phiếu A và B trong năm qua là $\mu_A=50$ , $\sigma_A=5$ ; $\mu_B=100$ , $\sigma_B=5$ . Hãy so sánh độ phân tán của 2 loại cổ phiếu trên .
CV_A = $\frac{\sigma_A}{\mu_A}=5/50=0.10$
CV_B = $\frac{\sigma_B}{\mu_B}=5/100=0.05$
Nhận xét :
2 cổ phiếu A,B có cùng độ lệch chuẩn nhưng khác nhau về gí trung bình
CV_B nhỏ hơn CV_A nên có thể nói cổ phiếu B tương đối ít biến động hơn cổ phiếu A .
Trần hồng Cơ
Ngày 20/01/2016
------------------------------------------------------------------------------------------- -
Những điều biết được chỉ là hạt cát , những điều chưa biết là cả một đại dương .
Isaac Newton