This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivs 3.0 United States License.
TOÁN THỰC HÀNH CHƯƠNG 2 . 2.2
Bài
giảng .
2. 2 THỐNG KÊ - STATISTICS , HỒI QUY TUYẾN TÍNH - LINEAR REGRESSION .
Chủ đề
- Tổng thể (Population) , Mẫu (sample) , Dữ liệu (data) .
- Phân phối chuẩn (normal
distribution) .
- Hồi quy tuyến tính (Linear regression) .
Ứng dụng
- Tung súc sắc .
- Nghiên cứu diễn đàn .
- Giá xăng dầu .
- Tuổi lao động .
- Khảo sát chiều cao .
- Tỷ lệ thất nghiệp .
Khái niệm cơ bản
* Khái niệm ( Tổng thể – Mẫu –Dữ liệu ) .
* Độ đo trung tâm -Measure of centality ( Trung bình (Mean)
–Trung vị (Median) –Mốt (Mode ) )
* Độ đo phân tán -Measure of dispersion ( Phương sai (Variance)
–Độ lệch (Deviation) –Độ lệch chuẩn (Standard deviation) )
* Phân phối chuẩn (The normal distribution) - Biến rời rạc
và biến liên tục -Discrete and continous variables.
* Hồi quy tuyến tính (Linear Regression) ( Điều hóa tốt
nhất (Best fit) –Hệ số tương quan tuyến tính (Coefficient of linear correlation ) )
1. TỔNG THỂ -
MẪU – DỮ LIỆU .
·
Tập
hợp các phần tử được khảo sát gọi là tổng thể . Tập con bất kỳ của tổng
thể gọi là mẫu . Khi khảo sát một tổng thể quá lớn ta không thể
thu thập được tất cả các dữ liệu của
mọi phần tử vì thế ta phải thu thập các dữ
liệu của một mẫu nhỏ và dễ quản lí hơn .
·
Mẫu
được xem là mẫu tốt “good sample” khi nó
có thể đại diện cho tổng thể .
·
Khi
đã thu thập đầy đủ dữ liệu ta có thể tổng kết bằng cách tính toán những thống
kê mô tả khác nhau . Dữ liệu mẫu được thu thập và tóm tắt sẽ giúp
chúng ta đưa ra kết luận hợp lý về tổng thể .
Lập bảng phân phối tần số - Constructing A
Frequency Distribution
* Nếu dữ liệu thô có ít giá trị khác nhau ta liệt kê các điểm
dữ liệu riêng biệt . Ngược lại , nếu dữ liệu thô gồm nhiều giá trị khác nhau ta
tạo các khoảng và làm việc theo dữ liệu nhóm .
* Kiểm đếm số lượng các điểm dữ liệu trong mỗi khoảng thời
gian hoặc số lần xuất hiện các dữ liệu cá thể .
* Liệt kê tần số của mỗi khoảng thời gian hoặc mỗi điểm dữ liệu
cá thể .
* Tìm tần số tương đối bằng cách chia tần số của của mỗi
khoảng thời gian hoặc số lần xuất hiện các dữ liệu cá thể với tổng số các điểm
dữ liệu có trong phân phối ( kết quả được ghi là % ) .
Dữ liệu riêng biệt - Distinct Data
Ví dụ . Tung con súc sắc đồng chất , ta có kết quả
các mặt như sau
1 1 2 5 5 6 1 6 5 3
6 1 1 3 3 6 5 6 6 1
4 1 1 3 1 5 6 6 1 6
2 5 4 5 2 3 2 5 1 5
4 2 6 2 1 3 5 4 3 4
Hãy lập bảng phân phối tần số .
Lời giải .
Dùng ESBStats , tạo workbook TUNG SUC SAC , nhập các dữ liệu điểm phân biệt