This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivs 3.0 United States License.
TOÁN THỰC HÀNH CHƯƠNG 2 . 2.2
Bài
giảng .
2. 2 THỐNG KÊ - STATISTICS , HỒI QUY TUYẾN TÍNH - LINEAR REGRESSION .
Chủ đề
- Tổng thể (Population) , Mẫu (sample) , Dữ liệu (data) .
- Phân phối chuẩn (normal
distribution) .
- Hồi quy tuyến tính (Linear regression) .
Ứng dụng
- Tung súc sắc .
- Nghiên cứu diễn đàn .
- Giá xăng dầu .
- Tuổi lao động .
- Khảo sát chiều cao .
- Tỷ lệ thất nghiệp .
Khái niệm cơ bản
* Khái niệm ( Tổng thể – Mẫu –Dữ liệu ) .
* Độ đo trung tâm -Measure of centality ( Trung bình (Mean)
–Trung vị (Median) –Mốt (Mode ) )
* Độ đo phân tán -Measure of dispersion ( Phương sai (Variance)
–Độ lệch (Deviation) –Độ lệch chuẩn (Standard deviation) )
* Phân phối chuẩn (The normal distribution) - Biến rời rạc
và biến liên tục -Discrete and continous variables.
* Hồi quy tuyến tính (Linear Regression) ( Điều hóa tốt
nhất (Best fit) –Hệ số tương quan tuyến tính (Coefficient of linear correlation ) )
1. TỔNG THỂ -
MẪU – DỮ LIỆU .
·
Tập
hợp các phần tử được khảo sát gọi là tổng thể . Tập con bất kỳ của tổng
thể gọi là mẫu . Khi khảo sát một tổng thể quá lớn ta không thể
thu thập được tất cả các dữ liệu của
mọi phần tử vì thế ta phải thu thập các dữ
liệu của một mẫu nhỏ và dễ quản lí hơn .
·
Mẫu
được xem là mẫu tốt “good sample” khi nó
có thể đại diện cho tổng thể .
·
Khi
đã thu thập đầy đủ dữ liệu ta có thể tổng kết bằng cách tính toán những thống
kê mô tả khác nhau . Dữ liệu mẫu được thu thập và tóm tắt sẽ giúp
chúng ta đưa ra kết luận hợp lý về tổng thể .
Lập bảng phân phối tần số - Constructing A
Frequency Distribution
* Nếu dữ liệu thô có ít giá trị khác nhau ta liệt kê các điểm
dữ liệu riêng biệt . Ngược lại , nếu dữ liệu thô gồm nhiều giá trị khác nhau ta
tạo các khoảng và làm việc theo dữ liệu nhóm .
* Kiểm đếm số lượng các điểm dữ liệu trong mỗi khoảng thời
gian hoặc số lần xuất hiện các dữ liệu cá thể .
* Liệt kê tần số của mỗi khoảng thời gian hoặc mỗi điểm dữ liệu
cá thể .
* Tìm tần số tương đối bằng cách chia tần số của của mỗi
khoảng thời gian hoặc số lần xuất hiện các dữ liệu cá thể với tổng số các điểm
dữ liệu có trong phân phối ( kết quả được ghi là % ) .
Dữ liệu riêng biệt - Distinct Data
Ví dụ . Tung con súc sắc đồng chất , ta có kết quả
các mặt như sau
1 1 2 5 5 6 1 6 5 3
6 1 1 3 3 6 5 6 6 1
4 1 1 3 1 5 6 6 1 6
2 5 4 5 2 3 2 5 1 5
4 2 6 2 1 3 5 4 3 4
Hãy lập bảng phân phối tần số .
Lời giải .
Dùng ESBStats , tạo workbook TUNG SUC SAC , nhập các dữ liệu điểm phân biệt
Click vào Line Graph xem biểu đồ đường thẳng .
Click vào Descriptive Stats và Main Summary xem các số liệu thống kê mô tả như
Độ tập trung - Measures of Centrality
Trung bình -Mean: 3,5000
Trung vị -Median: 3,5000
Mốt -Mode: 1,0000
Độ phân tán - Measures of Dispersion
Độ lệch trung bình -Mean Deviation: 1,7000
Phương sai -Variance: 3,6020
Độ lệch tiêu chuẩn -Standard Deviation: 1,8979
*************************************************
Click vào link sau download TUNG SUC SAC
Xem tiếp dưới đây
http://cohtran-toan-don-gian.blogspot.com
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivs 3.0 United States License.
Trần hồng Cơ
14/10/2012
-------------------------------------------------------------------------------------------
Toán học thuần túy, theo cách của riêng nó, là thi ca của tư duy logic.
Pure mathematics is, in its way, the poetry of logical ideas.
Albert Einstein .
Không có nhận xét nào :
Đăng nhận xét
Cám ơn lời bình luận của các bạn .
Tôi sẽ xem và trả lời ngay khi có thể .
I will review and respond to your comments as soon as possible.,
Thank you .
Trần hồng Cơ .
Co.H.Tran
MMPC-VN
cohtran@mail.com
https://plus.google.com/+HongCoTranMMPC-VN/about