GIẢI TOÁN PHỔ THÔNG BẰNG CÁC CÔNG CỤ TRỰC TUYẾN .
Phần 13c . XỬ LÝ DỮ LIỆU - Dữ liệu ngoại lai .
DANH MỤC CÔNG CỤ GIẢI TOÁN TRỰC TUYẾN MATHEMATICA WOLFRAM | ALPHA .
Giới thiệu .
Bạn đọc truy cập vào đường dẫn http://cohtrantmed.yolasite.com/widgets-tructuyen để sử dụng các widgets giải toán trực tuyến W|A Mathematica theo chỉ mục trong danh sách dưới đây .
Những widgets này đã được tác giả sắp xếp theo từng môn học và cấp lớp theo ký hiệu như sau :
D : Đại số . Ví dụ D8.1 widget dùng cho Đại số lớp 8 , mục 1 - Khai triển , rút gọn biểu thức đại số .
H : Hình học . Ví dụ H12.3 widget dùng cho Hình học lớp 12 , mục 3 - Viết phương trình tham số của đường thẳng trong không gian .
G : Giải tích . Ví dụ : G11.7 widget dùng cho Giải tích lớp 11 , mục 7 - Tính đạo hàm cấp cao của hàm số
GI : Giải tích cao cấp I . Ví dụ GI.15 widget dùng cho Giải tích cao cấp I , mục 15 - Khai triển hàm số bằng đa thức TAYLOR
GII : Giải tích cao cấp II .
++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
ĐẠI SỐ 8
D8.1 Khai triển , rút gọn biểu thức đại số
D8.2 Rút gọn phân thức
D8.3 Phân tích thừa số
D8.4 Nhân 2 đa thức
D8.5 Khai triển tích số ( có thể dùng để khai triển Newton )
D8.6 Phân tích thừa số
++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
ĐẠI SỐ 10
D10.1 Giải phương trình nguyên Diophante
D10.2 Giải phương trình tuyệt đối
D10.3 Giải phương trình chứa tham số
D10.4 Giải phương trình đại số
D10.5 Giải phương trình từng bước
D10.6 Giải bất phương trình minh hoạ bằng đồ thị
D10.8 Tính giá trị biểu thức hàm số
D10.9 Giải bất phương trình đại số và minh hoạ bằng đồ thị
D10.10 Giải bất phương trình đại số - tìm miền nghiệm
D10.11 Giải phương trình đại số
D10.12 Giải phương trình vô tỷ
D10.13 Giải phương trình minh hoạ từng bước
D10.14 Giải phương trình dạng hàm ẩn
D10.15 Giải hệ thống phương trình tuyến tính , phi tuyến
D10.16 Giải hệ phương trình
D10.17 Vẽ miền nghiệm của bất phương trình đại số
D10.19 Tối ưu hoá hàm 2 biến với các ràng buộc
D10.20 Tìm giao điểm của đồ thị hàm số và trục hoành Ox , trục tung Oy
HÌNH HỌC 10
H10.1 Tính diện tích tam giác trong hệ toạ độ Oxy
H10.3 Khảo sát conic ( đường tròn , Ellipse , Parabola , Hyperbola )
H10.2 Tính khoảng cách từ 1 điểm đến đường thẳng trong Oxy
++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
ĐẠI SỐ 11
D11.1 Thuật chia Euclide dùng cho số và đa thức ( HORNER )
D11.2 Tính tổng nghịch đảo của n số tự nhiên
D11.6 Khai triển nhị thức Newton
GIẢI TÍCH 11
G11.1 Tính gíá trị một chuỗi số theo n
G11.2 Đa thức truy hồi
G11.3 Khảo sát tính hội tụ của chuỗi số
G11.4 Tính giới hạn của chuỗi số khi $n \rightarrow \infty$
G11.5 Tìm hàm số ngược của hàm số cho trước
G11.6 Tìm đạo hàm của hàm số hợp - giải thích
G11.7 Tính đạo hàm cấp cao của hàm số
G11.8 Tìm giới hạn của hàm số
G11.9 Tìm giới hạn của hàm số
G11.10 Tính đạo hàm hàm số có dạng U/V
G11.11 Tìm đạo hàm của hàm số cho trước
G11.12 Tìm đạo hàm của hàm số cho trước
G11+12.1 Tính đạo hàm ,tích phân , giới hạn , vẽ đồ thị
LƯỢNG GIÁC 11
L11.1 Giải phương trình lượng giác
L11.2 Giải phương trình lượng giác trên một đoạn
L11.3 Tìm chu kỳ của hàm số tuần hoàn
L11.4 Khai triển công thức lượng giác
++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
ĐẠI SỐ 12
D12.1 Cấu trúc của số phức
D12.1 Giải phương trình mũ
D12.3 Giải phương trình chứa tham số
D12.4 Giải phương trình bất kỳ ( Bậc 2 , 3 , ... , mũ , log , căn thức )
D12.5 Giải phương trình mũ
GIẢI TÍCH 12
G12.1 Vẽ đồ thị biểu diễn phương trình
G12.2 Khảo sát hàm số hữu tỷ
G12.3 Vẽ đồ thị trong toạ độ cực (Polar)
G12.4 Tìm cực trị của hàm số
G12.5 Vẽ đồ thị hàm số 2D
G12.6 Tìm đạo hàm cấp 2 của hàm số
G12.7 Vẽ nhiều hàm số - Basic plot. To plot two or more functions, enter {f1(x), f2(x),...}
G12.8 Tìm điểm uốn của hàm số cho trước
G12.9 Tìm nghiệm của các phương trình y = 0 , y ' = 0 , y " = 0
G12.10 Tính tích phân bất định
G12.11 Tính tích phân bất định minh hoạ từng bước
G12.12 Tính tích phân bất định minh hoạ từng bước
G12.13 Tìm đường tiệm cận của hàm số
G12.14 Tính diện tích hình phẳng giới hạn bởi 2 đường cong (C1) , (C2)
G12.15 Tìm giao điểm của hàm số đa thức và trục hoành Ox - Vẽ đồ thị .
G12.16 Tính thể tích vật thể tròn xoay giới hạn bởi (C1) , (C2)
G12.17 Vẽ đồ thị hàm số ( có đường tiệm cận )
G12.18 Vẽ đồ thị 2D , 3D
G12.19 Tìm hoành độ giao điểm giữa 2 đường cong (C1) , (C2)
G12.20 Vẽ đường cong tham số 3D
G12.21 Tính diện tich mặt tròn xoay
G12.22 Tích thể tích vật tròn xoay (C) , trục Ox , x =a , x= b
G12.23 Thể tích vật tròn xoay
G12.24 Tích thể tích vật tròn xoay (C1) , (C2) , trục OX , x = a , x = b
G12.25 Khảo sát hàm số đơn giản
G12.26 Tìm cực trị của hàm số
G12.27 Tìm nguyên hàm của hàm số
G12.28 Tính tích phân xác định
HÌNH HỌC 12
H12.1 Tính khoảng cách 2 điểm trong 2D , 3D
H12.2 Viết phương trình mặt phẳng qua 3 điểm trong không gian
H12.3 Viết phương trình tham số của đường thẳng trong không gian
H12.4 Tìm công thức thể tích , diện tích hình không gian
H12.5 Vẽ đồ thị 2D , mặt 3D
H12.6 Tích có hướng 2 vector
++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
GIẢI TÍCH CAO CẤP
GI.1 Vẽ đồ thị , mặt 3D
GI.2 Vẽ đồ thị , mặt 3D
GI.3 Tích phân 2 lớp
GI.5 Tích phân kép
GI.6 Tích phân bội 3
GI.7 Tích phân bội 3
GI.8 Tích phân suy rộng
GI.9 Chuỗi và dãy số
GI.10 Các bài toán cơ bản trong vi tích phân
GI.11 Vẽ hàm từng khúc ( piecewise ) - dùng để xét tính liên tục của hàm số
GI.12 Tính đạo hàm và tích phân một hàm số cho trước
GI.13 Vẽ đồ thị hàm số trong hệ toạ độ cực
GI.14 Tính đạo hàm riêng
GI.15 Khai triển hàm số bằng đa thức TAYLOR
GI.16 Tính tổng chuỗi số n = 1...$\infty$
GI.17 Vẽ đồ thị 3 hàm số
++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
Bài viết sau đây mô tả các khái niệm toán học và hướng dẫn tính toán chi tiết bằng công cụ trực tuyến , bạn đọc có thể tham khảo những nội dung chính yếu được đề cập đến trong giáo trình toán phổ thông cùng với các ví dụ minh họa .
Một số website hữu ích phục vụ cho việc giảng dạy và học tập môn toán :
http://quickmath.com/
http://analyzemath.com/
http://www.intmath.com/
http://www.mathportal.org
https://www.mathway.com/
https://www.symbolab.com/
http://www.graphsketch.com/
http://www.meta-calculator.com/online/?home
http://cohtrantmed.yolasite.com/widgets-tructuyen
13. XỬ LÝ DỮ LIỆU - Dữ liệu ngoại lai .
13.3 Dữ liệu ngoại lai .
13.3.1 Khái niệm về ngoại lai .
a.Định nghỉa
-Giá trị ngoại lai là giá trị của một quan sát có một khoảng cách bất thường từ các giá trị khác trong một mẫu ngẫu nhiên từ một tổng thể. Trong thống kê , định nghĩa này đưa ra để các nhà phân tích (hoặc một quá trình đồng thuận) quyết định những gì sẽ được coi là bất thường. Trước khi những quan sát bất thường có thể được chỉ ra, việc cần thiết là phải mô tả các quan sát bình thường khác .
-Ngoại lai có thể xảy ra bởi các cơ hội may rủi , tình cờ ở bất kỳ phân phối nào , nhưng chúng thường chỉ rằng hoặc xảy ra lỗi do phép đo hoặc tổng thể có phân phối kỳ dị . Trong trường hợp thứ nhất người ta muốn loại bỏ chúng hoặc sử dụng các thống kê mạnh mẽ để tách bỏ ngoại lai , trong khi ở trường hợp hai chỉ ra rằng phân phối có độ lệch cao và cần phải rất thận trọng trong việc sử dụng các công cụ hoặc trực giác giả định phân phối chuẩn. Một nguyên nhân thường xuyên của giá trị ngoại lai là một hỗn hợp của hai phân phối, có thể là sự khác biệt hai tiểu quần thể, hoặc có thể chỉ ra việc xử lý đúng với các lỗi đo ; điều này sẽ được mô hình hóa bằng một mô hình hỗn hợp.
-Trong hầu hết các mẫu lớn dữ liệu, một số điểm dữ liệu sẽ ở khá xa so với trung bình mẫu hơn những gì được coi là hợp lý. Điều này có thể là do lỗi ngẫu nhiên hệ thống hoặc sai sót trong lý thuyết được tạo ra trong một họ giả định các phân phối xác suất, hoặc nó có thể là một số quan sát ở xa trung tâm dữ liệu. Vì thế điểm ngoại lai có thể chỉ ra dữ liệu bị lỗi, hoặc thủ tục sai sót, hoặc các khu vực nơi một lý thuyết nào đó có thể không có giá trị. Tuy nhiên, trong các mẫu lớn, một số lượng nhỏ các giá trị ngoại lai cũng là điều cần thiết được mong đợi (và không phải do bất kỳ điều kiện bất thường nào).
-Ngoại lai có thể bao gồm những giá trị quan sát cực đại mẫu hoặc cực tiểu mẫu, hoặc cả hai, tùy thuộc vào việc chúng là cực cao hay cực thấp. Tuy nhiên, cực đại mẫu và cực tiểu mẫu không phải lúc nào cũng là giá trị ngoại lai bởi vì chúng cũng có thể không xa một cách bất thường so với những quan sát khác.
b. Phương pháp mô tả dữ liệu .
Có hai hoạt động cần thiết cho việc mô tả một tập hợp các dữ liệu là
*Kiểm tra hình dạng tổng thể của dữ liệu được minh họa qua đồ thị với các tính năng quan trọng, trong đó có sự đối xứng và khởi xuất từ những giả định. Đây có thể xem là phân tích dữ liệu (Exploratory Data Analysis - EDA) .
**Kiểm tra dữ liệu các quan sát khác thường được tách rời khỏi khối lượng của dữ liệu. Những điểm này thường được gọi là giá trị ngoại lai. Hai kỹ thuật đồ họa để xác định giá trị ngoại lai là đồ thị điểm rời rạc và các đồ thị hộp - tia ( xem Phần 12f 12.6.2 c ) , cùng với một thủ tục phân tích để phát hiện giá trị ngoại lai khi phân phối là bình thường (Grubbs ' Test).
c. Tiêu chuẩn phát hiện ngoại lai .
-Xây dựng biểu đồ hộp.
Biểu đồ hộp là một biểu đồ hiển thị hữu ích cho việc mô tả hành vi của các dữ liệu ở giữa cũng như tại hai đầu của các phân phối thống kê. Biểu đồ hộp sử dụng trung vị và tứ phân vị thứ 1 (thấp hơn) và thứ 3 (cao hơn) (định nghĩa là bách phân vị 25 và bách phân vị 75). Nếu các tứ phân vị thấp hơn là Q1 và tứ phân vị trên là Q3, thì sự khác biệt (Q3 - Q1) được gọi là khoảng liên tứ phân vị hoặc chỉ số IQR.
-Biểu đồ hộp với hàng rào.
Một biểu đồ được xây dựng bằng cách vẽ một hộp giữa các tứ phân vị thứ 1 và thứ 3 với một tia trên hộp để xác định vị trí trung vị. Các đại lượng sau đây (gọi là hàng rào) là cần thiết để xác định giá trị cực đại của phân phối:
1.Hàng rào nội thấp hơn LIF : Q1 - 1.5 * IQR
2.Hàng rào nội cao hơn UIF : Q3 + 1.5 * IQR
3.Hàng rào ngoại thấp hơn LOF : Q1 - 3 * IQR
4.Hàng rào ngoại cao hơn UOF : Q3 + 3 * IQR
-Tiêu chuẩn phát hiện ngoại lai .
Một điểm nằm ngoài một hàng rào nội (tính cho cả hai loại LIF , UIF) được coi là một điểm ngoại lai nhẹ. Một điểm ngoài một hàng rào ngoại (tính cho cả hai loại LOF , UOF) được coi là một điểm ngoại lai mạnh.
Ví dụ 1. Khảo sát chiều cao của cây thanh long 2 tháng tuổi trồng trên cùng một liếp ta có bảng số liệu sau đây ( đơn vị cm )
818, 570, 572, 453, 470, 574, 578, 585, 265, 869, 918, 925, 953, 991, 1000, 270, 272, 289, 305, 306, 351, 370, 390, 404, 409 ,548, 550, 559, 439, 480 ,752, 758, 766 , 482, 487, 494,843, 858, 860, 495, 499, 30, 171, 184, 201, 212, 250, 503, 514, 521, 522, 527, 560, 592, 592, 607, 616, 618, 638, 640, 441, 448, 451, 656, 668, 707, 709, 719, 411, 436, 437, 737, 792, 794, 802, 830, 832, 1005, 739, 792, 444, 1068, 322, 322, 336, 346, 1441 , 621, 629, 637
Hãy vẽ biểu đồ hộp và tìm giá trị ngoại lai .
Trung vị (Median) = (n+1)/2 điểm dữ liệu = trung bình dữ liệu thứ 45th và 46th = (559 + 560)/2 = 559.5
Tứ phân vị thứ 1 = .25(N+1)th điểm thứ tự = 22.75th điểm thứ tự = 411 + .75(436-411) = 429.75
Tứ phân vị thứ 3 = .75(N+1)th điểm thứ tự = 68.25th điểm thứ tự = 739 +.25(752-739) = 742.25
Khoảng liên tứ phân vị IQR = 742.25 - 429.75 = 312.5
LIF= 429.75 - 1.5 (312.5) = -39.0
UIF= 742.25 + 1.5 (312.5) = 1211.0
LOF= 429.75 - 3.0 (312.5) = -507.75
UOF= 742.25 + 3.0 (312.5) = 1679.75
*Truy cập http://www.alcula.com/calculators/statistics/box-plot/
Nhập dữ liệu như hình sau
818, 570, 572, 453, 470, 574, 578, 585, 265, 869, 918, 925, 953, 991, 1000, 270, 272, 289, 305, 306, 351, 370, 390, 404, 409 ,548, 550, 559, 439, 480 ,752, 758, 766 , 482, 487, 494,843, 858, 860, 495, 499, 30, 171, 184, 201, 212, 250, 503, 514, 521, 522, 527, 560, 592, 592, 607, 616, 618, 638, 640, 441, 448, 451, 656, 668, 707, 709, 719, 411, 436, 437, 737, 792, 794, 802, 830, 832, 1005, 739, 792, 444, 1068, 322, 322, 336, 346, 1441 , 621, 629, 637
Click SUBMIT DATA
Nhận xét : vì 1441 nằm ngoài UIF nhưng chưa vượt qua UOF nên 1441 là giá trị ngoại lai nhẹ . Bạn có thể vẽ biểu đồ cột và biểu đồ hộp để quan sát giá trị ngoại lai
13.3.2 Xử lý dữ liệu ngoại lai .
a. Quan hệ giữa ngoại lai và các độ đo trung tâm .
-Khi quan sát tập dữ liệu có ngoại lai chúng ta thường cần phải tìm các giá trị trung bình , trung vị và thường số trước và sau khi loại bỏ giá trị ngoại lai đó .
Ví dụ 2. Khảo sát chiều cao của cây thanh long 2 tháng tuổi trồng trên cùng một liếp ta có bảng số liệu sau đây ( đơn vị cm )
818, 570, 572, 453, 470, 574, 578, 585, 265, 869, 918, 925, 953, 991, 1000, 270, 272, 289, 305, 306, 351, 370, 390, 404, 409 ,548, 550, 559, 439, 480 ,752, 758, 766 , 482, 487, 494,843, 858, 860, 495, 499, 30, 171, 184, 201, 212, 250, 503, 514, 521, 522, 527, 560, 592, 592, 607, 616, 618, 638, 640, 441, 448, 451, 656, 668, 707, 709, 719, 411, 436, 437, 737, 792, 794, 802, 830, 832, 1005, 739, 792, 444, 1068, 322, 322, 336, 346, 1441 , 621, 629, 637
Hãy so sánh các giá trị trung bình , trung vị và thường số trước và sau khi loại bỏ ngoại lai .
Trước khi loại bỏ ngoại lai .
Sau khi loại bỏ ngoại lai
Nhận xét :
Việc loại bỏ ngoại lai có ảnh hưởng lớn đến trung bình , nhưng không ảnh hưởng nhiều đến thường số và trung vị .
b. Lưu ý cần thiết khi loại bỏ ngoại lai .
-Khi loại bỏ ngoại lai chúng ta đang thay đổi dữ liệu, nó không còn là "thuần khiết" nữa , vì vậy không nên thoát khỏi những giá trị ngoại lai mà không có lý do chính đáng!
Và khi chúng ta loại bỏ ngoại lai , cũng nên giải thích những gì chúng ta đang làm và lý do tại sao làm như vậy .
Ví dụ 3.
Khảo sát trắc nghiệm tâm lý trên mẫu 20 sinh viên chúng ta thu được số liệu về thời gian trả lời như sau
27, 21, 19, 20, 26, 23, 18, 20, 25, 23,25, 23, 22, 58, 26, 23,19,27, 24, 26 (đơn vị tính : phút)
Hãy vẽ biểu đồ hộp và tìm giá trị ngoại lai .
Giá trị trung bình sẽ giảm bao nhiêu nếu loại bỏ các ngoại lai .
Giá trị ngoại lai là 58 .
Giá trị trung bình của mẫu là Arithmetic mean (x̄): 24.75
Sau khi loại bỏ ngoại lai
Giá trị trung bình của mẫu là Arithmetic mean (x̄): 23
Sai biệt là 24.75 - 23 = 1.75
Trần hồng Cơ
Ngày 10/02/2016
------------------------------------------------------------------------------------------- -
Những điều biết được chỉ là hạt cát , những điều chưa biết là cả một đại dương .
Isaac Newton