T TEST LÀ GÌ

  -  

Đây là bài xích dịch giờ đồng hồ Việt của chính mình về một nội dung bài viết rất hay giải thích ý nghĩa sâu sắc của phương pháp t-test (hay phương pháp kiểm định t – trong bài viết mình chỉ gọi là t-test mang lại ngắn gọn) của tác giả Patrick Runkel. Bài gốc bằng tiếng Anh mang tên đầy đủ là “What Is a t-test? & Why Is It lượt thích Telling a Kid khổng lồ Clean Up that Mess in the Kitchen?” cùng các bạn cũng có thể đọc bài gốc tại đây.

Bạn đang xem: T test là gì

Phương pháp t-test là giữa những thủ tục được sử dụng phổ biến chuyển nhất trong khoa học thống kê.

Nhưng thậm chí là những người tiêu dùng t-test một cách tiếp tục cũng đắn đo chính xác phương thức này chuyển động như vậy nào bởi toàn bộ các tài liệu đều được cách xử trí sau tấm màn che của các phần mềm thống kê, ví như Minitab.

Và thiệt là đáng để bọn họ bỏ một chút thời gian để xem phương thức t-test hoạt động như vậy nào ở phía sau tấm màn che đó.

Bởi vì nếu như khách hàng hiểu được cách phương pháp t-test hoạt động, chúng ta có thể hiểu tại 1 mức độ sâu rộng về dữ liệu của người sử dụng dựa trên tác dụng mà cách thức t-test với lại. Và chúng ta cũng phát âm sâu hơn tại sao kết quả nghiên cứu của bạn đạt được (hoặc ko đạt được) “ý nghĩa thống kê” (statistical significant).

Thực tế là nếu bạn có một người con đang vào tuổi teen thích ăn chơi nhiều hơn nữa là thích làm việc nhà thì chắc hẳn rằng là bạn đã có một trải nghiệm giống hệt như những nguyên lý cơ bạn dạng đằng sau cách thức t-test.

*

Giải phẫu cách thức t-test

Phương pháp t-test được dùng một cách phổ cập để xác minh xem liệu cực hiếm trung bình của một quần thể (the mean of a population) có khác hoàn toàn với một cực hiếm nào đó (gọi là cực hiếm trung bình đưa thuyết – a hypothesized mean) hoặc với giá trị vừa đủ của một quần thể khác.

Ví dụ, phương pháp 1-sample t-test (hay cách thức kiểm định t cho 1 mẫu) được dùng để kiểm định xem liệu thời hạn chờ trung bình của những bệnh nhân trong một bệnh viện y khoa có lâu bền hơn so với thời gian mong ước ao là 15 phút tuyệt không, dựa vào dữ liệu từ một đội ngẫu nhiên các bệnh nhân.

Để khẳng định xem liệu sự khác hoàn toàn (giữa thời hạn chờ thực tế và thời hạn mong muốn) có ý nghĩa sâu sắc thống kê hay không, phương thức t-test sẽ giám sát và đo lường một giá chỉ trị gọi là t-value (giá trị p-value nổi tiếng cũng được lấy thẳng từ t-value). Quý giá này được tính như sau:

t = fracarx - mu _0fracssqrtn

Công thức toán học này trông có vẻ bí mật nhưng thực tế bạn hoàn toàn có thể làm chủ được nó nếu như khách hàng hiểu được hai cồn lực quan trọng đằng sau nó : thành phần số (ở phía trên) với phần mẫu mã số (ở phía dưới).

Phần tử số là Tín Hiệu

Phần tử số trong phương pháp 1-sample t-test thống kê giám sát độ mạnh mẽ của tín hiệu (signal): sự khác hoàn toàn giữa cực hiếm trung bình của mẫu dữ liệu của chúng ta (arx) và giá trị trung bình trả thuyết của quần thể (mu_0).

*

Trở lại với ví dụ về thời hạn chờ của các bệnh nhân, giá trị trung bình mang thuyết là 15 phút.

Nếu những bệnh nhân vào mẫu tài liệu ngẫu nhiên của chúng ta có thời hạn chờ trung bình là 15.1 phút, tín hiệu bằng 15.1 – 15 = 0.1 phút. Giá trị biệt lập này tương đối nhỏ, do vậy tín hiệu ở phần tử số thì yếu.

Tuy nhiên, nếu thời hạn chờ vừa phải của người bị bệnh là 68 phút, sự khác biệt sẽ to hơn và bởi 68-15=53 phút. Do vậy, biểu đạt sẽ mạnh hơn.

Xem thêm: Ebs Là Gì - Ebs Là Phí Gì

Phần mẫu mã số là Nhiễu

Phần chủng loại số thống kê giám sát mức độ dao động hay “nhiễu” (noise) trong mẫu dữ liệu của bạn.

*

Kí hiệu 

*
là độ lệch chuẩn (standard deviation) – biểu hiện mức giao động trong dữ liệu của bạn. Nếu như khách hàng có một bệnh nhân chờ 50 phút, một người bị bệnh khác đợi 12 phút, một fan khác nữa ngóng 0.5 phút, một người khác nữa đợi 175 phút,… thì có thể nói rằng rằng tài liệu của bạn có tương đối nhiều dao động. Điều này có nghĩa rằng nếu quý hiếm s càng lớn, mức độ nhiễu vào dữ liệu của doanh nghiệp càng lớn. Khoác khác, nếu bạn có một người bệnh chờ 14 phút, một người khác ngóng 16 phút, một người bị bệnh khác hóng 12 phút, thì nói theo một cách khác rằng dữ liệu của chúng ta có ít dao động. Điều này có nghĩa rằng nếu giá trị s càng nhỏ dại thì dữ liệu của các bạn sẽ ít “nhiễu” hơn.

Còn kí hiệu sqrtn ở bên dưới s có ý nghĩa là gì? Đó là căn bậc hai kích cỡ mẫu dữ liệu của bạn (ví dụ ví như mẫu của bạn có 30 người thì n = 30). Nếu rất nhiều thứ đều bằng nhau thì tài liệu của bạn sẽ bị nhiễu nhiều hơn nếu size mẫu dữ liệu của bạn nhỏ dại và vẫn ít nhiễu rộng nếu kích thước mẫu dữ liệu của doanh nghiệp lớn.

Giá trị t-value là tỉ lệ của tín hiệu so cùng với Nhiễu

Công thức phía trên cho thấy t-value dễ dàng là đối chiếu độ mạnh của tín hiệu với độ nhiễu vào mẫu dữ liệu của bạn.

Nếu tín hiệu tương đối yếu so với mức độ nhiễu thì t-value sẽ nhỏ hơn. Do đó mức độ biệt lập sẽ ít có tác dụng có chân thành và ý nghĩa thống kê.

*

Ở biểu vật bên bắt buộc của hình phía trên, sự khác biệt giữa giá trị trung bình của tài liệu arx và giá trị trung bình đưa thuyết mu_0 là 16 phút. Nhưng cũng chính vì các dữ liệu trong mẫu bị trải rộng ra đề nghị sự khác hoàn toàn này không có ý nghĩa thống kê. Tại sao lại như vậy? bởi vì t – value — tỉ lệ thành phần giữa dấu hiệu và nhiễu — thì tương đối nhỏ nhắn do mẫu mã số lớn.

Tuy nhiên, nếu biểu đạt thì mạnh kha khá so với nhiễu, size (tuyệt đối) của t-value sẽ phệ hơn. Bởi đó, sự khác hoàn toàn giữa arx với mu_0 sẽ có nhiều khả năng có ý nghĩa sâu sắc thống kê hơn.

*

Ở hình trên, sự khác hoàn toàn giữa arx với mu_0 cũng chính là 16 phút. Size dữ liệu cũng bởi nhau. Nhưng lại lần này, các điểm tài liệu co nhiều lại gần nhau hơn. Vì tài liệu ít xê dịch hơn, cần sự khác hoàn toàn của 16 phút lúc này lại mang ý nghĩa thống kê.

Thông điệp về ý nghĩa thống kê

Phương pháp t-test là thế nào với việc bảo nhãi nhép teenager nhà bạn đi vệ sinh bếp?

Nếu như tinh ma teenager đang nghe nhạc, đã chơi đoạn clip game, gửi tin nhắn nhắn cho chính mình bè, hoặc bị lơ là bởi những nguồn “nhiễu” khác, bạn cần phải nói to ra thêm và dạn dĩ hơn để có thể đạt được nút “ý nghĩa”. Hoặc nếu chúng ta cũng có thể xóa bỏ được những nguồn nhiễu thì bạn hoàn toàn không rất cần được ăn lớn nói phệ với ranh mãnh teenager đơn vị bạn.

Một phương pháp tương tự, trường hợp như tác dụng t-test của chúng ta không đạt được ý nghĩa thống kê thì hoàn toàn có thể là do 1 trong các tại sao sau đây:

Độ khác biệt (tín hiệu) là chưa đủ lớn. Chúng ta không thể làm cái gi được hơn nếu vấn đề đó xảy ra, đưa sử rằng nghiên cứu của bạn sử dụng đúng cách thức và mẫu tài liệu mà bạn tích lũy mang tính thay mặt đại diện cho quần thể.Độ giao động dữ liệu (nhiễu) thừa lớn. Đây là vì sao tại sao câu hỏi remove những điểm phi lý (outlier) vào dữ liệu của doanh nghiệp là điều siêu quan trọng. Bạn có thể dùng control chart để phát hiện và sa thải các điểm outlier ra khỏi dữ liệu trước khi triển khai t-test.

Xem thêm: Trò Chơi Nông Trại Chăn Nuôi Thu, Game Nông Trại

Mẫu tài liệu quá nhỏ. Nút độ dao động sẽ bé dại đi nếu form size dữ liệu lớn. Điều này tức là nếu tất cả cùng một độ khác biệt và thuộc một quý hiếm dao động, nếu size dữ liệu càng mập thì càng có công dụng đạt được ý nghĩa sâu sắc thống kê – như biểu đồ mặt dưới.

*

( Điều này giải thích tại sao một mẫu tài liệu có kích thước cực lớn hoàn toàn có thể tạo ra được chân thành và ý nghĩa thống kê mặc dù độ khác biệt rất nhỏ tuổi và trọn vẹn không có tác động thực tế.)

Công thức này cũng giải thích tại sao những nhà thống kê học tập lại than thở trong phản bội ứng cùng với ngôn ngữ nhiều khi được sử dụng để tóm lại về một tác dụng t-test. Ví dụ, một tác dụng t-test không mong đợi sẽ tiến hành phát biểu : “There is no significant difference…”

Không độc nhất thiết phải như vậy…

Thực tế là rất có thể có một độ biệt lập mang ý nghĩa. Nhưng tất cả thể bởi vì mẫu dữ liệu của người tiêu dùng quá nhỏ, hoặc có thể độ dao động của các điểm dữ liệu quá lớn khiến cho nghiên cứu của chúng ta không diễn tả được ý nghĩa sâu sắc thống kê. Bạn có thể phát biểu một cách an ninh hơn rằng: “Nghiên cứu vớt của chúng tôi đã không tìm kiếm thấy bệnh cứ của một độ khác hoàn toàn mang ý nghĩa thống kê.”