Tiện ích
Cẩm nang
Trong thế giới hiện đại và công nghệ số hóa, các quyết định đều phải dựa trên dữ liệu và các phân tích thống kê. Trong quá trình đó, giả thuyết đóng một vai trò quan trọng, dù nó được dùng để phục vụ việc đưa ra quyết định trong kinh doanh, y tế, học thuật hay cải tiến chất lượng. Nếu không có giả thuyết và các bài kiểm tra giả thuyết thì đến các chuyên gia cũng có khả năng đưa ra quyết định sai lầm. Kiểm tra giả thuyết hay kiểm định giả thuyết có tên gọi quốc tế là Hypothesis testing. Để hiểu kỹ hơn về Hypothesis testing là gì, hãy theo dõi tiếp bài viết này.
MỤC LỤC
Hypothesis testing hay kiểm định giả thuyết là những thủ tục điều tra, nghiên cứu và kiểm nghiệm những ý tưởng bằng số liệu thống kê thực tế. Nó thường được các nhà khoa học dùng để kiểm tra các dự đoán cụ thể hay các giả thuyết suy luận được từ lý thuyết.
Hay nói cách khác, đây là một hành động trong thống kê, nhà phân tích sẽ kiểm tra một giả định từ dữ liệu một mẫu để đưa ra kết luận về tập hợp tham số hoặc phân phối thống kê.
Một kiểm định giả thuyết có thể được thực hiện trên các thông số của một hoặc nhiều quần thể, cũng như trong nhiều tình huống khác nhau. Trong mỗi trường hợp, quá trình này bắt đầu bằng việc xây dựng các giả thuyết vô hiệu và giả thuyết thay thế về dân số. Ngoài giá trị trung bình của tổng thể thì các quy trình kiểm định giả thuyết có sẵn cho các tham số dân số như tỷ lệ, phương sai, độ lệch chuẩn và trung bình.
Kiểm định giả thuyết cũng được sử dụng trong việc phân tích hồi quy và tương quan để xác định xem mối quan hệ hồi quy và hệ số tương quan có ý nghĩa thống kê hay không.
Hypothesis testing hay kiểm định giả thuyết được sử dụng để đánh giá tính hợp lý của một giả thuyết nào đó bằng cách sử dụng dữ liệu thực tiễn. Thử nghiệm này sẽ cung cấp bằng chứng để chứng minh tính hợp lý của một giả thuyết được xây dựng dựa trên lý thuyết.
Các chuyên gia có thể kiểm tra bằng cách đo lường và kiểm tra một đơn vị số liệu, dân số, tài liệu ngẫu nhiên nào đó đang được phân tích để đưa ra kết quả khách quan nhất.
Trong kiểm định giả thuyết, nhà phân tích sẽ sử dụng chung một mẫu thống kê để kiểm tra hai giả thuyết khác nhau là giả thuyết vô hiệu hay giả thuyết rỗng và giả thuyết thay thế.
Giả thuyết vô hiệu hay giả thuyết rỗng phản ánh sự bình đẳng giữa các tham số. Ví dụ như giả thuyết “Lợi tức trung bình của tổng thể bằng 0”. Ngược lại, giả thuyết thay thế lại trái ngược hoàn toàn với giả huyết vô hiệu, ví dụ như “Lợi tức trung bình của tổng thể không bằng 0”. Do đó, hai giả thuyết này loại trừ lẫn nhau, cái này đúng thì cái kia sai. Tuy nhiên, cái nào đúng sẽ luôn đúng chứ không thể bị thay đổi.
Tất cả các giả thuyết đều được kiểm định qua quy trình 5 bước:
Đưa ra giả thuyết ban đầu của bạn, đây là điều mà bạn đã dự đoán và cũng là điều mà bạn muốn điều tra. Giả thuyết này được ký hiệu là Ha, từ đó đưa ra giả thuyết vô hiệu hay giả thuyết rỗng ký hiệu là H0 có xu hướng trái ngược lại với Ha.
Ví dụ: Nếu bạn muốn kiểm tra xem giới tính có mối liên hệ nào với chiều cao hay không. Dựa trên kiến thức về sinh lý học, bạn có thể xây dựng giả thuyết nam giới cao hơn nữ giới. Để kiểm định giả thuyết này, bạn sẽ đặt tên các giả thuyết như sau:
H0: Chiều cao trung bình của nam giới không cao hơn nữ giới.
Ha: Chiều cao trung bình của nam giới cao hơn nữ giới.
Để có thể đưa ra được những bằng chứng xác thực và có giá trị thì bạn cần phải tiến hành lấy mẫu và thu thập dữ liệu theo cách thức được quy định sẵn. Nếu dữ liệu bạn thu được không có tính đại diện thì bạn không thể đưa ra suy luận thống kê chính xác về vấn đề mà bạn đang quan tâm.
Ví dụ: Để kiểm tra sự khác biệt về chiều cao trung bình giữa nam và nữ, bạn cần phải thu thập thông tin về số lượng nam và nữ bằng nhau, ở nhiều tầng lớp xã hội và những yếu tố có thể ảnh hưởng đến chiều cao của cả 2 giới để tạo sự khách quan và chính xác nhất có thể.
Bạn cũng cần xem xét về yếu tố vị trí địa lý, đặc biệt là quốc gia. Nguồn dữ liệu tiềm năng thì càng ở phạm vi rộng và càng nhiều thông tin càng tốt.
Có nhiều bài kiểm tra thống kê có sẵn, nhưng tất cả chúng đều phải dựa trên sự so sánh phương sai trong nhóm so với phương sai giữa các nhóm. Nếu phương sai giữa các nhóm đủ lớn để có ít hoặc không có sự trùng lặp giữa các nhóm thì dữ liệu phân tích thống kê của bạn sẽ phản ánh điều đó bằng cách hiển thị giá trị p thấp. Ngược lại, nếu phương sai trong nhóm có sự chênh lệch nhiều thì dữ liệu phân tích thống kê của bạn sẽ phản ánh điều này bởi giá trị p cao.
Dựa trên kết quả bài kiểm tra thống kê, bạn sẽ đưa ra bác bỏ hoặc không bác bỏ giả thuyết vô hiệu đã nêu trên.
Trong hầu hết các trường hợp, bạn sẽ phải dựa vào giá trị p để đưa ra quyết định. Mức sai sót cho phép để bác bỏ giả thuyết vô hiệu là 5%, nhưng trong nhiều trường hợp để chắc chắn hơn thì các chuyên gia giảm mức sai sót cho phép xuống 1%. Điều này làm giảm rủi ro và nâng cao tính chân thực của giả thuyết hơn.
Kết quả của giả thuyết sẽ được trình bày trong phần thảo luận của bài nghiên cứu.
Trong phần kết quả, bạn nên ra tóm tắt dữ liệu của thử nghiệm thống kê. Trong phần thảo luận thì bạn có thể đưa ra thảo luận xem giả thuyết ban đầu có được hỗ trợ bởi kết quả thống kê hay không. Quay trở lại với giả thuyết ban đầu, đưa ra kết luận kết quả thử nghiệm có phù hợp với giả thuyết thay thế hay không, nếu không thì nó phù hợp với giả thuyết vô hiệu.
Cần chú ý, kiểm định giả thuyết không đưa ra quyết định bác bỏ hay không bác bỏ giả thuyết, vì thử nghiệm giả thuyết không phải được tạo ra để chứng minh hay bác bỏ bất cứ điều gì. Chúng được thiết kế để kiểm tra mẫu đo lường có thể xuất hiện ngẫu nhiên như thế nào. Nếu chúng ta bác bỏ bất kỳ giả thuyết vừa nghiên cứu do số liệu của thống kê không phù hợp, thì có nghĩa chúng ta đã khẳng định chúng không có bất cứ khả năng nào xuất hiện dù chỉ là tình cờ. Trên thực tế, mọi chuyện đều có thể xảy ra, thứ chúng ta kiểm nghiệm chỉ là xác suất, chỉ là một dữ liệu bất kỳ không phải toàn bộ, chúng không đúng hoàn toàn hay sai hoàn toàn. Chúng ta sẽ không kết luận bác bỏ giả thuyết nào mà chỉ kết luận rằng giả thuyết này không phù hợp với kết quả thử nghiệm hay có phù hợp với kết quả thử nghiệm.
Cuối cùng xem đến đây, bạn đã biết Hypothesis testing là gì chưa? Nói tóm lại nó là một phương pháp để kiểm định giả thuyết dựa trên số liệu xác suất thống kê hay điều tra dữ liệu dân số. Đây là phương pháp quan trọng trong nhiều lĩnh vực và công việc đời sống, phục vụ quá trình điều tra nghiên cứu của các chuyên gia nhằm cải thiện và phát triển xã hội con người.
Ngoài Hypothesis testing, ngày này còn có rất nhiều phương pháp nghiên cứu khoa học được ứng dụng trong thực tiễn. Những phương pháp này giúp các nhà khoa học, chuyên gia thực hiện các cuộc khảo sát và nghiên cứu chuyên sâu, hiệu quả và chính xác hơn. Hãy cùng xem đó là những phương pháp gì nhé!
MỤC LỤC
Chia sẻ