Đồ thị và biểu đồ Excel là một cách tốt để trực quan hóa các tập dữ liệu phức tạp và Đường cong hình chuông (Bell curve) cũng không ngoại lệ. Hãy tìm hiểu làm thế nào tạo biểu đồ này trên Excel.
Hãy nhớ rằng mục đích của đường cong hình chuông không chỉ đơn giản là làm đẹp dữ liệu. Có nhiều hình thức phân tích dữ liệu có thể được thực hiện trên một biểu đồ như vậy, tiết lộ nhiều xu hướng và đặc điểm của tập dữ liệu. Tuy nhiên, đối với hướng dẫn này, chúng tôi sẽ chỉ tập trung vào việc tạo đường cong hình chuông chứ không phân tích nó.
Giới thiệu về Normal Distribution
Các đường cong chuông chỉ hữu ích để trực quan hóa các bộ dữ liệu được phân phối bình thường. Vì vậy, trước khi đi sâu vào các đường cong hình chuông, chúng ta hãy xem xét ý nghĩa của Normal Distribution.
Về cơ bản, bất kỳ tập dữ liệu nào có các giá trị phần lớn được nhóm xung quanh giá trị trung bình đều có thể được gọi là Normal Distribution (hoặc phân Gaussian distribution như đôi khi nó được gọi). Hầu hết các bộ dữ liệu được thu thập một cách tự nhiên đều có xu hướng như vậy, từ số hiệu suất của nhân viên cho đến số liệu bán hàng hàng tuần.
Đường cong hình chuông là gì và tại sao nó hữu ích?
Do các điểm dữ liệu của Normal Distribution được tập hợp quanh giá trị trung bình, nên sẽ hữu ích hơn khi đo phương sai của từng điểm dữ liệu từ giá trị trung bình thay vì giá trị tuyệt đối của nó. Và vẽ các phương sai này dưới dạng biểu đồ sẽ tạo ra Đường cong hình chuông.
Điều này cho phép bạn nhanh chóng phát hiện ra các giá trị ngoại lệ, cũng như xem hiệu suất tương đối của các điểm dữ liệu so với mức trung bình. Đối với những thứ như đánh giá nhân viên và điểm số của sinh viên, điều này mang lại cho bạn khả năng phân biệt những người làm việc kém hiệu quả.
Cách tạo đường cong hình chuông
Không giống như nhiều biểu đồ đơn giản trong Excel , bạn không thể tạo đường cong hình chuông chỉ bằng cách chạy trình hướng dẫn trên tập dữ liệu của mình. Dữ liệu cần một chút xử lý trước. Dưới đây là những gì bạn cần làm:
- Bắt đầu bằng cách sắp xếp dữ liệu theo thứ tự tăng dần. Bạn có thể thực hiện việc này một cách dễ dàng bằng cách chọn toàn bộ cột và sau đó chuyển đến Data > Sort Ascending.
- Tiếp theo, tính giá trị trung bình (hoặc Mean) bằng hàm Average . Vì kết quả thường ở dạng số thập phân, nên bạn cũng nên ghép nó với hàm Round .
Đối với tập dữ liệu mẫu của chúng tôi, hàm trông giống như sau:
=ROUND(AVERAGE(D2:D11),0)
- Bây giờ chúng ta có hai hàm để tính Độ lệch chuẩn. STDEV.S được sử dụng khi bạn chỉ có một mẫu dân số (thường là trong nghiên cứu thống kê) trong khi STDEV.P được sử dụng khi bạn có bộ dữ liệu hoàn chỉnh.
Đối với hầu hết các ứng dụng thực tế (đánh giá nhân viên, điểm của sinh viên, v.v.), STDEV.P là lý tưởng. Một lần nữa, bạn có thể sử dụng hàm Round để lấy một số nguyên.
=ROUND(STDEV.P(D2:D11),0)
- Tất cả những điều này chỉ là công việc chuẩn bị cho các giá trị thực mà chúng ta cần – Normal distribution. Tất nhiên, Excel cũng đã có một chức năng dành riêng cho việc đó.
Hàm NORM.DIST nhận bốn đối số – điểm dữ liệu, giá trị trung bình, độ lệch chuẩn và cờ boolean để cho phép phân phối tích lũy. Chúng tôi có thể bỏ qua cái cuối cùng một cách an toàn (đặt FALSE) và chúng tôi đã tính toán giá trị trung bình và độ lệch. Điều này có nghĩa là chúng ta chỉ cần cung cấp các giá trị cho ô và chúng ta sẽ nhận được kết quả.
=NORM.DIST(D2,$D$12,$D$13,FALSE)
Làm điều đó cho một ô và sau đó chỉ cần sao chép công thức cho toàn bộ cột – Excel sẽ tự động thay đổi các tham chiếu để khớp với các vị trí mới. Nhưng trước tiên hãy đảm bảo khóa tham chiếu ô trung bình và độ lệch chuẩn bằng cách sử dụng ký hiệu $.
- Chọn phân phối bình thường này cùng với các giá trị ban đầu. Phân phối sẽ tạo thành trục y trong khi các điểm dữ liệu gốc tạo thành trục x.
- Đi tới menu Insert và điều hướng đến sơ đồ phân tán. Chọn tùy chọn Scatter with Smooth Lines .
Cách tốt nhất để tạo biểu đồ đường cong hình chuông trong MS Excel là gì?
Biểu đồ đường cong hình chuông có vẻ phức tạp nhưng thực ra lại khá đơn giản để tạo. Tất cả những gì bạn cần là các điểm phân phối bình thường của tập dữ liệu của bạn.
Đầu tiên, xác định giá trị trung bình và độ lệch chuẩn bằng các công thức Excel tích hợp. Sau đó, sử dụng các giá trị này để tính toán normal distribution của toàn bộ tập dữ liệu.
Biểu đồ đường cong hình chuông chỉ là một biểu đồ Scatter with Smooth Lines sử dụng các điểm dữ liệu gốc cho trục x và các giá trị normal distribution cho trục y. Nếu tập dữ liệu của bạn được phân phối bình thường, bạn sẽ nhận được một đường cong hình chuông mượt mà trong Excel.