Thống kê tế bào tả
Thống kê biểu hiện ( giờ đồng hồ Anh : Descriptive Statistics ) là những thông số mô tả ngắn gọn hay tóm tắt một tập tài liệu duy nhất định, hoàn toàn có thể là đại diện thay mặt thay mặt cho hàng loạt hoặc một mẫu của một trọn vẹn và toàn diện .
Bạn đang xem: Phương pháp thống kê mô tả trong nghiên cứu khoa học
Khái niệm
Thống kê mô tảtrong tiếng Anh là Descriptive Statistics.
Bạn sẽ xem: phương pháp thống kê bộc lộ trong nghiên cứu khoa học
Thống kê tế bào tả là những hệ số biểu lộ ngắn gọn hay tóm tắt một tập tài liệu nhất định, có thể là thay mặt đại diện cho toàn bộ hoặc một chủng loại của một tổng thể.
Thống kê diễn tả được phân thành đo lường xu thế tập trung và giám sát biến động. Đo lường xu hướng tập trung có mức giá trị trung bình,trung vịvàyếu vị, trong khi các đo lường biến cồn gồmđộ lệch chuẩn,phương sai, giá bán trị nhỏ nhất cùng giá trị to nhất, độ nhọn vàđộ lệch.
Đặc điểm của số liệu thống kê mô tả
Thống kê biểu hiện giúp biểu lộ và phát âm được những đặc điểm của một cỗ tài liệu đối kháng cử bằng cách đưa ra hầu như tóm tắt ngắn về chủng loại và những thông số kỹ thuật của tài liệu. Các loại thống kê mô tả phổ biến nhất là cácthông số xu gắng tập trung chuyên sâu gồm : quý hiếm trung bình, trung vị với yếu vị, những thông số kỹ thuật này được áp dụng ở số đông những Lever toán học và thống kê .Giá trị vừa phải được tính bằng cách cộng toàn diện những số liệu trong tập dữ liệu sau đó chia cho số lượng tài liệu vào tập. Lấy một ví dụ : tổng của tập tài liệu sau là 20 : ( 2, 3, 4, 5, 6 ). Giá trị trung bình là 4 ( bằng 20/5 ). Yếu đuối vị của tập tài liệu là quý giá Open tiếp tục nhất với trung vị là số nằm ở vị trí giữa tập dữ liệu. Ngoại trừ ra, có những thông số kỹ thuật kỹ thuật thống kê biểu thị ít thịnh hành hơn nhưng vẫn rất quan trọng đặc biệt .
Thống kê tế bào tả được áp dụng để cung ứng những thông tin định lượng phức tạp của một bộ dữ liệu lớn thành những mô tả đối kháng giản.
Ví dụ, điểm trung bình của học tập viên ( GPA ) là một trong những dạng thông tin đã có được từ áp dụng thống kê bộc lộ trong thực tiễn. GPA là trung bình của tài liệu xuất phát từ một loạt những bài kiểm tra, lớp học với điểm số với nhau giúp thấy xét năng lượng học tập thông thường của học viên. Điểm trung bình cá thể của học tập viên phản bội ánh tác dụng học triệu tập bình của học tập viên kia .
Các thông số kỹ thuật trong thống kê tế bào tả
Tất cả những số liệu thống kê mô tả hoặc là các thông số đo lường và tính toán xu hướng triệu tập hoặc là những thông số thống kê giám sát biến động, hay nói một cách khác là các thông số tính toán sự phân tán của dữ liệu. Các thông số giám sát và đo lường xu phía tập trung khẳng định giá trị trung bình hoặc giá trị nằm ở vị trí giữa của các tập dữ liệu.
Các thông số giám sát xu hướng triệu tập mô tả địa chỉ trung vai trung phong của triển lẵm tập dữ liệu. Để so sánh tần số của từng điểm dữ liệu trong triển lẵm và biểu đạt nó bên phân tích áp dụng giá trị trung bình, trung vị hoặc yếu ớt vị để đo những giá trị xuất hiện nhiều duy nhất của tập tài liệu được phân tích.
Các thông số đo lường phát triển thành động, hay các biện pháp giám sát sự phân tán, cung ứng việc đối chiếu mức độ lan truyền trong trưng bày của một tập dữ liệu. Ví dụ, trong khi các thông số đo lường xu phía tập trung hoàn toàn có thể cung cung cấp mức mức độ vừa phải của tập dữ liệu, nó lại không mô tả cách dữ liệu được phân phối thế nào trong tập thích hợp đó.
Vì vậy, mặc dầu trung bình của tài liệu hoàn toàn hoàn toàn có thể là 65 vào 100, vẫn trả toàn hoàn toàn có thể có gần như điểm tài liệu làm việc điểm 1 với 100 vào tập dữ liệu. Các thông số kỹ thuật kỹ thuật giám sát và thống kê dịch rời giúp xác lập điều này bằng cách mô tả ngoài mặt và cường độ phân tán của tập dữ liệu .
Khoảng vươn lên là thiên, tứ phân vị, độ lệch tốt đối cùng phương không nên là ví dụ nổi bật về những thông số giám sát và đo lường biến động.
Xem xét tập tài liệu sau : 5, 19, 24, 62, 91, 100. Khoảng tầm biến thiên của tập tài liệu đó là 95, được tính bằng cách trừ giá bán trị tối đa ( 100 ) đến giá trị thấp độc nhất ( 5 ) .
Các ý chính
– Thống kê tế bào tả cầm tắt hoặc biểu thị các điểm sáng của một tập dữ liệu.
– Thống kê diễn tả gồm bao gồm hai loại thông số kỹ thuật kỹ thuật giám sát và những thống kê cơ bản : đo lường khuynh hướng tập trung nâng cao và thống kê giám sát và đo lường sự biến hóa hoặc độ phân tán .- Đo lường xu thay tập trung sâu xa mô tả TT của một tập tài liệu .- Đo lường sự dịch rời hoặc phân tán diễn đạt sự phân tán tài liệu trong tập dữ liệu .
Thống kê biểu đạt (Descriptive Statistics) là các cách thức sử dụng để tóm tắt hoặc biểu hiện một tập vừa lòng dữ liệu, một mẫu nghiên cứu dưới dạng số xuất xắc biểu trang bị trực quan. Những công thay số dùng để làm mô tả thường dùng nhất là trung bình cùng và độ lệch chuẩn. Các công cố kỉnh trực quan thường dùng nhất là những biểu đồ.

Trong loạt bài xích “Thống kê biểu hiện trong nghiên cứu”, 4 đội đại lượng của thống kê biểu đạt sẽ theo thứ tự được trình làng một cách tổng quát và gửi ra phần nhiều trường hòa hợp sử dụng, bao gồm:
Các đại lượng về trung tâmCác đại lượng về độ phân tán
Các đại lượng về dáng vẻ phân phối
Các đại lượng về sự tương quan
Trong Phần 1 – các đại lượng về trung tâm, 3 thước đo được thực hiện rộng rãi nhằm biểu diễn một giá bán trị bộc lộ vị trí/xu thế “trung tâm” của tập tài liệu được giới thiệu: mức độ vừa phải (mean – trung tâm về mặt giá trị), trung vị (median – trung tâm về khía cạnh vị trí) cùng yếu vị (mode – trung chổ chính giữa về nút độ tập trung dữ liệu).
Tổng quan lại về 3 đại lượng miêu tả vị trí/xu ráng “trung tâm” của tập dữ liệu
Trung bình Pythagore (Pythagorean Means) | Trung vị (Median) | Yếu vị (Mode) | |
Trung tâm về mặt giá chỉ trị | Trung trọng tâm về phương diện vị trí | Trung trung ương về mức độ tập trung dữ liệu | |
ĐỊNH NGHĨA
| Đại lượng mức độ vừa phải Pythagore trình bày trung trung tâm về mặt giá trị của tập dữ liệu, bao gồm: Trung bình cộng (Arithmetic mean) Là thước đo thịnh hành nhất và dễ nắm bắt nhất về xu hướng trung vai trung phong trong tập dữ liệu. Mức độ vừa phải cộng bao hàm trung bình cộng dễ dàng và đơn giản và trung bình cộng tất cả trọng số. |
Trung bình nhân (Geometric mean) Còn được call là vừa đủ hình học, cho thấy xu hướng trung tâm hoặc giá bán trị điển hình nổi bật của một tập thích hợp số bằng phương pháp sử dụng tích những giá trị của chúng. Giá trị trung bình nhân hay được thực hiện cho một tập hợp các số có mức giá trị được nhân cùng nhau hoặc có tính chất cấp số nhân, ví dụ như một tập hợp các số liệu lớn mạnh như: dân sinh hoặc lãi vay của một khoản đầu tư tài bao gồm theo thời gian. |
Trung bình điều hòa (Harmonic mean) Thường được sử dụng để tìm giá trị trung bình của các quan ngay cạnh được trình diễn bởi tỉ số của hai giá chỉ trị gồm hai đơn vị chức năng đo khác nhau chẳng hạn như tốc độ dịch chuyển trung bình trong một khoảng tầm thời gian. |
Trung vị là 1 trong những số tách bóc giữa nửa to hơn và nửa bé hơn của một mẫu, một quần thể, hay như là 1 phân tía xác suất. Trung vị là quý giá giữa, có nghĩa ½ quan tiền sát sẽ sở hữu các giá trị bé dại hơn hay thông qua số trung vị, với ½ quan sát sẽ có được giá trị bởi hoặc to hơn số trung vị.
Yếu vị là giá chỉ trị mở ra nhiều lần độc nhất vô nhị trong tập dữ liệu. Gồm tập dữ liệu có 1 mode, có tập tài liệu có mang lại 2 hoặc 3 mode cùng cũng rất có thể có tập dữ liệu không tồn tại mode nào.
CÁCH TÍNH
Trung bình nhân (Geometric mean) Số vừa phải nhân của n giá trị xi gồm quan hệ tích số hình dáng x1× x2 × x3 ... × xn được tính theo công thức: ![]() |
Trung bình ổn định (Harmonic mean) Công thức thông thường của trung bình điều hòa bao gồm dạng: ![]() Hoặc đơn giản và dễ dàng hơn là nghịch đảo của trung bình cộng của tập dữ liệu: ![]() |
- Tập dữ liệu có số quan tiếp giáp (n) là số lẻ: quan tiền sát tại đoạn thứ <(n+1)/2> là số trung vị.
- Tập dữ liệu có số quan sát (n) là số chẵn: số trung vị là cực hiếm trung bình cộng của 2 quan cạnh bên nằm tại đoạn n/2 cùng <(n+2)/2>)
Ví dụ đơn giản và dễ dàng để tra cứu số trung vị:
Cho tập tài liệu X=2,4,5,6,7,8,8,8,9,9.
- Tập dữ liệu này còn có 10 giá chỉ trị. Quý giá trung vị là trung bình cộng của quan sát nằm ở chỗ thứ 5(7) cùng 6(8).
Số trung vị là (7+8)/2 = 7,5.
Đếm số lần mở ra của các giá trị, giá trị mở ra nhiều nhất đó là số mode.
Ví dụ đơn giản để tìm kiếm số mode:
Cho tập dữ liệu: X=2,4,5,6,7,8,8,8,9,9.
Tập dữ liệu này có giá trị 8 mở ra nhiều tốt nhất (3 lần).
Số mode là 8.
MÔ TẢ BẰNG ĐỒ THỊ

MỘT SỐ ỨNG DỤNG THƯỜNG GẶP VÀ VÍ DỤ MINH HỌA
Trung bình nhân (Geometric mean) - mức độ vừa phải nhân hay được thực hiện để tính tỷ lệ tăng trưởng trung bình, còn gọi là tỷ lệ vững mạnh kép thường niên (CAGR). - vào tài chính, mức độ vừa phải nhân được sử dụng để tính cống phẩm hàng năm vào danh mục đầu tư chứng khoán; xây dựng các chỉ số chứng khoán. Ví dụ: Nhà đầu tư chi tiêu có nguồn vốn thuở đầu là 1 tỷ đồng, lãi suất đầu tư nhận được qua 5 năm theo lần lượt là: 2%, 5%, 7%, 8%, 10%. Nếu nhà đầu tư chi tiêu tiếp tục tái chi tiêu hàng năm, tính số chi phí nhà đầu tư thu sau này 5 năm? - Vốn ban đầu: Vo=1.000.000.000đ- tiền lãi nhà đầu tư nhận sau 5 năm được gọi là lãi kép, được tính bằng cách sử dụng vừa phải nhân như sau: ![]() Số chi phí nhà đầu tư chi tiêu nhận được sau 5 năm: ![]() - dùng để thống kê giám sát trong các nghành thống kê làng mạc hội nhà yếu phụ thuộc khả năng đo lường và thống kê từ các nguồn tài liệu khác thang đo nhưng không cần chuẩn chỉnh hóa <2>. Ví dụ: Một công ty muốn xác định unique học tập của hai nhân viên mới được cử đi tập huấn là A cùng B. Mặc dù nhiên, A và B được tập huấn ở cả hai tổ chức theo thứ tự là U1 với U2 cùng với 2 thang điểm đánh giá tác dụng khác nhau:- tổ chức triển khai U1 (thang điểm 5):rating(U1, A) = 4,5; rating(U1, B) = 3,5- tổ chức U2 (thang điểm 100):rating(U2, A) = 70; rating(U2, B) = 80 Vậy unique học tập trung bình của A giỏi B cao hơn? Thông thường, giả dụ thực hiện chuẩn chỉnh hóa về thuộc 1 đơn vị, ta vẫn lấy điểm rating của từng nhân viên A cùng B phân tách cho thang điểm: ![]() Tuy nhiên, sử dụng công thức của mức độ vừa phải nhân vào trường hợp này không cần chuẩn chỉnh hóa lại dữ liệu:
![]() =>A tốt hơn B |
Trung bình cân bằng (Harmonic mean) - Trong vật dụng lý, trung bình cân bằng được áp dụng để tính vận tốc trung bình, cân nặng riêng, điện trở, phương trình quang học. Ví dụ: Một fan đi trường đoản cú nhà cho cơ quan liêu với tốc độ 30km/h cùng từ phòng ban về công ty với gia tốc 10km/h, quãng đường đi dài 5km. Vận tốc trung bình trên cả 2 đoạn đường dịch rời của bạn này là bao nhiêu? - vận tốc trung bình ví như tính bởi trung bình cộng bao gồm trọng số: Đầu tiên, cần tính thời gian di chuyển 2 lượt đi vì chưng vận tốc dịch rời lượt đi với lượt về rất khác nhau: ![]() - gia tốc trung bình trường hợp tính bằng công thức mức độ vừa phải điều hòa:
![]() - trong tài chính: trung bình điều hòa gồm trọng số là phương thức thích vừa lòng hơn nhằm tính trung bình các bội số, chẳng hạn như phần trăm giá – các khoản thu nhập (price–earnings – P/E) - Trong nghành nghề khoa học trang bị tính, nhất là truy xuất thông tin và thứ học, quý giá trung bình cân bằng của Precision cùng Recall (được call là F1–Score)<3> được sử dụng để tấn công giá tác dụng các thuật toán và mô hình máy học. |
- Trung vị là thước đo trung tâm giỏi hơn so với các tập dữ liệu bất đối xứng giỏi tập dữ liệu bị ảnh hưởng tác động bởi quý giá ngoại lệ (Outliers <1>).
Ví dụ: giả sử thu nhập hàng năm của 10 hộ gia đình trong một khu cư dân lần lượt là 1.000$ (5 hộ), 2.000$ (2 hộ), 3.000$ (1 hộ), 30.000$ (1 hộ) cùng 200.000$ (1 hộ). Tp cần rà soát các khu người dân có thu nhập thấp (dưới 3.000$) để thực hiện các chế độ hỗ trợ.
- Ta thấy bình quân thu nhập của khu người dân này nếu như tính bởi trung bình cộng đơn giản và dễ dàng sẽ là 24.200$. Mặc dù nhiên, nếu sử dụng giá trị vừa phải để khẳng định khu người dân này trực thuộc nhóm thu thập cao thì nó sẽ khá không cân xứng vì trong đội này có một hộ dân có thu nhập quá chênh lệch so với những hộ còn sót lại (200.000$) đề xuất đã khiến giá trị vừa đủ bị đẩy lên cao.
Do đó, nên thực hiện giá trị trung vị (1.500$) chũm giá trị vừa đủ để xác minh bình quân thu nhập cá nhân của khu dân cư này. Gồm thể tạo thành 2 nhóm:
+ Những hộ dân cư dưới mức thu nhập 1.500$ ở trong diện thu nhập nhấp cần phải hỗ trợ;
+ Những hộ dân trên mức 1.500$ thuộc nhóm thu nhập khá, tuy vậy những hộ gia đình có thu nhập cá nhân dưới 3.000$ trong đội này sẽ liên tiếp được chú ý để nhận cung ứng của Thành phố.
- yếu hèn vị là đại lượng thống kê diễn đạt duy nhất có thể vận dụng cho tài liệu định tính.
Ví dụ: thu thập thông tin về nam nữ của công nhân trong một xí nghiệp sản xuất, phát triển thành Giới tính là trở thành định danh với mã hóa 1 đại diện thay mặt cho Nam, 2 thay mặt cho Nữ. Giả dụ đếm được không ít số 1 hơn số 2, tức quý giá của Mode trong tình huống này là 1, đồng nghĩa với người công nhân nam nhiều hơn nữa công nhân nữ.
MỘT SỐ LƯU Ý
- Trung bình cùng thường được áp dụng để biểu diễn xu hướng trung tâm, tuy nhiên giá trị của trung bình cộng dễ bị ảnh hưởng bởi các giá trị nước ngoài lệ và các phân phối bất đối xứng.
- Không sử dụng đại lượng mức độ vừa phải cộng so với dữ liệu định danh.
- trung bình cộng tinh giảm sử dụng với tài liệu định lượng theo thang đo khoảng.
Mặc dù quý giá trung vị ko chịu tác động của những giá trị nước ngoài lệ và rất dễ dàng tính toán. Tuy nhiên trung vị quan trọng dùng để tham gia đoán vì không đúng chuẩn bằng trung bình, trung vị thường xuyên được dùng để làm thay rứa hoặc bổ sung nhằm điều chỉnh 1 số tinh giảm khi sử dụng giá trị trung bình.
Yếu vị cũng ko bị ảnh hưởng bởi các giá trị ngoại lệ. Tuy nhiên, yếu vị chỉ ổn định khi lượng giá trị những và đang khó xác minh rõ nếu tài liệu chỉ có một số ít giá bán trị.
Do yếu đuối vị chỉ đếm số lần xuất hiện nhiều duy nhất của cực hiếm trong tập dữ liệu nên hoàn toàn có thể có một hoặc nhiều yếu vị hoặc không tồn tại yếu vị làm sao cả.
Duy lịch sự tổng hợp
Chú thích:<1> tài liệu ngoại lệ (Outliers) là một điểm tài liệu có sự khác biệt đáng nhắc so với các quan cạnh bên khác. Tài liệu ngoại lệ có thể xuất hiện bởi sự biến đổi thang đo hoặc do lỗi từ dữ liệu tích lũy (thông thường tài liệu ngoại lệ dạng này sẽ bị nockout khỏi tập dữ liệu). Một cực hiếm ngoại lệ có thể gây ra vụ việc nghiêm trọng trong quá trình phân tích dữ liệu.<2> từ năm 2010, Chỉ số cải tiến và phát triển Con người (HDI) của phối hợp Quốc đã được gửi sang phương thức giám sát và đo lường bằng vừa đủ nhân do những nguồn tài liệu được sử dụng để tính HDI rất có thể khác thang đo.
Xem thêm: Cách kiểm tra thời gian sử dụng tivi sony chính hãng nhanh nhất, chính
<3> F1-Score là giá trị trung bình ổn định của Precision với Recall, nhằm phương châm tối đa hóa Precision hoặc Recall nhằm mô hình giỏi hơn. Trong đó: Precision tức là tỉ lệ số điểm Positive quy mô dự đoán đúng trên tổng cộng điểm quy mô dự đoán là Positive (true positives per predicted positive). Recall là tỉ lệ số điểm Positive quy mô dự đoán đúng trên tổng số điểm thật sự là Positive giỏi tổng số điểm được gán nhãn là Positive ban đầu (true positives per real positive).
----------------------------------------
Tài liệu tham khảo:Hoàng Trọng, Chu Nguyễn Mộng Ngọc. (2011). Thống kê vận dụng trong kinh tế tài chính - buôn bản hội. Hà Nội: NXB Lao Động - thôn hội.Illowsky et al. (2013). Introductory Statistics. Houston: Open
Stax.Evans, J. R. (2017). Business Analytics. Pearson
Wikipedia. (2021). Arithmetic mean. Retrieved from Wikipedia: https://en.wikipedia.org/wiki/Arithmetic_mean
Wikipedia. (2021). Geometric mean. Retrieved from Wikipedia: https://en.wikipedia.org/wiki/Geometric_mean
Wikipedia. (2021). Harmonic mean. Retrieved from Wikipedia: https://en.wikipedia.org/wiki/Harmonic_mean
----------------------------------------
Thống kê diễn tả trong phân tích – những đại lượng về độ phân tán
Thống kê mô tả trong nghiên cứu – các đại lượng về hình dáng phân phối
Thống kê biểu lộ trong nghiên cứu – những đại lượng về sự tương quan
---------------------------------------------------------------------------------------------------
QUÝ ANH/CHỊ CẦN HỖ TRỢ XỬ LÝ, PHÂN TÍCH DỮ LIỆU VUI LÒNG GỬI THÔNG TIN QUA form DƯỚI ĐÂYCHÚNG TÔI SẼ LIÊN HỆ VÀ PHÚC ĐÁP vào THỜI GIAN SỚM NHẤT