ویژگی مهم هر مجموعه از داده ها ، تغییر در داده ها است. در برخی از مجموعه داده ها ، مقادیر داده نزدیک به میانگین متمرکز شده اند. در سایر مجموعه داده ها ، مقادیر داده ها به طور گسترده ای از میانگین پخش می شوند. متداول ترین اندازه گیری تغییر یا گسترش ، انحراف استاندارد است. انحراف استاندارد عددی است که اندازه گیری مقادیر داده از میانگین آنها چقدر است.
انحراف استاندارد یک اندازه گیری عددی از میزان کلی تغییر در یک مجموعه داده را فراهم می کند ، و می تواند برای تعیین اینکه آیا مقدار داده خاص نزدیک به یا از میانگین است ، استفاده شود.
انحراف استاندارد اندازه گیری از تغییرات کلی در یک مجموعه داده را ارائه می دهد.
انحراف استاندارد همیشه مثبت یا صفر است. انحراف استاندارد زمانی است که داده ها نزدیک به میانگین متمرکز شده اند و دارای تغییرات کمی یا گسترش هستند. انحراف استاندارد زمانی بزرگتر است که مقادیر داده از میانگین پخش شود و تنوع بیشتری را نشان می دهد.
فرض کنید که ما در حال مطالعه میزان زمانی هستیم که مشتریان در بازپرداخت در سوپر مارکت [لاتکس] A [/لاتکس] و سوپر مارکت [لاتکس] B [/لاتکس] منتظر می مانیم. میانگین زمان انتظار در هر دو سوپر مارکت پنج دقیقه است. در سوپر مارکت [لاتکس] A [/لاتکس] ، انحراف استاندارد برای زمان انتظار دو دقیقه است. در سوپر مارکت [لاتکس] B [/لاتکس] انحراف استاندارد برای زمان انتظار چهار دقیقه است.
از آنجا که سوپر مارکت [لاتکس] B [/لاتکس] انحراف استاندارد بالاتری دارد ، ما می دانیم که در زمان انتظار در سوپر مارکت ها تغییر بیشتری وجود دارد [لاتکس] B [/لاتکس]. به طور کلی ، زمان انتظار در سوپر مارکت [لاتکس] B [/لاتکس] بیشتر از میانگین پخش می شود. زمان انتظار در سوپر مارکت [لاتکس] A [/لاتکس] در نزدیکی میانگین بیشتر متمرکز شده است.
از انحراف استاندارد می توان برای تعیین اینکه آیا مقدار داده نزدیک به میانگین است یا دور است ، استفاده شود.
فرض کنید که روزا و بنه هر دو در سوپر مارکت [لاتکس] A [/لاتکس] خرید می کنند. روزا به مدت هفت دقیقه در پیشخوان پرداخت منتظر می ماند و بینه یک دقیقه منتظر می ماند. در سوپر مارکت [لاتکس] A [/لاتکس] ، میانگین زمان انتظار پنج دقیقه و انحراف استاندارد دو دقیقه است. از انحراف استاندارد می توان برای تعیین اینکه آیا مقدار داده نزدیک به میانگین است یا دور است ، استفاده شود.
روزا هفت دقیقه صبر می کند:
- هفت نفر دو دقیقه بیشتر از میانگین پنج است. دو دقیقه برابر با یک انحراف استاندارد است.
- زمان انتظار روزا هفت دقیقه دو دقیقه بیشتر از میانگین پنج دقیقه است.
- زمان انتظار روزا هفت دقیقه یک انحراف استاندارد بالاتر از میانگین پنج دقیقه است.
بنه یک دقیقه منتظر است.
- یکی چهار دقیقه کمتر از میانگین پنج است. چهار دقیقه برابر با دو انحراف استاندارد است.
- زمان انتظار Binh یک دقیقه چهار دقیقه کمتر از میانگین پنج دقیقه است.
- زمان انتظار Binh یک دقیقه دو انحراف استاندارد زیر پنج دقیقه است.
مقدار داده ای که دو انحراف استاندارد از میانگین است ، فقط در مرز برای آنچه بسیاری از آمارشناسان می دانند از میانگین دور هستند. اگر بیش از دو انحراف استاندارد از دور باشد ، با توجه به اینکه داده ها از این فاصله دور هستند ، بیشتر از یک قانون سفت و سخت ، "قانون شست" تقریبی است. به طور کلی ، شکل توزیع داده ها بر میزان دورتر از دو انحراف استاندارد تأثیر می گذارد.(در فصل های بعدی در مورد این موضوع بیشتر خواهید آموخت.)
خط شماره ممکن است به شما در درک انحراف استاندارد کمک کند. اگر قرار بود پنج و هفت را در یک خط شماره قرار دهیم ، هفت در سمت راست پنج است. بنابراین ، ما می گوییم که هفت یک انحراف استاندارد در سمت راست پنج است زیرا [لاتکس] 5 + (1) (2) = 7 [/لاتکس].
اگر یکی نیز بخشی از مجموعه داده ها باشد ، یکی دو انحراف استاندارد در سمت چپ پنج است زیرا [لاتکس] 5 + (-2) (2) = 1 [/لاتکس].
- به طور کلی ، یک va lue = میانگین + (#OfStDev) (انحراف استاندارد)
- جایی که #ofstdevs = تعداد انحرافات استاندارد
- #FSTDEV نیازی به یک عدد صحیح ندارد
- یکی از انحرافات دو قطعه کمتر از میانگین پنج است زیرا: [لاتکس] 1 = 5 + (-2) (2) [/لاتکس].
مقدار معادله = میانگین + (#OFSTDEVS) (انحراف استاندارد) را می توان برای یک نمونه و برای یک جمعیت بیان کرد.
- نمونه: [لاتکس] \ DisplayStyle = \ Overline<>+[/لاتکس] (# از stdev) [لاتکس]<(
)>[/لاتکس] - جمعیت: [لاتکس] \ displayStyle = \ mu+[/لاتکس] (# از stdev) [لاتکس] [/لاتکس]
حرف کوچک [لاتکس] S [/لاتکس] نشان دهنده انحراف استاندارد نمونه و حرف یونانی [لاتکس] σ [/لاتکس] (سیگما ، مورد پایین) نشان دهنده انحراف استاندارد جمعیت است.
The symbol [latex]\displaystyle\overline>[/لاتکس] میانگین نمونه است و نماد یونانی [لاتکس] μ [/لاتکس] میانگین جمعیت است.
محاسبه انحراف استاندارد
اگر [لاتکس] x [/لاتکس] یک عدد باشد ، تفاوت "[لاتکس] x [/لاتکس] - به معنای" انحراف آن نامیده می شود. در یک مجموعه داده ، به همان اندازه انحرافات وجود دارد که مواردی در مجموعه داده وجود دارد. از انحرافات برای محاسبه انحراف استاندارد استفاده می شود. اگر اعداد متعلق به یک جمعیت باشد ، در نمادها یک انحراف [لاتکس] x - μ [/لاتکس] است. برای داده های نمونه ، در نمادها یک انحراف [لاتکس] \ displayStyle- \ overline است<>[/لاتکس].
روش محاسبه انحراف استاندارد بستگی به این دارد که آیا این تعداد کل جمعیت هستند یا داده های یک نمونه هستند. محاسبات مشابه هستند ، اما یکسان نیستند. بنابراین نمادی که برای نشان دادن انحراف استاندارد استفاده می شود بستگی به این دارد که آیا از یک جمعیت یا یک نمونه محاسبه می شود. حرف کوچک [لاتکس] S [/لاتکس] نشان دهنده انحراف استاندارد نمونه و حرف یونانی [لاتکس] σ [/لاتکس] (سیگما ، مورد پایین) نشان دهنده انحراف استاندارد جمعیت است. اگر نمونه دارای ویژگی های مشابه جمعیت باشد ، [لاتکس] S [/لاتکس] باید برآورد خوبی از [لاتکس] σ [/لاتکس] باشد.
To calculate the standard deviation, we need to calculate the variance first. The variance is the average of the squares of the deviations (the [latex]x[/latex] – [latex]\displaystyle\overline>مقادیر [/لاتکس] برای یک نمونه ، یا مقادیر [لاتکس] x - μ [/لاتکس] برای یک جمعیت). نماد [لاتکس] σ^2 [/لاتکس] نشان دهنده واریانس جمعیت است. انحراف استاندارد جمعیت [لاتکس] σ [/لاتکس] ریشه مربع واریانس جمعیت است. نماد [لاتکس] S^2 [/لاتکس] واریانس نمونه را نشان می دهد. نمونه انحراف استاندارد [لاتکس] S [/لاتکس] ریشه مربع واریانس نمونه است. شما می توانید از انحراف استاندارد به عنوان میانگین خاص انحرافات فکر کنید.
اگر اعداد از سرشماری کل جمعیت و نه نمونه حاصل شود ، وقتی میانگین انحراف مربع را برای یافتن واریانس محاسبه می کنیم ، با [لاتکس] n [/لاتکس] ، تعداد موارد موجود در جمعیت تقسیم می شویم. اگر داده ها از یک نمونه به جای جمعیت باشد ، وقتی میانگین انحراف مربع را محاسبه می کنیم ، با [لاتکس] n - 1 [/لاتکس] تقسیم می شویم ، یکی کمتر از تعداد موارد موجود در نمونه.
در فیلم زیر نمونه ای از محاسبه واریانس و انحراف استاندارد مجموعه ای از داده ها ارائه شده است.
فرمول برای انحراف استاندارد نمونه
برای انحراف استاندارد نمونه ، مخرج [لاتکس] n - 1 [/لاتکس] است ، یعنی اندازه نمونه منهای [لاتکس] 1 [/لاتکس] است.
فرمول برای انحراف استاندارد جمعیت
برای انحراف استاندارد جمعیت ، مخرج [لاتکس] n [/لاتکس] ، تعداد موارد موجود در جمعیت است.
در این فرمولها ، [لاتکس] F [/لاتکس] فرکانس را نشان می دهد که یک مقدار با آن ظاهر می شود. به عنوان مثال ، اگر یک مقدار یک بار ظاهر شود ، [لاتکس] F [/لاتکس] یکی است. اگر یک مقدار در مجموعه داده ها یا جمعیت سه بار ظاهر شود ، [لاتکس] F [/لاتکس] سه است.
نمونه برداری از یک آمار
How much the statistic varies from one sample to another is known as the sampling variability of a statistic . You typically measure the sampling variability of a statistic by its standard error. The standard error of the mean is an example of a standard error. It is a special standard deviation and is known as the standard deviation of the sampling distribution of the mean. You will cover the standard error of the mean when you learn about The Central Limit Theorem (not now). The notation for the standard error of the mean is [latex]\displaystyle\frac>>>[/لاتکس] که در آن [لاتکس] σ [/لاتکس] انحراف استاندارد از جمعیت است و [لاتکس] n [/لاتکس] اندازه نمونه است.
در عمل ، از یک ماشین حساب یا نرم افزار رایانه ای برای محاسبه انحراف استاندارد استفاده کنید. اگر از ماشین حساب TI-83 ، 83+ ، 84+ استفاده می کنید ، باید از آمار خلاصه ، انحراف استاندارد مناسب [لاتکس] σ_x [/لاتکس] یا [لاتکس] S_X [/لاتکس] را انتخاب کنید. ما در استفاده و تفسیر اطلاعاتی که انحراف استاندارد به ما می دهد تمرکز خواهیم کرد. با این حال شما باید مثال گام به گام زیر را مطالعه کنید تا به شما در درک چگونگی تغییر انحراف استاندارد از میانگین کمک کند.(دستورالعمل ماشین حساب در پایان این مثال ظاهر می شود.)
مثال
در کلاس کلاس پنجم ، معلم به سن متوسط و نمونه انحراف استاندارد از سنین دانش آموزان خود علاقه مند بود. داده های زیر سنین نمونه ای از [لاتکس] n = 20 [/لاتکس] دانش آموزان کلاس پنجم است. سنین به نزدیکترین نیم سال گرد می شوند:
[لاتکس] \ DisplayStyle \ overline = = [/لاتکس] میانگین سنی [لاتکس] 10. 53 [/لاتکس] سال است که به دو مکان گرد شده است.
واریانس ممکن است با استفاده از یک جدول محاسبه شود. سپس انحراف استاندارد با گرفتن ریشه مربع واریانس محاسبه می شود. ما قسمت های جدول را پس از محاسبه [لاتکس] S [/لاتکس] توضیح خواهیم داد.
داده ها | freq | انحرافات | [لاتکس] انحراف^2 [/لاتکس] | (freq.) ([لاتکس] انحراف^2 [/لاتکس]) |
---|---|---|---|---|
[لاتکس] x [/لاتکس] | [لاتکس] F [/لاتکس] | ([لاتکس] x [/لاتکس] - [لاتکس] \ DisplayStyle \ Overline [/لاتکس]) | ([لاتکس] x [/لاتکس] - [لاتکس] \ DisplayStyle \ Overline [/لاتکس]) 2 | ([لاتکس] F [/لاتکس]) ([لاتکس] x [/لاتکس] - [لاتکس] \ DisplayStyle \ Overline [/لاتکس]) 2 |
[لاتکس] 9 [/لاتکس] | [لاتکس] 1 [/لاتکس] | [لاتکس] 9 - 10. 525 = –1. 525 [/لاتکس] | [لاتکس] ( - 1. 525)^2 = 2. 325625 [/لاتکس] | [لاتکس] 1 × 2. 325625 = 2. 325625 [/لاتکس] |
[لاتکس] 9. 5 [/لاتکس] | [لاتکس] 2 [/لاتکس] | [لاتکس] 9. 5 - 10. 525 = –1. 025 [/لاتکس] | [لاتکس] ( - 1. 025)^2 = 1. 050625 [/لاتکس] | [لاتکس] 2 × 1. 050625 = 2. 101250 [/لاتکس] |
[لاتکس] 10 [/لاتکس] | [لاتکس] 4 [/لاتکس] | [لاتکس] 10 - 10. 525 = –0. 525 [/لاتکس] | [لاتکس] ( - 0. 525)^2 = 0. 275625 [/لاتکس] | [لاتکس] 4 × 0. 275625 = 1. 1025 [/لاتکس] |
[لاتکس] 10. 5 [/لاتکس] | [لاتکس] 4 [/لاتکس] | [لاتکس] 10. 5 - 10. 525 = –0. 025 [/لاتکس] | [لاتکس] ( - 0. 025)^2 = 0. 000625 [/لاتکس] | [لاتکس] 4 × 0. 000625 = 0. 0025 [/لاتکس] |
[لاتکس] 11 [/لاتکس] | [لاتکس] 6 [/لاتکس] | [لاتکس] 11 - 10. 525 = 0. 475 [/لاتکس] | [لاتکس] (0. 475)^2 = 0. 225625 [/لاتکس] | [لاتکس] 6 × 0. 225625 = 1. 35375 [/لاتکس] |
[لاتکس] 11. 5 [/لاتکس] | [لاتکس] 3 [/لاتکس] | [لاتکس] 11. 5 - 10. 525 = 0. 975 [/لاتکس] | [لاتکس] (0. 975)^2 = 0. 950625 [/لاتکس] | [لاتکس] 3 × 0. 950625 = 2. 851875 [/لاتکس] |
کل [لاتکس] 9. 7375 [/لاتکس] است |
واریانس نمونه ، [لاتکس] \ DisplayStyle^[/لاتکس] ، برابر با جمع آخرین ستون [لاتکس] (9. 7375) [/لاتکس] است که بر اساس تعداد کل مقادیر داده منهای یک [لاتکس] تقسیم می شود (2 0-1) [/لاتکس]: [لاتکس] s^2 = \ frac = 0. 5125 [/لاتکس]
انحراف استاندارد نمونه [لاتکس] s [/لاتکس] برابر با ریشه مربع واریانس نمونه است: [لاتکس] s = \ sqrt = 0. 715891 [/لاتکس] که به دو مکان اعشاری گرد است ، [لاتکس] s [//لاتکس] = 0. 72.
به طور معمول ، شما محاسبه را برای انحراف استاندارد در ماشین حساب یا رایانه خود انجام می دهید. نتایج میانی گرد نیست. این کار برای دقت انجام می شود.
- برای مشکلات زیر ، آن مقدار = میانگین + (#OFSTDEVS) (انحراف استاندارد) را به یاد بیاورید. میانگین و انحراف استاندارد یا ماشین حساب یا رایانه را تأیید کنید.
- برای یک نمونه: [لاتکس] x [/لاتکس] = [لاتکس] \ displayStyle \ Overline [/لاتکس] + (#ofstdevs) ([لاتکس] s [/لاتکس])
- برای یک جمعیت: [لاتکس] x [/لاتکس] = [لاتکس] μ [/لاتکس] + (#OfStDevs) ([لاتکس] σ [/لاتکس])
- برای این مثال ، از [لاتکس] x [/لاتکس] = [لاتکس] \ displayStyle \ Overline [/لاتکس] + (#OfStDevs) ([لاتکس] s [/لاتکس]) استفاده کنید زیرا داده ها از یک نمونه است
- میانگین و انحراف استاندارد را در ماشین حساب یا رایانه خود تأیید کنید.
- مقداری را پیدا کنید که یک انحراف استاندارد بالاتر از میانگین باشد. پیدا کردن ([لاتکس] \ DisplayStyle \ Overline [/لاتکس]+ [لاتکس] 1s [/لاتکس]).
- مقدار را که دو انحراف استاندارد زیر میانگین است ، پیدا کنید. پیدا کردن ([لاتکس] \ DisplayStyle \ Overline [/لاتکس] - [لاتکس] 2S [/لاتکس]).
- مقادیری را پیدا کنید که [لاتکس] 1. 5 [/لاتکس] انحراف استاندارد از (در زیر و بالاتر) میانگین است.
- با استفاده از ماشین حساب TI-83 ، 83+ ، 84 ، 84+
- لیست های پاک L1 و L2. آمار 4: clrlist. 1 را برای L1 ، کاما (،) و 2 برای L2 وارد کنید.
- داده ها را به ویرایشگر لیست وارد کنید. STAT 1: ویرایش را فشار دهید. در صورت لزوم ، لیست ها را با پیکان به نام پاک کنید. Clear و Arrow Down را فشار دهید.
- مقادیر داده ([لاتکس] 9 [/لاتکس] ، [لاتکس] 9. 5 [/لاتکس] ، [لاتکس] 10 [/لاتکس] ، [لاتکس] 10. 5 [/لاتکس] ، [لاتکس] 11 [/لاتکس] را قرار دهید.[لاتکس] 11. 5 [/لاتکس]) در لیست L1 و فرکانس ها ([لاتکس] 1 [/لاتکس] ، [لاتکس] 2 [/لاتکس] ، [لاتکس] 4 [/لاتکس] ، [لاتکس] 4 [/لاتکس]] ، [لاتکس] 6 [/لاتکس] ، [لاتکس] 3 [/لاتکس]) به لیست L2. از کلیدهای فلش برای جابجایی استفاده کنید.
- STAT و فلش را برای CALC فشار دهید. 1:1-VarStats را فشار دهید و L1 (2nd 1)، L2 (2nd 2) را وارد کنید. کاما را فراموش نکنید. ENTER را فشار دهید.
- [latex]\displaystyle\overline[/latex] = [latex]10. 525[/latex]
- از Sx استفاده کنید زیرا این دادههای نمونه است (نه جمعیت): Sx=[latex]0. 715891[/latex]
- ([latex]\displaystyle\overline+ 1s) = 10. 53 + (1)(0. 72) = 11. 25[/latex]
- ([latex]\displaystyle\overline– 2s) = 10. 53 – (2)(0. 72) = 9. 09[/latex]
- ([latex]\displaystyle\overline– 1. 5s) = 10. 53 – (1. 5)(0. 72) = 9. 45[/latex]
- ([latex]\displaystyle\overline+ 1. 5s) = 10. 53 + (1. 5) (0. 72) = 11. 61[/latex]
آن را امتحان کنید
در یک تیم بیسبال، سن هر یک از بازیکنان به شرح زیر است:
برای یافتن میانگین و انحراف معیار از ماشین حساب یا رایانه خود استفاده کنید. سپس مقداری را پیدا کنید که دو انحراف استاندارد بالاتر از میانگین است.
([latex]\displaystyle\overline+ 2s) = 30. 68 + (2)(6. 09) = 42. 86[/latex].
توضیح محاسبه انحراف معیار نشان داده شده در جدول
انحرافات نشان می دهد که داده ها در مورد میانگین چقدر گسترده هستند. مقدار داده [latex]11. 5[/latex] از میانگین دورتر از مقدار داده [latex]11[/latex] است که با انحرافات [latex]0. 97[/latex] و [latex]0. 47[/ نشان داده میشود. لاتکس]. انحراف مثبت زمانی رخ می دهد که مقدار داده از میانگین بیشتر باشد، در حالی که انحراف منفی زمانی رخ می دهد که مقدار داده کمتر از میانگین باشد. انحراف [latex]–1. 525[/latex] برای مقدار داده نه است. اگر انحرافات را اضافه کنید، مجموع همیشه صفر است.(برای مثال 1، [latex]n = 20 [/latex] انحراف وجود دارد.) بنابراین شما نمی توانید به سادگی انحرافات را برای بدست آوردن گسترش داده ها اضافه کنید. با مجذور کردن انحرافات آنها را اعداد مثبت می کنید و مجموع آنها نیز مثبت می شود. بنابراین، واریانس، میانگین انحراف مربع است.
واریانس یک اندازه مربع است و واحدهای مشابهی با داده ها ندارد. جذر گرفتن مشکل را حل می کند. انحراف استاندارد میزان گسترش را در واحدهای مشابه داده ها اندازه گیری می کند.
توجه داشته باشید که به جای تقسیم بر [latex]n= 20[/latex]، محاسبه بر [latex]n – 1 = 20 – 1 = 19[/latex] تقسیم می شود زیرا داده ها یک نمونه هستند. برای واریانس نمونه، بر حجم نمونه منهای یک ([latex]n – 1[/latex]) تقسیم میکنیم. چرا بر [latex]n[/latex] تقسیم نمی شود؟پاسخ مربوط به واریانس جمعیت است. واریانس نمونه تخمینی از واریانس جامعه است. بر اساس ریاضیات نظری که در پس این محاسبات نهفته است، تقسیم بر ([latex]n – 1[/latex]) تخمین بهتری از واریانس جمعیت به دست میدهد.
تمرکز شما باید روی چیزی باشد که انحراف معیار در مورد داده ها به ما می گوید. انحراف معیار عددی است که میزان فاصله داده ها از میانگین را اندازه می گیرد. اجازه دهید یک ماشین حساب یا کامپیوتر حساب را انجام دهد.
انحراف معیار، [latex]s[/latex] یا [latex]σ[/latex]، یا صفر است یا بزرگتر از صفر. وقتی انحراف معیار صفر است، هیچ گسترشی وجود ندارد. یعنی تمام مقادیر داده ها با یکدیگر برابر هستند. انحراف معیار زمانی که داده ها همه نزدیک به میانگین متمرکز شده اند کوچک است و زمانی که مقادیر داده ها تغییرات بیشتری را نسبت به میانگین نشان می دهند بزرگتر است. هنگامی که انحراف استاندارد بسیار بزرگتر از صفر است، مقادیر داده ها در مورد میانگین بسیار گسترده است. نقاط پرت می توانند [latex]s[/latex] یا [latex]σ[/latex] را بسیار بزرگ کنند.
انحراف معیار، زمانی که برای اولین بار ارائه شد، می تواند نامشخص به نظر برسد. با ترسیم نمودار داده های خود، می توانید "احساس" بهتری برای انحرافات و انحراف استاندارد دریافت کنید. متوجه خواهید شد که در توزیع های متقارن، انحراف معیار می تواند بسیار مفید باشد، اما در توزیع های اریب، انحراف معیار ممکن است کمک چندانی نکند. دلیل آن این است که دو طرف توزیع اریب دارای اسپردهای متفاوتی هستند. در توزیع اریب، بهتر است به چارک اول، میانه، چارک سوم، کوچکترین مقدار و بزرگترین مقدار نگاه کنید. از آنجا که اعداد ممکن است گیج کننده باشند، همیشه داده های خود را نمودار کنید. داده های خود را در یک هیستوگرام یا نمودار جعبه نمایش دهید.
مثال
از دادههای زیر (نمرات امتحان اول) از کلاس پیشحساب بهاره سوزان دین استفاده کنید:
- نموداری حاوی داده ها، فرکانس ها، فرکانس های نسبی و فرکانس های نسبی تجمعی تا سه رقم اعشار ایجاد کنید.
- با استفاده از ماشین حساب TI-83+ یا TI-84 عدد زیر را تا یک رقم اعشار محاسبه کنید:
- میانگین نمونه
- نمونه انحراف معیار
- میانه
- چارک اول
- ربع سوم
- [لاتکس]IQR[/لاتکس]
داده ها فرکانس فراوانی نسبی فرکانس نسبی تجمعی [لاتکس]33[/لاتکس] [لاتکس] 1 [/لاتکس] [latex]0. 032[/latex] [latex]0. 032[/latex] [لاتکس]42[/لاتکس] [لاتکس] 1 [/لاتکس] [latex]0. 032[/latex] [latex]0. 064[/latex] [لاتکس]49[/لاتکس] [لاتکس] 2 [/لاتکس] [latex]0. 065[/latex] [لاتکس]0. 129[/latex] [لاتکس]53[/لاتکس] [لاتکس] 1 [/لاتکس] [latex]0. 032[/latex] [latex]0. 161[/latex] [لاتکس]55[/لاتکس] [لاتکس] 2 [/لاتکس] [latex]0. 065[/latex] [لاتکس]0. 226[/latex] [لاتکس]61[/لاتکس] [لاتکس] 1 [/لاتکس] [latex]0. 032[/latex] [لاتکس]0. 258[/latex] [لاتکس]63[/لاتکس] [لاتکس] 1 [/لاتکس] [latex]0. 032[/latex] [لاتکس]0. 29[/latex] [لاتکس]67[/لاتکس] [لاتکس] 1 [/لاتکس] [latex]0. 032[/latex] [latex]0. 322[/latex] [لاتکس]68[/لاتکس] [لاتکس] 2 [/لاتکس] [latex]0. 065[/latex] [latex]0. 387[/latex] [لاتکس]69[/لاتکس] [لاتکس] 2 [/لاتکس] [latex]0. 065[/latex] [latex]0. 452[/latex] [لاتکس]72[/لاتکس] [لاتکس] 1 [/لاتکس] [latex]0. 032[/latex] [latex]0. 484[/latex] [لاتکس]73[/لاتکس] [لاتکس] 1 [/لاتکس] [latex]0. 032[/latex] [لاتکس]0. 516[/latex] [لاتکس]74[/لاتکس] [لاتکس] 1 [/لاتکس] [latex]0. 032[/latex] [لاتکس]0. 548[/latex] [لاتکس]78[/لاتکس] [لاتکس] 1 [/لاتکس] [latex]0. 032[/latex] [لاتکس]0. 580[/latex] [لاتکس]80[/لاتکس] [لاتکس] 1 [/لاتکس] [latex]0. 032[/latex] [latex]0. 612[/latex] [لاتکس]83[/لاتکس] [لاتکس] 1 [/لاتکس] [latex]0. 032[/latex] [latex]0. 644[/latex] [لاتکس]88[/لاتکس] [لاتکس] 3 [/لاتکس] [latex]0. 097[/latex] [latex]0. 741[/latex] [لاتکس]90[/لاتکس] [لاتکس] 1 [/لاتکس] [latex]0. 032[/latex] [latex]0. 773[/latex] [لاتکس]92[/لاتکس] [لاتکس] 1 [/لاتکس] [latex]0. 032[/latex] [لاتکس]0. 805[/latex] [لاتکس]94[/لاتکس] [لاتکس] 4 [/لاتکس] [لاتکس]0. 129[/latex] [latex]0. 934[/latex] [لاتکس]96[/لاتکس] [لاتکس] 1 [/لاتکس] [latex]0. 032[/latex] [latex]0. 966[/latex] [لاتکس]100[/لاتکس] [لاتکس] 1 [/لاتکس] [latex]0. 032[/latex] [latex]0. 998[/latex] (چرا این مقدار [latex]1[/latex] نیست؟) - میانگین نمونه = [لاتکس]73. 5[/لاتکس]
- انحراف استاندارد نمونه = [latex]17. 9[/latex]
- میانه = [لاتکس]73[/لاتکس]
- چارک اول = [لاتکس]61[/لاتکس]
- چارک سوم = [لاتکس]90[/لاتکس]
- [لاتکس]IQR = 90 – 61 = 29[/لاتکس]
سبیل بلند سمت چپ در نمودار جعبه در سمت چپ هیستوگرام منعکس شده است. پراکندگی نمرات امتحان در [لاتکس]50[/لاتکس]% پایینتر ([لاتکس] 73 - 33 = 40[/لاتکس]) بیشتر از گسترش در [لاتکس]50[/لاتکس]% بالا است ([لاتکس] 100 - 73 = 27 [/لاتکس]). هیستوگرام، نمودار جعبه و نمودار همگی این را منعکس می کنند. تعداد قابل توجهی از گریدهای A و B وجود دارد ([latex]80[/latex]s، [latex]90[/latex]s، و [latex]100[/latex]). هیستوگرام به وضوح این را نشان می دهد. نمودار کادر به ما نشان می دهد که [latex]50[/latex]% از نمرات امتحان ([latex]IQR[/latex] = [latex]29[/latex]) Ds، Cs و Bs هستند. نمودار جعبه همچنین به ما نشان می دهد که [latex]25[/latex]% پایین تر از نمرات امتحان Ds و Fs است.
آن را امتحان کنید
داده های زیر نشان دهنده انواع مختلف فروشگاه های غذای حیوانات خانگی در منطقه است.
[latex]\displaystyle [/latex] با استفاده از ماشین حساب TI-83+ یا TI-84، میانگین نمونه و انحراف استاندارد نمونه را تا یک رقم اعشار محاسبه کنید.
انحراف استاندارد جداول فرکانس گروهی
به یاد بیاورید که برای داده های گروه بندی شده، مقادیر داده های فردی را نمی دانیم، بنابراین نمی توانیم مقدار معمولی داده ها را با دقت توصیف کنیم. به عبارت دیگر، ما نمی توانیم میانگین، میانه یا حالت دقیق را پیدا کنیم. با این حال، میتوانیم بهترین تخمین اندازهگیریهای مرکز را با یافتن میانگین دادههای گروهبندی شده با فرمول تعیین کنیم:
Mean of Frequency Table =[latex]\displaystyle\frac>>[/لاتکس]
که در آن [لاتکس]f[/لاتکس] = فرکانسهای بازهای و [لاتکس] متر[/لاتکس] = نقاط میانی بازه.
همانطور که نتوانستیم میانگین دقیق را پیدا کنیم، نمی توانیم انحراف معیار دقیق را نیز پیدا کنیم. به یاد داشته باشید که انحراف استاندارد به صورت عددی انحراف مورد انتظار یک مقدار داده از میانگین را توصیف می کند. در زبان انگلیسی ساده، انحراف معیار به ما اجازه می دهد تا مقایسه کنیم که چگونه داده های فردی «غیر معمول» با میانگین مقایسه می شوند.
مثال
انحراف معیار داده ها را در جدول زیر بیابید.
کلاس فرکانس، [latex]f[/latex] نقطه میانی، [latex]m[/latex] [latex]m^2[/latex] [latex]\displaystyle\overline^2[/latex] [latex]fm^2[/latex] انحراف معیار [لاتکس] 0–2[/لاتکس] [لاتکس] 1 [/لاتکس] [لاتکس] 1 [/لاتکس] [لاتکس] 1 [/لاتکس] [لاتکس]7. 58[/لاتکس] [لاتکس] 1 [/لاتکس] [لاتکس]3. 5[/لاتکس] [لاتکس] 3 تا 5 [/لاتکس] [لاتکس] 6 [/لاتکس] [لاتکس] 4 [/لاتکس] [لاتکس]16[/لاتکس] [لاتکس]7. 58[/لاتکس] [لاتکس]96[/لاتکس] [لاتکس]3. 5[/لاتکس] [لاتکس]6-8[/لاتکس] [لاتکس] 10 [/لاتکس] [لاتکس]7[/لاتکس] [لاتکس]49[/لاتکس] [لاتکس]7. 58[/لاتکس] [لاتکس]490[/لاتکس] [لاتکس]3. 5[/لاتکس] [لاتکس]۹–۱۱[/لاتکس] [لاتکس]7[/لاتکس] [لاتکس] 10 [/لاتکس] [لاتکس]100[/لاتکس] [لاتکس]7. 58[/لاتکس] [لاتکس]700[/لاتکس] [لاتکس]3. 5[/لاتکس] [لاتکس]12-14[/لاتکس] [لاتکس]0[/لاتکس] [لاتکس]13[/لاتکس] [لاتکس]169[/لاتکس] [لاتکس]7. 58[/لاتکس] [لاتکس]0[/لاتکس] [لاتکس]3. 5[/لاتکس] [لاتکس]15-17[/لاتکس] [لاتکس] 2 [/لاتکس] [لاتکس]16[/لاتکس] [لاتکس]256[/لاتکس] [لاتکس]7. 58[/لاتکس] [لاتکس]512[/لاتکس] [لاتکس]3. 5[/لاتکس] برای این مجموعه داده، میانگین [latex]\displaystyle\overline[/latex] = [latex]7. 58[/latex] و انحراف استاندارد، [latex]\displaystyle_ = 3. 5[/latex] را داریم. این بدان معنی است که انتظار می رود یک مقدار داده انتخاب شده به طور تصادفی از میانگین [latex] 3. 5 [/latex] واحد باشد. اگر به کلاس اول نگاه کنیم، می بینیم که نقطه میانی کلاس برابر با یک است. این تقریباً دو انحراف استاندارد کامل از میانگین است زیرا [لاتکس] 7. 58 - 3. 5 - 3. 5 = 0. 58 [/latex]. در حالی که فرمول محاسبه انحراف معیار پیچیده نیست، [latex]\displaystyle_=\sqrt<<\frac<
^>>>>>[/لاتکس] که در آن [لاتکس] \ DisplayStyle_ = [/لاتکس] انحراف استاندارد ، [لاتکس] \ DisplayStyle \ Overline [/لاتکس] = میانگین نمونه ، محاسبات خسته کننده است. معمولاً بهتر است هنگام انجام محاسبات از فناوری استفاده کنید. آن را امتحان کنید
از مثال قبلی انحراف استاندارد را برای داده ها پیدا کنید
کلاس فرکانس، [latex]f[/latex] [لاتکس] 0–2[/لاتکس] [لاتکس] 1 [/لاتکس] [لاتکس] 3 تا 5 [/لاتکس] [لاتکس] 6 [/لاتکس] [لاتکس]6-8[/لاتکس] [لاتکس] 10 [/لاتکس] [لاتکس]۹–۱۱[/لاتکس] [لاتکس]7[/لاتکس] [لاتکس]12-14[/لاتکس] [لاتکس]0[/لاتکس] [لاتکس]15-17[/لاتکس] [لاتکس] 2 [/لاتکس] ابتدا کلید Stat را فشار داده و 1: ویرایش را انتخاب کنید
مقادیر نقطه میانی را به L1 و فرکانس ها در L2 وارد کنید
آمار STAT ، CALC و 1: 1-VAR را انتخاب کنید
2nd را انتخاب کنید و سپس 1 ، 2nd سپس 2 را وارد کنید
شما می بینید که هر دو انحراف استاندارد جمعیت ، σ_x و انحراف استاندارد نمونه ، [لاتکس] S_X [/لاتکس] را نشان می دهد.
مقایسه مقادیر از مجموعه داده های مختلف
انحراف استاندارد هنگام مقایسه مقادیر داده ای که از مجموعه داده های مختلف حاصل می شود ، مفید است. اگر مجموعه داده ها از وسایل مختلف و انحراف استاندارد برخوردار باشند ، مقایسه مقادیر داده به طور مستقیم می تواند گمراه کننده باشد.
- برای هر مقدار داده ، محاسبه کنید که تعداد انحراف استاندارد از میانگین آن مقدار آن است.
- از فرمول استفاده کنید: مقدار = میانگین + (#OfStDevs) (انحراف استاندارد) ؛برای #OFSTDEVS حل کنید.
- #ofstdevs = [لاتکس] \ frac [/لاتکس]
- نتایج این محاسبه را مقایسه کنید.
#ofstdevs اغلب "[لاتکس] z [/لاتکس] -score" نامیده می شود. ما می توانیم از نماد [لاتکس] z [/لاتکس] استفاده کنیم. در نمادها ، فرمول ها می شوند:
نمونه [لاتکس] x = \ overline+zs [/لاتکس] [لاتکس] z = \ frac [/لاتکس] جمعیت [لاتکس] x = μ + Zσ [/لاتکس] [لاتکس] z = \ frac [/لاتکس] مثال
دو دانش آموز ، جان و علی ، از دبیرستان های مختلف ، می خواستند دریابند که در مقایسه با مدرسه خود ، بالاترین GPA را دارد. کدام دانش آموز در مقایسه با مدرسه خود بالاترین GPA را داشت؟
دانشجو معدل مدرسه متوسط GPA انحراف استاندارد مدرسه جان [لاتکس] 2. 85 [/لاتکس] [لاتکس] 3. 0 [/لاتکس] [لاتکس] 0. 7 [/لاتکس] علی [لاتکس] 77 [/لاتکس] [لاتکس]80[/لاتکس] [لاتکس] 10 [/لاتکس] برای هر دانش آموز ، تعیین کنید که چند انحراف استاندارد (#OFSTDEV) معدل وی برای مدرسه خود از میانگین دور است. هنگام مقایسه و تفسیر جواب ، به علائم توجه کنید.
For John, [latex]z[/latex] = # ofSTDEVs = [latex]\displaystyle\frac>>=-[/لاتکس]
For Ali, [latex]z[/latex] = # ofSTDEVs = [latex]\displaystyle\frac>>= −0. 3 [/لاتکس]
جان در مقایسه با مدرسه خود معدل بهتری دارد زیرا معدل وی [لاتکس] 0. 21 [/لاتکس] انحراف استاندارد زیر میانگین مدرسه خود است در حالی که معدل علی [لاتکس] 0. 3 [/لاتکس] انحراف استاندارد زیر میانگین مدرسه خود است.
جان [لاتکس] z [/لاتکس] -score [لاتکس] -0. 21 [/لاتکس] بالاتر از [لاتکس] z [/لاتکس] -score [لاتکس] -0. 3 [/لاتکس] است. برای GPA ، ارزش های بالاتر بهتر است ، بنابراین نتیجه می گیریم که جان در مقایسه با مدرسه خود ، GPA بهتری دارد.
آن را امتحان کنید
دو شناگر ، آنگی و بث ، از تیم های مختلف ، می خواستند دریابند که چه کسی سریعترین زمان را برای 50 متر آزاد در مقایسه با تیمش دارد. کدام شناگر در مقایسه با تیمش سریعترین زمان را داشت؟
شناگر زمان (ثانیه) میانگین تیم انحراف استاندارد تیم انگوی [لاتکس] 26. 2 [/لاتکس] [لاتکس] 27. 2 [/لاتکس] [لاتکس] 0. 8 [/لاتکس] بیت [لاتکس] 27. 3 [/لاتکس] [لاتکس] 30. 1 [/لاتکس] [لاتکس] 1. 4 [/لاتکس] لیست های زیر چند واقعیت را ارائه می دهند که بینش کمی بیشتر در مورد آنچه انحراف استاندارد در مورد توزیع داده ها به ما می گوید ، ارائه می دهد.
برای هر مجموعه داده ، مهم نیست که توزیع داده ها چیست:
- حداقل [لاتکس] 75 [/لاتکس] ٪ از داده ها در دو انحراف استاندارد از میانگین است.
- حداقل [لاتکس] 89 [/لاتکس] ٪ از داده ها در سه انحراف استاندارد از میانگین است.
- حداقل [لاتکس] 95 [/لاتکس] ٪ از داده ها در انحراف استاندارد [لاتکس] 4. 5 [/لاتکس] از میانگین است.
- این به قانون چبیشو معروف است.
برای داده هایی که دارای توزیع هستند که به شکل زنگ و متقارن است:
- تقریباً [لاتکس] 68 [/لاتکس] ٪ از داده ها در یک انحراف استاندارد از میانگین است.
- تقریباً [لاتکس] 95 [/لاتکس] ٪ از داده ها در دو انحراف استاندارد از میانگین است.
- بیش از [لاتکس] 99 [/لاتکس] ٪ از داده ها در سه انحراف استاندارد از میانگین است.
- این به عنوان قاعده تجربی شناخته می شود.
- توجه به این نکته حائز اهمیت است که این قانون فقط زمانی اعمال می شود که شکل توزیع داده ها به شکل زنگ و متقارن باشد. ما هنگام مطالعه توزیع احتمال "عادی" یا "گاوسی" در فصل های بعدی در مورد این موضوع بیشتر خواهیم آموخت.
مفهوم مفهوم
انحراف استاندارد می تواند به شما در محاسبه گسترش داده ها کمک کند. در صورت محاسبه انحراف استاندارد یک نمونه یا جمعیت ، معادلات مختلفی برای استفاده وجود دارد.
- انحراف استاندارد به ما امکان می دهد داده ها یا کلاس های فردی را با مجموعه داده ها به معنای عددی مقایسه کنیم.
- [لاتکس] \ DisplayStyle _ = \ sqrt<<\frac<
^>>>>>[/لاتکس] فرمول محاسبه انحراف استاندارد یک نمونه است. - برای محاسبه انحراف استاندارد یک جمعیت ، ما از میانگین جمعیت ، μ و فرمول [لاتکس] \ displayStyle = \ SQRT استفاده می کنیم<<\frac<
^>>>>>[/لاتکس]
بررسی فرمول
که در آن [لاتکس] \ displayStyle_ [/لاتکس] = انحراف استاندارد نمونه ، [لاتکس] \ DisplayStyle \ Overline [/لاتکس] = میانگین نمونه