نمونه گیری آماری. برآورد فاصله سهم عمومی

اغلب اتفاق می افتد که تجزیه و تحلیل یک پدیده اجتماعی خاص و کسب اطلاعات در مورد آن ضروری است. چنین وظایفی اغلب در آمار و مطالعات آماری بوجود می آید. تأیید یک پدیده اجتماعی کاملاً تعریف شده اغلب غیرممکن است. به عنوان مثال ، چگونه می توان نظر جمعیت یا همه ساکنان یک شهر خاص را در مورد هر موضوعی جویا شد؟ پرسیدن از همه تقریباً غیرممکن و بسیار سخت است. در چنین مواردی ، ما به نمونه نیاز داریم. این دقیقاً مفهومی است که تقریباً تمام تحقیقات و تجزیه و تحلیلها بر اساس آن استوار است.

نمونه گیری چیست

هنگام تجزیه و تحلیل یک پدیده اجتماعی خاص ، لازم است اطلاعاتی در مورد آن به دست آورید. اگر هر تحقیقی را انجام دهید ، متوجه خواهید شد که هر واحد از کل موضوع تحقیق در معرض تحقیق و تجزیه و تحلیل قرار نمی گیرد. فقط قسمت خاصی از این مجموعه در نظر گرفته می شود. این فرایند نمونه گیری است: هنگامی که فقط واحدهای خاصی از یک مجموعه مورد بررسی قرار می گیرند.

البته بستگی زیادی به نوع نمونه دارد. اما قوانین اساسی نیز وجود دارد. نکته اصلی این است که انتخاب از بین جمعیت باید کاملاً تصادفی باشد. واحدهای جمعیتی مورد استفاده به دلیل هیچ معیاری نباید انتخاب شوند. به طور خلاصه ، اگر لازم است که جمعیتی از جمعیت یک شهر خاص را انتخاب کرده و فقط مردان را انتخاب کنید ، در این مطالعه خطایی رخ می دهد ، زیرا انتخاب به طور تصادفی انجام نشده است ، اما بر اساس جنسیت انتخاب شده است. تقریباً همه روشهای نمونه گیری بر اساس این قاعده است.

قوانین نمونه برداری

برای اینکه جمعیت منتخب ویژگیهای اساسی کل پدیده را منعکس کند ، باید براساس قوانین خاصی ساخته شود ، که در آن توجه اصلی باید به دسته های زیر توجه شود:

نمونه (جمعیت نمونه) ؛
جمعیت عمومی؛
نمایندگی ؛
خطای نمایندگی ؛
واحد جمعیت ؛
روشهای نمونه گیری

ویژگی های نمونه گیری و نمونه گیری به شرح زیر است:

همه نتایج بدست آمده بر اساس قوانین و قوانین ریاضی است ، یعنی اگر تحقیق به درستی و با محاسبات صحیح انجام شود ، نتایج به صورت ذهنی تحریف نخواهد شد.
این امکان را فراهم می آورد که با مطالعه نه تمام مجموعه رویدادها ، بلکه فقط بخشی از آنها ، خیلی سریعتر و با زمان و منابع کمتری به نتیجه برسید.
می توان از آن برای مطالعه اشیاء مختلف استفاده کرد: از مسائل خاصبه عنوان مثال ، سن ، جنسیت گروه مورد علاقه ما ، مطالعه افکار عمومی یا سطح امنیت مادی جمعیت.

مشاهده انتخابی

انتخابی این است مشاهده آماری، که در آن کل مجموعه مورد مطالعه مورد تحقیق قرار نمی گیرد ، بلکه فقط بخش خاصی از آن ، که به روش خاصی انتخاب شده است ، و نتایج مطالعه این قسمت به کل تجمیع می شود. به این قسمت جمعیت نمونه می گویند. آی تی تنها راهمطالعه مجموعه وسیعی از اشیاء تحقیقاتی

اما مشاهده گزینشی تنها در مواردی قابل استفاده است که مطالعه گروه کوچکی از واحدها ضروری باشد. به عنوان مثال ، هنگام مطالعه نسبت مردان به زنان در جهان ، از مشاهده نمونه استفاده خواهد شد. به دلایل واضح ، محاسبه همه ساکنان سیاره ما غیرممکن است.

اما با یک مطالعه ، اما نه همه ساکنان زمین ، بلکه یک کلاس مشخص 2 "A" در یک مدرسه خاص ، یک شهر خاص ، یک کشور خاص ، می توانند بدون مشاهده انتخابی انجام دهند. به هر حال ، تجزیه و تحلیل کل مجموعه موضوع تحقیق کاملاً ممکن است. لازم است پسران و دختران این کلاس را بشمارید - این نسبت خواهد بود.

نمونه و جمعیت عمومی

در حقیقت ، همه چیز آنطور که به نظر می رسد پیچیده نیست. در هر مورد مورد مطالعه دو سیستم وجود دارد: جمعیت عمومی و جامعه نمونه. آن چیست؟ همه واحدها به صورت کلی طبقه بندی می شوند. و به نمونه - آن واحدهای عمومی که برای نمونه گرفته شده اند. اگر همه چیز به درستی انجام شود ، بخش انتخاب شده یک مدل کاهش یافته از کل جمعیت (عمومی) خواهد بود.

اگر در مورد جمعیت عمومی صحبت کنیم ، تنها دو نوع آن را می توان تشخیص داد: جمعیت عمومی مشخص و نامعین. بستگی به این دارد که تعداد کل واحدهای یک سیستم مشخص است یا خیر. اگر این یک جمعیت خاص است ، نمونه گیری آسان تر خواهد بود زیرا مشخص است که چند درصد از تعداد کل واحدها نمونه برداری خواهند شد.

این نکته در تحقیقات بسیار ضروری است. به عنوان مثال ، اگر می خواهید درصد محصولات شیرینی بی کیفیت را در یک کارخانه خاص بررسی کنید. فرض کنیم جمعیت قبلاً تعیین شده است. به طور قطع شناخته شده است که این شرکت سالانه 1000 محصول شیرینی پزی تولید می کند. اگر از این هزار نمونه 100 قنادی تصادفی نمونه تهیه کرده و آنها را برای بررسی ارسال کنیم ، خطا حداقل خواهد بود. به طور خلاصه ، 10 all از کل محصولات مورد تحقیق قرار گرفتند و طبق نتایج ، ما می توانیم با در نظر گرفتن خطای نمایندگی ، در مورد کیفیت پایین همه محصولات صحبت کنیم.

و اگر ما 100 محصول شیرینی پزی را از یک جمعیت عمومی نامشخص ، جایی که در واقع ، مثلاً 1 میلیون واحد وجود داشت ، نمونه برداری کنیم ، نتیجه نمونه و خود مطالعه به طور غیرقابل قبول و نادرست خواهد بود. آیا تفاوت را احساس می کنید؟ بنابراین ، اطمینان از جمعیت عمومی در بیشتر موارد بسیار مهم است و بر نتیجه مطالعه تأثیر زیادی می گذارد.

نمایندگی جمعیت

بنابراین ، اکنون یکی از مهمترین س questionsالات - نمونه باید چگونه باشد؟ این بیشترین است نکته اصلیپژوهش. در این مرحله ، لازم است نمونه را محاسبه کرده و واحدها را از تعداد کل موجود در آن انتخاب کنید. در صورتی که ویژگی ها و خصوصیات خاصی از جمعیت عمومی در نمونه باقی بماند ، جمعیت به درستی انتخاب شده است. به این می گویند نمایندگی.

به عبارت دیگر ، اگر پس از انتخاب ، بخشی همان تمایلات و ویژگی های کل مقدار فرد مورد بررسی را حفظ کند ، چنین مجموعه ای نماینده نامیده می شود. اما نمی توان هر نمونه خاص را از جمعیت نماینده انتخاب کرد. چنین موضوعات تحقیقاتی نیز وجود دارد که نمونه آنها به سادگی نمی تواند نماینده باشد. اینجاست که مفهوم خطای نمایندگی مطرح می شود. اما اجازه دهید کمی بیشتر در این مورد با جزئیات بیشتر صحبت کنیم.

نحوه ساخت نمونه

بنابراین ، برای به حداکثر رساندن نمایندگی ، سه قانون اصلی نمونه گیری وجود دارد:

خطا (خطا) نمایندگی

ویژگی اصلیکیفیت نمونه انتخاب شده مفهوم "خطای نمایندگی" است. آن چیست؟ اینها تفاوت های خاصی بین شاخص های مشاهده انتخابی و مداوم است. از نظر شاخص های خطا ، نمایندگی به قابل اعتماد ، عادی و تقریبی تقسیم می شود. به عبارت دیگر ، انحراف تا 3، ، به ترتیب از 3 تا 10 and و از 10 تا 20، ، مجاز است. اگرچه در آمار مطلوب است که خطا از 5-6 exceed تجاوز نکند. در غیر این صورت ، دلیلی برای صحبت در مورد نمایندگی ناکافی نمونه وجود دارد. عوامل زیادی برای محاسبه سوگیری نمایندگی و نحوه تأثیر آن بر نمونه یا جمعیت عمومی در نظر گرفته شده است:

احتمالاتی که می خواهید با آن به یک نتیجه دقیق برسید.
تعداد واحدهای نمونه. همانطور که قبلاً ذکر شد ، هرچه واحد نمونه کمتر باشد ، خطای نمایندگی بزرگتر خواهد بود و برعکس.
همگنی جمعیت مورد مطالعه. هرچه جمعیت ناهمگن تر باشد ، خطای نمایندگی بیشتر خواهد بود. توانایی نمایندگی کل به همگنی همه واحدهای تشکیل دهنده آن بستگی دارد.
روش انتخاب واحدها برای نمونه.

در مطالعات خاص ، درصد خطای میانگین معمولاً توسط خود محقق بر اساس برنامه مشاهده و طبق مطالعات قبلی تعیین می شود. به عنوان یک قاعده ، خطای نمونه گیری نهایی قابل قبول (خطای نمایندگی) بین 3-5٪ در نظر گرفته می شود.

بزرگتر همیشه بهتر نیست

همچنین لازم به یادآوری است که نکته اصلی در سازماندهی مشاهده گزینشی ، رساندن حجم آن به حداقل قابل قبول است. در عین حال ، نباید برای کاهش بیش از حد مرزهای خطای نمونه گیری تلاش کرد ، زیرا این می تواند منجر به افزایش غیر موجه حجم نمونه و در نتیجه افزایش هزینه انجام یک بررسی انتخابی شود.

در عین حال ، افزایش بیش از حد اندازه خطای نمایندگی غیرممکن است. در واقع ، در این مورد ، اگرچه حجم جمعیت نمونه کاهش می یابد ، اما این منجر به وخامت قابلیت اطمینان نتایج بدست آمده می شود.

معمولاً چه س questionsالاتی پیش از محقق مطرح می شود

هرگونه تحقیق ، اگر انجام شود ، به منظور خاصی است و برای به دست آوردن برخی نتایج است. هنگام انجام یک نمونه مطالعه ، به عنوان یک قاعده ، سوالات اولیه مطرح می شود:

روشهای انتخاب واحدهای تحقیقاتی در نمونه

هر نمونه نماینده نیست. گاهی اوقات یک علامت در کل و جزء آن متفاوت بیان می شود. برای دستیابی به الزامات نمایندگی ، توصیه می شود از تکنیک های مختلف نمونه گیری استفاده کنید. علاوه بر این ، استفاده از یک روش دیگر به شرایط خاص بستگی دارد. این تکنیک های نمونه گیری عبارتند از:

انتخاب تصادفی ؛
انتخاب مکانیکی ؛
انتخاب معمولی ؛
انتخاب سریال (تو در تو)

نمونه گیری تصادفی یک سیستم اندازه گیری است که با هدف انتخاب تصادفی واحدهای جامعه انجام می شود ، در صورتی که احتمال قرار گرفتن در نمونه برای همه واحدهای جمعیت عمومی برابر باشد. توصیه می شود از این تکنیک فقط در صورت همگنی و تعداد کمی از ویژگیهای ذاتی استفاده کنید. در غیر این صورت ، برخی صفات خاصعدم انعکاس ریسک در نمونه نمونه گیری تصادفی در قلب همه روشهای نمونه گیری دیگر قرار دارد.

با انتخاب مکانیکی واحدها ، در یک فاصله زمانی خاص انجام می شود. در صورت لزوم تشکیل نمونه ای از جرایم خاص ، می توان هر کارت 5 ، 10 یا 15 را از همه سوابق آماری جرایم ثبت شده ، بسته به تعداد کل آنها و اندازه نمونه موجود حذف کرد. مضرات این روش این است که قبل از نمونه گیری ، لازم است یک حساب کامل از واحدهای جمعیت داشته باشید ، سپس باید رتبه بندی را انجام دهید ، و تنها پس از آن می توان نمونه گیری را در فاصله زمانی معینی انجام داد. به این روش زمان بر است و بنابراین اغلب استفاده نمی شود.

انتخاب معمولی (پهنه بندی شده) نوعی نمونه گیری است که در آن جمعیت عمومی با توجه به ویژگی خاصی به گروه های همگن تقسیم می شوند. گاهی محققان به جای "گروه" از اصطلاحات دیگری استفاده می کنند: "مناطق" و "مناطق". سپس ، از هر گروه ، تعداد معینی از واحدها به طور تصادفی به تناسب انتخاب می شوند وزن مخصوصگروه ها در جمعیت عمومی انتخاب معمولاً در چند مرحله انجام می شود.

نمونه گیری سریالی روشی است که در آن انتخاب واحدها به صورت گروهی (سری) انجام می شود و کلیه واحدهای گروه (سری) انتخاب شده مورد بررسی قرار می گیرند. مزیت این روش این است که گاهی اوقات انتخاب واحدهای منفرد نسبت به مجموعه ها دشوارتر است ، به عنوان مثال ، هنگام مطالعه شخصی که در حال گذراندن دوران محکومیت است. در مناطق ، مناطق انتخاب شده ، مطالعه همه واحدها بدون استثنا کاربرد دارد ، به عنوان مثال ، مطالعه همه افرادی که در یک موسسه خاص در حال گذراندن محکومیت هستند.

انواع نمونه برداری:

در واقع تصادفی ؛

مکانیکی؛

معمول؛

سریال ؛

ترکیب شده.

نمونه گیری صحیح تصادفیشامل انتخاب واحدها از جمعیت عمومی به صورت تصادفی یا تصادفی بدون هیچ عنصر سیستماتیک است. با این حال ، قبل از انتخاب تصادفی واقعی ، باید مطمئن شوید که همه واحدهای مردم عادی ، بدون استثنا ، شانس کاملاً مساوی برای قرار گرفتن در نمونه را دارند ، هیچ گونه حذفی در لیست ها یا لیست ها وجود ندارد ، بدون توجه به واحدهای فردی ، و غیره. همچنین باید مرزهای مشخصی از جمعیت تعیین شود تا شمول یا حذف واحدهای فردی مشخص باشد. بنابراین ، به عنوان مثال ، هنگام بررسی دانش آموزان ، باید مشخص شود که آیا افرادی که در مرخصی تحصیلی هستند ، دانشجویان دانشگاه های غیر دولتی ، مدارس نظامی و غیره در نظر گرفته می شوند یا خیر. مهم است که تعیین کنیم که آیا جمعیت شامل خواهد شد یا خیر غرفه های تجاری، چادرهای تجاری و سایر اشیاء مشابه. در واقع انتخاب تصادفی می تواند تکرار یا غیر تکرار باشد. برای انجام یک انتخاب بدون تکرار در روند طراحی ، قرعه کشی شده به مجموعه اصلی بازگردانده نمی شود و در انتخاب بعدی شرکت نمی کند. هنگام استفاده از جداول اعداد تصادفیدر صورت تکرار اعداد در ستون یا ستون های انتخاب شده ، عدم تکرار انتخاب حاصل می شود.

نمونه برداری مکانیکیدر مواردی اعمال می شود که جمعیت عمومی به نحوی سفارش داده شده است ، به عنوان مثال ترتیب خاصی در ترتیب واحدها وجود دارد (شماره پرسنل کارکنان ، لیست رای دهندگان ، شماره تلفن پاسخ دهندگان ، تعداد خانه ها و آپارتمان ها و غیره).

جمعیت عمومی در انتخاب مکانیکی را می توان با توجه به ارزش مورد مطالعه رتبه بندی یا مرتب کرد یا با ویژگی آن ارتباط داشت ، که نمایندگی نمونه را افزایش می دهد. با این حال ، در این مورد ، خطر یک خطای سیستماتیک افزایش می یابد ، که با دست کم گرفتن مقادیر صفت مورد مطالعه (اگر اولین مقدار از هر فاصله ثبت شده باشد) یا با بیش از حد آن (اگر آخرین مقدار ثبت شده باشد) همراه است. از هر فاصله) بنابراین ، توصیه می شود انتخاب را از وسط اولین فاصله شروع کنید

انتخاب معمولی.این روش انتخاب در مواردی استفاده می شود که همه واحدهای جمعیت عمومی را می توان به چند گروه معمولی تقسیم کرد. هنگام بررسی جمعیت ، چنین گروه هایی می توانند ، به عنوان مثال ، مناطق ، گروه های اجتماعی ، سنی یا آموزشی ، هنگام بررسی شرکت ها - صنعت یا زیر صنعت ، شکل مالکیت و غیره. انتخاب معمولی شامل نمونه برداری از واحدهای هر گروه معمولی به صورت تصادفی یا به صورت مکانیکی... از آنجا که جمعیت نمونه در یک نسبت یا دیگری لزوماً شامل نمایندگان همه گروه ها می شود ، نوع بندی جمعیت عمومی این امکان را فراهم می آورد که تأثیر واریانس بین گروهی بر میانگین خطای نمونه گیری را که در این مورد تنها با تغییرات درون گروهی تعیین می شود ، حذف کنیم.

انتخاب واحدها در یک نمونه معمولی می تواند متناسب با حجم گروههای معمولی یا متناسب با تمایز درون گروهی صفت سازماندهی شود.

انتخاب سریالاین روش انتخاب زمانی مناسب است که واحدهای جمعیتی در گروه ها یا سری های کوچک ترکیب شوند. بسته هایی با مقدار مشخص ممکن است به عنوان چنین سری در نظر گرفته شوند. محصولات نهایی، محموله های کالا ، گروه های دانشجویی ، تیپ ها و سایر انجمن ها. اصل نمونه گیری سریال در واقع انتخاب تصادفی یا مکانیکی سری است که در آن یک بررسی مداوم از واحدها انجام می شود.

اغلب اتفاق می افتد که تجزیه و تحلیل یک پدیده اجتماعی خاص و کسب اطلاعات در مورد آن ضروری است. چنین وظایفی اغلب در آمار و مطالعات آماری بوجود می آید. اغلب نمی توان یک پدیده اجتماعی کاملاً تعریف شده را تأیید کرد. به عنوان مثال ، چگونه می توان نظر جمعیت یا همه ساکنان یک شهر خاص را در مورد هر موضوعی جویا شد؟ پرسیدن از همه تقریباً غیرممکن و بسیار سخت است. در چنین مواردی ، ما به نمونه نیاز داریم. این دقیقاً مفهومی است که تقریباً تمام تحقیقات و تجزیه و تحلیلها بر اساس آن استوار است.

نمونه گیری چیست

قوانین نمونه برداری

نمونه (جمعیت نمونه) ؛
جمعیت عمومی؛
نمایندگی ؛
خطای نمایندگی ؛
واحد جمعیت ؛
روشهای نمونه گیری

ویژگی های نمونه گیری و نمونه گیری به شرح زیر است:

همه نتایج بدست آمده بر اساس قوانین و قوانین ریاضی است ، یعنی اگر تحقیق به درستی و با محاسبات صحیح انجام شود ، نتایج به صورت ذهنی تحریف نخواهد شد.
این امکان را فراهم می آورد که با مطالعه نه تمام مجموعه رویدادها ، بلکه فقط بخشی از آنها ، خیلی سریعتر و با زمان و منابع کمتری به نتیجه برسید.
می توان از آن برای مطالعه موضوعات مختلف استفاده کرد: از مسائل خاص ، به عنوان مثال ، سن ، جنسیت گروه مورد علاقه ما ، تا مطالعه افکار عمومی یا سطح امنیت مادی مردم.

مشاهده انتخابی

انتخابی یک مشاهده آماری است که در آن تمام مجموعه مورد مطالعه تحت تحقیق قرار نمی گیرند ، بلکه فقط بخش خاصی از آن ، به روش خاصی انتخاب شده است و نتایج به دست آمده از مطالعه این قسمت به کل مجموعه گسترش می یابد. به این قسمت جمعیت نمونه می گویند. این تنها راه مطالعه مجموعه وسیعی از اشیاء تحقیقاتی است.

اما با یک مطالعه ، اما نه همه ساکنان زمین ، بلکه یک کلاس 2 "A" در یک مدرسه خاص ، یک شهر خاص ، یک کشور خاص ، می توانند بدون مشاهده انتخابی انجام دهند. از این گذشته ، تجزیه و تحلیل کل مجموعه موضوع تحقیق کاملاً ممکن است. لازم است پسران و دختران این کلاس را بشمارید - این نسبت خواهد بود.

نمونه و جمعیت عمومی

در حقیقت ، همه چیز آنطور که به نظر می رسد پیچیده نیست. در هر موضوع مورد مطالعه دو سیستم وجود دارد: جمعیت عمومی و جامعه نمونه. آن چیست؟ همه واحدها به عنوان کلی طبقه بندی می شوند. و به نمونه - آن واحدهای عمومی که برای نمونه گرفته شده اند. اگر همه چیز به درستی انجام شود ، بخش انتخاب شده یک مدل کاهش یافته از کل جمعیت (عمومی) خواهد بود.

نمایندگی جمعیت

بنابراین ، اکنون یکی از مهمترین س questionsالات - نمونه باید چگونه باشد؟ این مهمترین نکته مطالعه است. در این مرحله ، لازم است نمونه را محاسبه کرده و واحدها را از تعداد کل موجود در آن انتخاب کنید. در صورتی که ویژگی ها و خصوصیات خاصی از جمعیت عمومی در نمونه باقی بماند ، جمعیت به درستی انتخاب شده است. به این می گویند نمایندگی.

نحوه ساخت نمونه

بنابراین ، برای به حداکثر رساندن نمایندگی ، سه قانون اصلی نمونه گیری وجود دارد:

بی نظیرترین شاخص اندازه نمونه 20٪ در نظر گرفته می شود. نمونه گیری آماریدر 20٪ تقریباً همیشه نتیجه را تا حد ممکن به واقعیت نزدیک می کند. در عین حال ، نیازی به انتقال به بخش عظیمی از جمع عمومی نیست. 20 درصد نمونه رقمی است که توسط بسیاری از مطالعات ایجاد شده است. بیایید نظریه بیشتری ارائه دهیم. هرچه نمونه بزرگتر باشد ، خطای نمایندگی کوچکتر است و نتیجه تحقیق دقیق تر است. هرچه نمونه از نظر تعداد واحدها به جمعیت عمومی نزدیکتر باشد ، نتایج دقیق تر و صحیح تر خواهد بود. پس از همه ، اگر کل سیستم را بررسی کنید ، نتیجه 100 خواهد بود. اما دیگر نمونه گیری در اینجا وجود ندارد. اینها مطالعاتی است که در آن کل آرایه مورد بررسی قرار می گیرد ، همه واحدها ، بنابراین این مورد برای ما جالب نیست.
در صورت عدم مصلحت در پردازش 20 of از جمعیت عمومی ، مجاز به مطالعه واحدهای جمعیت به مقدار حداقل 1001 است. این نیز یکی از شاخص های مطالعه آرایه موضوع تحقیق است ، که در طول زمان توسعه یافته است. البته ، برای حجم وسیعی از تحقیقات نتایج دقیقی نخواهد داد ، اما آن را تا حد ممکن به دقت نمونه برداری احتمالی نزدیک می کند.
فرمول ها و جداول خلاصه بسیاری در آمار وجود دارد. بسته به هدف تحقیق و معیار نمونه گیری ، توصیه می شود فرمول یا فرمول دیگری را انتخاب کنید. اما از این نکته در تحقیقات پیچیده و چند مرحله ای استفاده می شود.

خطا (خطا) نمایندگی

ویژگی اصلی کیفیت نمونه انتخاب شده مفهوم "خطای نمایندگی" است. آن چیست؟ اینها تفاوت های خاصی بین شاخص های مشاهده انتخابی و مداوم است. از نظر شاخص های خطا ، نمایندگی به قابل اعتماد ، عادی و تقریبی تقسیم می شود. به عبارت دیگر ، انحراف تا 3 درصد ، از 3 تا 10 درصد و از 10 تا 20 درصد ، به ترتیب مجاز است. اگرچه در آمار مطلوب است که خطا از 5-6 exceed تجاوز نکند. در غیر این صورت ، دلیلی برای صحبت در مورد نمایندگی ناکافی نمونه وجود دارد. عوامل زیادی برای محاسبه سوگیری نمایندگی و نحوه تأثیر آن بر نمونه یا جمعیت عمومی در نظر گرفته شده است:

احتمالاتی که می خواهید با آن به یک نتیجه دقیق برسید.
تعداد واحدهای نمونه. همانطور که قبلاً ذکر شد ، هرچه واحد نمونه کمتر باشد ، خطای نمایندگی بزرگتر خواهد بود و برعکس.
همگنی جمعیت مورد مطالعه. هرچه جمعیت ناهمگن تر باشد ، خطای نمایندگی بیشتر خواهد بود. توانایی نمایندگی کل به همگنی همه واحدهای تشکیل دهنده آن بستگی دارد.
روش انتخاب واحدها برای نمونه.

بزرگتر همیشه بهتر نیست

معمولاً چه س questionsالاتی پیش از محقق مطرح می شود

تعریف مقدار مورد نیازواحدهای نمونه گیری ، یعنی چند واحد مورد بررسی قرار می گیرد. علاوه بر این ، جمعیت باید برای تحقیقات دقیق نماینده باشد.
محاسبه خطای نمایندگی با سطح مشخصی از احتمال. بلافاصله باید توجه داشت که هیچ نمونه مطالعاتی با سطح احتمال 100٪ وجود ندارد. اگر مرجعی که مطالعه بخش خاصی را انجام داده است ادعا کند که نتایج آنها با احتمال 100٪ دقیق است ، این یک دروغ است. تمرینات طولانی مدت در حال حاضر درصد احتمال یک مطالعه نمونه درست را تعیین کرده است. این رقم معادل 95.4 درصد است.

روشهای انتخاب واحدهای تحقیقاتی در نمونه

انتخاب تصادفی ؛
انتخاب مکانیکی ؛
انتخاب معمولی ؛
انتخاب سریال (تو در تو)

نمونه گیری تصادفی یک سیستم اندازه گیری است که با هدف انتخاب تصادفی واحدهای جامعه انجام می شود ، در صورتی که احتمال ورود به نمونه برای همه واحدهای جمعیت عمومی برابر باشد. توصیه می شود از این تکنیک فقط در صورت همگنی و تعداد کمی از ویژگیهای ذاتی استفاده کنید. در غیر این صورت ، برخی از ویژگی ها خطر انعکاس در نمونه را دارند. نمونه گیری تصادفی در قلب همه روشهای نمونه گیری دیگر قرار دارد.

انتخاب معمولی (پهنه بندی شده) نوعی نمونه گیری است که در آن جمعیت عمومی با توجه به ویژگی خاصی به گروه های همگن تقسیم می شوند. گاهی محققان به جای "گروه" از اصطلاحات دیگری استفاده می کنند: "مناطق" و "مناطق". سپس تعداد مشخصی واحد به طور تصادفی از هر گروه متناسب با وزن مخصوص گروه در کل جمعیت انتخاب می شود. انتخاب معمولاً در چند مرحله انجام می شود.

طرح

معرفی
1. نقش نمونه گیری
نتیجه
کتابشناسی - فهرست کتب

معرفی

آمار یک علم تحلیلی است که برای همه متخصصان مدرن ضروری است. متخصص مدرناگر روش شناسی آماری را بلد نباشد نمی تواند سواد داشته باشد. آمار مهمترین ابزار ارتباطی بین یک شرکت و جامعه است. آمار یکی از رشته های مهم در برنامه درسی همه تخصص ها است ، زیرا سواد آماری جزء لاینفک است تحصیلات عالی، و از نظر تعداد ساعات اختصاص داده شده در برنامه درسی ، یکی از اولین مکانها را به خود اختصاص می دهد. هنگام کار با اعداد ، هر متخصص باید بداند که چگونه این یا آن داده ها بدست آمده است ، ماهیت محاسبه آنها چگونه است ، چقدر کامل و قابل اعتماد هستند.

1. نقش نمونه گیری

مجموعه همه واحدهای جمعیت ، دارای ویژگی و موضوع مورد مطالعه ، در آمار جمعیت عمومی نامیده می شود.

در عمل ، بنا به دلایلی ، در نظر گرفتن کل جمعیت عمومی همیشه ممکن یا غیر عملی نیست. سپس آنها خود را محدود به مطالعه فقط قسمت خاصی از آن می کنند ، هدف نهایی آن گسترش نتایج به دست آمده برای کل جمعیت عمومی است ، به عنوان مثال. روش نمونه گیری را اعمال کنید

بدین منظور ، برخی از عناصر ، به اصطلاح نمونه ، از جمعیت عمومی به روش خاصی انتخاب می شوند و نتایج پردازش داده های نمونه (به عنوان مثال ، مقادیر میانگین حسابی) به کل جمعیت تعمیم می یابد.

اساس نظری روش نمونه گیری قانون است تعداد زیاد... بر اساس این قانون ، با پراکندگی محدود یک ویژگی در جمعیت عمومی و نمونه ای به اندازه کافی بزرگ با احتمال نزدیک به پایایی کامل ، میانگین نمونه می تواند به طور خودسرانه به میانگین عمومی نزدیک شود. این قانون ، که شامل گروهی از قضایا می شود ، به طور ریاضی کاملاً اثبات شده است. بنابراین ، میانگین حسابی محاسبه شده برای نمونه را می توان معقولانه به عنوان شاخصی توصیف کرد که کل جمعیت را به عنوان یک کل توصیف می کند.

2. روشهای انتخاب احتمالی برای اطمینان از نمایندگی

برای اینکه بتوانیم در مورد ویژگی های جمعیت عمومی از نمونه نتیجه بگیریم ، نمونه باید نماینده (نماینده) باشد ، به عنوان مثال. باید به طور کامل و کافی ویژگی های عموم مردم را نشان دهد. نمایندگی نمونه تنها در صورتی قابل اطمینان است که انتخاب داده ها عینی باشد.

مجموعه نمونه بر اساس اصل فرایندهای احتمالی جرم بدون هیچ استثنائی از طرح انتخاب اتخاذ شده شکل می گیرد. لازم است از همگنی نسبی جمعیت نمونه یا تقسیم آن به گروههای همگن واحدها اطمینان حاصل شود. هنگام تشکیل چارچوب نمونه برداری ، باید تعریف واضحی از واحد نمونه گیری ارائه شود. تقریباً اندازه واحدهای نمونه برداری مطلوب است و هرچه واحد نمونه گیری کوچکتر باشد ، نتایج دقیق تری دارد.

سه روش انتخاب امکان پذیر است: انتخاب تصادفی ، انتخاب واحدها بر اساس یک طرح خاص ، ترکیبی از روش های اول و دوم.

اگر انتخاب مطابق با طرح تصویب شده از جمعیت عمومی انجام شود ، قبلاً به انواع (لایه ها یا اقشار) تقسیم شده است ، پس چنین نمونه ای معمولی (یا طبقه بندی شده ، یا طبقه بندی شده ، یا منطقه بندی شده) نامیده می شود. تقسیم بندی دیگر نمونه بر اساس گونه ها بر اساس واحد نمونه گیری تعیین می شود: واحد مشاهده یا مجموعه ای از واحدها (گاهی از اصطلاح "لانه" استفاده می شود). در حالت دوم ، نمونه را سریال یا تو در تو می نامند. در عمل ، اغلب از نمونه گیری معمولی با نمونه گیری دسته ای استفاده می شود. در آمار ریاضی ، هنگام بحث در مورد مشکل انتخاب داده ها ، تقسیم نمونه به نمونه های تکراری و غیر تکراری لزوماً معرفی می شود. اولین مربوط به طرح توپ برگشتی است ، دوم - به یک طرح برگشت ناپذیر (هنگام بررسی روند انتخاب داده ها با استفاده از مثال انتخاب توپ ها) رنگ متفاوتاز گلدان). در آمارهای اجتماعی و اقتصادی ، استفاده از نمونه گیری مکرر منطقی نیست ، بنابراین ، به عنوان یک قاعده ، منظور ما نمونه گیری غیر تکراری است.

از آنجا که اشیاء اجتماعی-اقتصادی دارای ساختار پیچیده ای هستند ، سازماندهی نمونه می تواند بسیار دشوار باشد. به عنوان مثال ، برای انتخاب خانوارها هنگام مطالعه میزان مصرف جمعیت شهر بزرگ، انتخاب سلولهای سرزمینی ، ساختمانهای مسکونی ، سپس آپارتمانها یا خانوارها ، و سپس پاسخگو آسانتر است. چنین نمونه ای چند مرحله ای نامیده می شود. هر مرحله استفاده می کند واحدهای مختلفانتخاب: بزرگتر - در مراحل اولیه ، در آخرین مرحله ، واحد انتخاب با واحد مشاهده همزمان می شود.

نوع دیگر نمونه گیری ، نمونه گیری چند فازی است. چنین نمونه ای شامل تعداد مشخصی از مراحل است که هر کدام با جزئیات برنامه مشاهده مشخص می شوند. به عنوان مثال ، 25 of از کل جمعیت عمومی با توجه به برنامه کوتاه، هر 4 واحد از این نمونه با توجه به یک برنامه کاملتر و غیره مورد بررسی قرار می گیرد.

برای هر نوع نمونه گیری ، انتخاب واحدها به سه روش مشخص انجام می شود. یک روش انتخاب تصادفی را در نظر بگیرید. اول از همه ، فهرستی از واحدهای جمعیت تهیه می شود که در آن به هر واحد یک کد دیجیتالی (شماره یا برچسب) اختصاص داده می شود. سپس قرعه کشی انجام می شود. توپ هایی با اعداد مربوطه در درام قرار می گیرند ، مخلوط می شوند و توپ ها انتخاب می شوند. اعداد ترسیم شده مربوط به واحدهای نمونه است. تعداد اتاقها برابر با حجم نمونه برنامه ریزی شده است.

انتخاب بر اساس قرعه ممکن است به دلیل نقص فنی (کیفیت توپ ، طبل) و دلایل دیگر منوط به جانبداری باشد. انتخاب با توجه به جدول اعداد تصادفی از نظر عینیت قابل اطمینان تر است. چنین جدولی شامل مجموعه ای از اعداد است که به طور تصادفی متناوب هستند و توسط سیگنال های الکترونیکی انتخاب می شوند. از آنجا که ما از سیستم عددی اعشاری 0 ، 1 ، 2 ،. ، 9 استفاده می کنیم ، احتمال ظاهر شدن هر رقمی 1/10 است. بنابراین ، اگر لازم باشد یک جدول از اعداد تصادفی ، شامل 500 نویسه ایجاد شود ، حدود 50 عدد از آنها 0 ، همان مقدار 1 و غیره خواهد بود.

نمونه برداری با توجه به برخی از طرح ها (به اصطلاح نمونه برداری مستقیم) اغلب استفاده می شود. طرح انتخاب به گونه ای اتخاذ شده است که ویژگی ها و تناسبات اساسی جمعیت عمومی را منعکس می کند. ساده ترین راه: با توجه به لیست واحدهای جمعیت عمومی ، تهیه شده به طوری که ترتیب واحدها با خواص مورد مطالعه مرتبط نباشد ، انتخاب مکانیکی واحدها با یک مرحله برابر N: n انجام می شود. معمولاً ، انتخاب نه با واحد اول ، بلکه با عقب نشینی نیم قدم به منظور کاهش احتمال نمونه گیری سوگیری آغاز می شود ... فراوانی ظاهر واحدها با ویژگی های خاص ، به عنوان مثال ، دانش آموزان با سطح خاصی از عملکرد تحصیلی ، زندگی در خوابگاه و غیره. با ساختار ایجاد شده در جمعیت عمومی تعیین می شود.

برای اطمینان بیشتر از این که نمونه ساختار کل جمعیت را منعکس می کند ، گروه دوم به انواع (اقشار یا مناطق) تقسیم می شود و انتخاب تصادفی یا مکانیکی از هر نوع انجام می شود. تعداد کل واحدهای انتخاب شده از انواع متفاوت، باید با اندازه نمونه مطابقت داشته باشد.

مشکلات خاصی هنگامی ایجاد می شود که لیستی از واحدها وجود نداشته باشد و انتخاب باید در محل یا نمونه های محصول در انبار محصول نهایی انجام شود. در این موارد ، مهم است که یک طرح جهت گیری دقیق در زمین و یک طرح انتخاب و پیروی از آن ، اجتناب از انحرافات ، مهم باشد. به عنوان مثال ، به متر دستور داده می شود که از یک ایستگاه اتوبوس به سمت شمال در امتداد سمت زوج خیابان حرکت کند و با شمارش دو خانه از گوشه اول ، سومین خانه را وارد کرده و در هر 5 مسکن یک نظرسنجی انجام دهد. پایبندی دقیق به طرح پذیرفته شده ، تحقق شرط اصلی تشکیل نمونه نماینده - عینیت انتخاب واحدها را تضمین می کند.

نمونه گیری از سهمیه باید از نمونه گیری تصادفی متمایز شود ، هنگامی که نمونه از واحدهای دسته بندی خاصی (سهمیه) ساخته شده است ، که باید در نسبت های مشخص ارائه شود. به عنوان مثال ، در نظرسنجی از خریداران فروشگاه های بزرگ ، ممکن است برنامه ریزی شود که 150 نفر از پاسخ دهندگان انتخاب شوند ، از جمله 90 زن ، از جمله 25 دختر ، 20 زن جوان با فرزندان کوچک ، 35 زن میانسال با لباس تجاری ، 10 زن 50 ساله و بزرگتر هستند. علاوه بر این ، نظرسنجی از 70 مرد برنامه ریزی شده بود ، از این تعداد 25 نفر نوجوان و پسر ، 20 نفر مرد جوان بچه دار ، 15 نفر مرد کت و شلوار ، 10 نفر مرد لباس ورزشی پوشیده بودند. برای تعیین گرایش ها و ترجیحات مصرف کننده ، چنین نمونه ای ممکن است خوب باشد ، اما اگر بخواهیم از آن برای تعیین میزان متوسط خریدها و ساختار آنها استفاده کنیم ، نتایج غیر نماینده ای به دست خواهیم آورد. این به این دلیل است که هدف نمونه گیری سهمیه ای انتخاب دسته های خاصی است.

نمونه ممکن است نماینده ای نداشته باشد ، حتی اگر مطابق با نسبت های شناخته شده از جمعیت عمومی تشکیل شده باشد ، اما انتخاب بدون هیچ گونه برنامه ای انجام می شود - واحدها به دلخواه جذب می شوند ، فقط برای اطمینان از نسبت دسته های خود در همان نسبت ها در جمعیت عمومی (به عنوان مثال ، نسبت مردان و زنان ، پاسخ دهندگان جوانتر و مسن تر از افراد دارای توان بدن و توانمند ، و غیره).

این اظهارات باید شما را در برابر چنین رویکردهای نمونه گیری هشدار دهد و بر لزوم نمونه گیری عینی تأکید مجدد کند.

3. ویژگیهای سازمانی و روش شناسی نمونه گیری تصادفی ، مکانیکی ، معمولی و سریالی

بسته به نحوه انتخاب عناصر جامعه در نمونه ، چندین نوع نمونه گیری از نمونه متمایز می شود. انتخاب می تواند تصادفی ، مکانیکی ، معمولی و سریالی باشد.

انتخاب تصادفی چنین انتخابی است که در آن همه عناصر عموم مردم از فرصت برابر برای انتخاب برخوردارند. به عبارت دیگر ، برای هر یک از عناصر جمعیت عمومی ، احتمال مساوی بودن شامل شدن در نمونه تضمین می شود.

نمونه آماری تصادفی احتمالی

الزام انتخاب تصادفی در عمل با استفاده از تعداد زیاد یا جدولی از اعداد تصادفی محقق می شود.

هنگام انتخاب با قرعه کشی ، همه عناصر جمعیت عمومی از قبل شماره گذاری شده و شماره آنها روی کارت ها اعمال می شود. پس از تکان دادن دقیق ، تعداد مورد نیاز کارت ها به هر طریقی (به ترتیب در یک ردیف یا به ترتیب دیگر) از بسته انتخاب می شود که مربوط به اندازه نمونه است. در این حالت ، می توانید کارت های انتخاب شده را کنار بگذارید (بدین ترتیب انتخاب به اصطلاح غیر تکراری انجام می شود) ، یا با بیرون کشیدن کارت ، شماره آن را یادداشت کرده و به بسته برگردانید ، در نتیجه به آن فرصتی برای ظاهر شدن مجدد در نمونه (انتخاب مکرر). پس از انتخاب مجدد ، هر بار که کارت بازگردانده می شود ، بسته باید با دقت تنظیم شود.

روش قرعه کشی در مواردی استفاده می شود که تعداد عناصر کل جمعیت مورد مطالعه کم باشد. با جمعیت زیاد ، انتخاب تصادفی با قرعه کشی مشکل می شود. در مورد حجم زیادی از داده های پردازش شده ، روش استفاده از جدولی از اعداد تصادفی معتبرتر و کم دردسرتر است.

انتخاب مکانیکی به شرح زیر انجام می شود. اگر یک نمونه 10 formed تشکیل شود ، به عنوان مثال از هر ده عنصر ، یکی باید انتخاب شود ، سپس کل مجموعه به طور مشروط به قسمتهای مساوی از 10 عنصر تقسیم می شود. سپس یک مورد به طور تصادفی از ده مورد برتر انتخاب می شود. به عنوان مثال ، قرعه کشی عدد نهم را نشان داد. انتخاب عناصر باقی مانده نمونه کاملاً با نسبت مشخص شده انتخاب N با تعداد اولین عنصر انتخاب شده تعیین می شود. در این حالت ، نمونه شامل عناصر 9 ، 19 ، 29 و غیره خواهد بود.

انتخاب مکانیکی باید با احتیاط مورد استفاده قرار گیرد ، زیرا خطر واقعی خطاهای سیستماتیک وجود دارد. بنابراین ، قبل از ساخت نمونه مکانیکی ، تجزیه و تحلیل جمعیت مورد مطالعه ضروری است. اگر عناصر آن به طور تصادفی مرتب شده باشند ، نمونه بدست آمده به صورت مکانیکی تصادفی خواهد بود. با این حال ، اغلب ، عناصر مجموعه اصلی تا حدی یا حتی کاملاً مرتب شده اند. برای انتخاب مکانیکی سفارش عناصر با تکرارپذیری مناسب ، که دوره آن ممکن است با دوره انتخاب مکانیکی مطابقت داشته باشد ، بسیار نامطلوب است.

اغلب ، عناصر یک مجموعه بر اساس میزان صفت مورد مطالعه به ترتیب کاهش یا افزایش مرتب می شوند و دوره ای ندارند. انتخاب مکانیکی از چنین جمعیتی ویژگی انتخاب مستقیم را به خود می گیرد ، زیرا بخشهای جداگانه جمعیت متناسب با تعداد آنها در کل جمعیت در نمونه نشان داده شده است ، به عنوان مثال. هدف انتخاب نماینده نمونه است.

نوع دیگر انتخاب کارگردانی ، انتخاب معمولی است. انتخاب معمولی باید از انتخاب معمولی متمایز شود. انتخاب اشیاء معمولی در آمار zemstvo و همچنین در بررسی بودجه مورد استفاده قرار گرفت. در همان زمان ، انتخاب "روستاهای معمولی" یا "مزارع معمولی" با توجه به برخی ویژگی های اقتصادی انجام شد ، به عنوان مثال ، با توجه به اندازه مالکیت زمین در هر حیاط ، با توجه به شغل ساکنان و غیره. انتخاب این نوع نمی تواند مبنایی برای استفاده از روش نمونه گیری باشد ، زیرا در اینجا نیاز اصلی آن ، تصادفی بودن انتخاب ، برآورده نشده است.

در مورد انتخاب معمولی در روش نمونه گیری ، جامعه به گروه هایی تقسیم می شود که از نظر کیفی همگن هستند و سپس انتخاب تصادفی در داخل هر گروه انجام می شود. سازماندهی انتخاب معمولی بسیار دشوارتر از خود انتخاب تصادفی است ، زیرا دانش خاصی در مورد ترکیب و ویژگی های عموم مردم مورد نیاز است ، اما نتایج دقیق تری را ارائه می دهد.

در انتخاب سریال ، کل جمعیت به گروه (سری) تقسیم می شوند. سپس ، با انتخاب تصادفی یا مکانیکی ، قسمت خاصی از این سری جدا شده و پردازش مداوم آنها انجام می شود. در واقع ، انتخاب سریال یک انتخاب تصادفی یا مکانیکی است که برای عناصر بزرگ شده جمعیت اصلی انجام می شود.

از نظر نظری ، نمونه سریال ناقص ترین نمونه در نظر گرفته شده است. برای پردازش مواد ، به عنوان یک قاعده ، از آن استفاده نمی شود ، اما هنگام سازماندهی یک نظرسنجی ، به ویژه در مطالعه ، راحتی خاصی را فراهم می کند. کشاورزی... به عنوان مثال ، نظرسنجی های نمونه سالانه از مزارع دهقانان در سالهای قبل از جمع آوری با روش انتخاب سریالی انجام شد. برای مورخ مفید است که از نمونه گیری سریال آگاهی داشته باشد زیرا ممکن است به نتایج چنین نظرسنجی هایی دست یابد.

علاوه بر روشهای انتخاب کلاسیک که در بالا توضیح داده شد ، از روشهای دیگر در عمل روش نمونه گیری استفاده می شود. بیایید دو مورد از آنها را در نظر بگیریم.

جمعیت مورد مطالعه می تواند دارای ساختار چند مرحله ای باشد ، می تواند شامل واحدهای سطح اول باشد که به نوبه خود از واحدهای سطح دوم و غیره تشکیل شده است. به عنوان مثال ، استانها شامل شهرستانها هستند ، شهرستانها را می توان مجموعه ای از ولست ها در نظر گرفت ، ولست ها شامل روستاها و روستاها - حیاط هستند.

انتخاب چند مرحله ای را می توان برای چنین جمعیت هایی اعمال کرد ، به عنوان مثال. انتخاب را به صورت متوالی در هر مرحله انجام دهید. بنابراین ، از مجموع استانها ، با روش مکانیکی ، معمولی یا تصادفی ، می توانید شهرستانها را انتخاب کنید (مرحله اول) ، سپس volost ها را به یکی از روشهای نشان داده شده (مرحله دوم) ، سپس روستاها (مرحله سوم) و در نهایت را انتخاب کنید. ، خانوارها (مرحله چهارم).

انتخاب طولانی مدت بودجه کارگران نمونه ای از انتخاب مکانیکی دو مرحله ای است. در مرحله اول ، شرکت ها به صورت مکانیکی انتخاب می شوند ، در مرحله دوم ، کارگرانی که بودجه آنها مورد بررسی قرار می گیرد.

تنوع ویژگی های اشیاء مورد مطالعه می تواند متفاوت باشد. به عنوان مثال ، تهیه مزارع دهقانی با مزرعه خود نیروی کارکمتر از مثلاً اندازه محصولات خود نوسان می کند. در این راستا ، یک نمونه کوچکتر از نظر عرضه نیروی کار به اندازه یک نمونه بزرگتر از داده ها در مورد اندازه محصولات از نظر تعداد عناصر ، نماینده خواهد بود. در این مورد ، از نمونه ای که اندازه محصولات تعیین می شود ، می توان نمونه ای را تهیه کرد که به اندازه کافی نمایانگر میزان نیروی کار باشد ، در نتیجه انتخاب دو مرحله ای انجام می شود. V مورد کلیمی توانید مراحل زیر را اضافه کنید ، به عنوان مثال یک زیر نمونه دیگر از زیر نمونه به دست آمده و غیره بسازید. از روش انتخاب یکسان در مواردی استفاده می شود که اهداف تحقیق در محاسبه شاخص های مختلف به دقت متفاوتی نیاز دارند.

وظیفه 1. آمار توصیفی

در امتحان ، 20 دانش آموز نمرات زیر (در مقیاس 100 امتیاز) را دریافت کردند:

1) یک سری توزیع فرکانس ، فرکانس های نسبی و انباشته را برای 5 فاصله بسازید.

2) چند ضلعی ، هیستوگرام و چند ضلعی تجمعی بسازید.

3) میانگین حسابی ، حالت ، میانه ، چارک های اول و سوم ، محدوده بین سه چهارم ، انحراف استاندارد و ضرایب تغییر را بیابید. داده ها را با استفاده از این ویژگی ها تجزیه و تحلیل کنید و فاصله ای را که شامل 50٪ مقادیر مرکزی مقادیر نشان داده شده است نشان دهید.

1) x (دقیقه) = 53 ، x (حداکثر) = 98

R = x (حداکثر) - x (دقیقه) = 98-53 = 45

h = R / 1 + 3.32lgn ، جایی که n اندازه نمونه است ، n = 20

h = 45/1 + 3.32 * lg20 = 9

a (i) - حد پایین فاصله ، b (i) - حد بالایی فاصله.

a (1) = x (min) - h / 2 ، b (1) = a (1) + h ، سپس اگر b (i) حد بالایی فاصله ith است (علاوه بر این ، a (i + 1) = b (i)) ، سپس b (2) = a (2) + h ، b (3) = a (3) + h و غیره ساخت فواصل ادامه می یابد تا شروع بعدی به ترتیب فاصله برابر یا بزرگتر از x (حداکثر) باشد.

a (1) = 47.5 b (1) = 56.5

a (2) = 56.5 b (2) = 65.5

a (3) = 65.5 b (3) = 74.5

a (4) = 74.5 b (4) = 83.5

a (5) = 83.5 b (5) = 92.5

a (6) = 92.5 b (6) = 101.5

فاصله ، a (i) - b (i)	شمارش فرکانس	فرکانس ، n (i)	فرکانس انباشته ، n (سلام)

2) برای ساخت نمودارها ، ما سری تغییرات توزیع (فاصله و گسسته) فرکانس های نسبی W (i) = n (i) / n ، فرکانس های نسبی انباشته W (hi) را می نویسیم و نسبت W ( i) / h با پر کردن جدول.

x (i) = a (i) + b (i) / 2 ؛ W (سلام) = n (سلام) / n

سری آماری از توزیع برآورد:

فاصله ، a (i) - b (i)

برای ایجاد هیستوگرام فرکانس های نسبی در امتداد آبسه ، فواصل جزئی را به تعویق می اندازیم ، که روی هر یک از آنها مستطیلی می سازیم که مساحت آن برابر با فرکانس نسبی W (i) این فاصله i است. سپس ارتفاع یک مستطیل ابتدایی باید برابر W (i) / h باشد.

در صورت وجود نقاط میانی ، می توانید از هیستوگرام چند ضلعی با همان توزیع دریافت کنید پایه های بالامستطیل ها را با قطعات خط مستقیم متصل کنید.

برای ساخت تجمعات یک مجموعه گسسته ، مقادیر ویژگی را در امتداد محور آبسیسه و فرکانس های نسبی انباشته W (hi) در امتداد محور مختصات ترسیم می کنیم. نقاط حاصله را با قطعات خط مستقیم متصل می کنیم. برای سری فاصله در امتداد آبسیسه ، مرزهای بالای گروه را کنار می گذاریم.

3) میانگین حسابی را با فرمول پیدا می کنیم:

مد با فرمول محاسبه می شود:

مرز پایین فاصله مدال ؛ h عرض فاصله گروه بندی است. - فرکانس فاصله مدال ؛ - فرکانس فاصله قبل از مدال ؛ فرکانس فاصله بعد از مدال است. = 23.125.

میانه را پیدا کنید:

تعداد = 20: 53.58.59.59.63.67.68.69.71.73.78.79.85.86.87.89.91.91.98.98

با جایگزینی مقادیر ، به دست می آوریم: Q1 = 65؛

مقدار چارک دوم با مقدار میانه مطابقت دارد ، بنابراین Q2 = 75.5 ؛ Q3 = 88

محدوده بین سه ماهه عبارت است از:

انحراف ریشه میانگین مربع (استاندارد) با فرمول بدست می آید:

ضریب تغییرات:

از این محاسبات می توان دریافت که 50٪ از مقادیر مرکزی مقادیر نشان داده شده شامل فاصله 74.5 - 83.5 است.

وظیفه 2. آزمون فرضیه های آماری.

ترجیحات ورزشی مردان ، زنان و نوجوانان به شرح زیر است:

فرضیه مربوط به استقلال ترجیح از جنسیت و سن را 05/0 = b آزمایش کنید.

1) آزمایش فرضیه در مورد استقلال ترجیحات در ورزش.

ضریب پیرسن:

مقدار جداول آزمون مجذور کای با درجه آزادی 4 در b = 0.05 برابر است با h2 tabl = 9.488.

از آنجا که ، فرضیه رد می شود. تفاوت در ترجیحات قابل توجه است.

2. فرضیه انطباق.

والیبال به عنوان یک ورزش نزدیک ترین به بسکتبال است. بیایید مطابقت را در تنظیمات مورد علاقه مردان ، زنان و نوجوانان بررسی کنیم.

Ф 2 = 0.1896 + 0.1531 + 0.1624 + 0.1786 + 0.1415 + 0.1533 = 0.979 =

با سطح معنی داری b = 0.05 و درجه آزادی k = 2 ، مقدار جدول h 2 tab = 9.210.

از آنجا که F 2> ، تفاوت در تنظیمات قابل توجه است.

وظیفه 3. تحلیل همبستگی-رگرسیون.

تجزیه و تحلیل تصادفات جاده ای آمار زیر را برای درصد رانندگان زیر 21 سال و تعداد تصادفات جدی در هر 1000 راننده به دست آورد:

تجزیه و تحلیل گرافیکی و همبستگی-رگرسیون داده ها ، پیش بینی تعداد تصادفات با پیامدهای شدید برای شهری که در آن تعداد رانندگان زیر 21 سال برابر با 20 of از کل رانندگان است.

ما یک نمونه از اندازه n = 10 دریافت می کنیم.

x درصد رانندگان زیر 21 سال است ،

y تعداد تصادفات در هر 1000 راننده است.

معادله رگرسیون خطی عبارت است از:

ما به ترتیب محاسبه می کنیم:

به طور مشابه ، ما پیدا می کنیم

نمونه ضریب رگرسیون

ارتباط بین x ، y قوی است.

معادله رگرسیون خطی به شکل زیر است:

بر شکل ارایه شده رشته پراکندگی و برنامه خطی رجعت . انجام می دهیم پیش بینی برای ایکس n =20 .

ما گرفتیم y n =0 .2 9*20-1 .4 6 = 4 .3 4 .

پیش بینی معنی اتفاق افتاد بیشتر از همه ارزش های، ارسال شده v اصلی جدول . آی تی نتیجه رفتن، چی همبستگی اعتیاد سر راست و ضریب برابر است با 0,29 کافی بزرگ . بر هر واحد افزایش Dx او می دهد افزایش دی =0 .3

ورزش 4 . تحلیل و بررسی موقت رتبه ها و پیش بینی .

پیش بینیشاخص های هفته آینده با استفاده از:

الف) روش میانگین متحرک ، انتخاب داده های سه هفته ای برای محاسبه آن ؛

ب) میانگین وزنی نمایی ، به عنوان 0.1 = b انتخاب می شود.

از جدول اعداد تصادفی اعداد 41 ، 51 ، 69 ، 135 ، 124 ، 93 ، 91 ، 144 ، 10 ، 24 را پیدا می کنیم.

ما آنها را به ترتیب صعودی مرتب می کنیم: 10 ، 24 ، 41 ، 51 ، 69 ، 91 ، 93 ، 124 ، 135 ، 144.

ما یک شماره جدید از 1 تا 10 انجام می دهیم. داده های اولیه را به مدت ده هفته دریافت می کنیم:

هموارسازی نمایی در b = 0.1 فقط یک مقدار می دهد.

برای اواسط کل دوره ، سه پیش بینی دریافت می کنیم: 12.855 ؛ 1309؛ 12.895.

بین این پیش بینی ها توافق وجود دارد.

ورزش 5 . فهرست مطالب تحلیل و بررسی.

این شرکت در زمینه حمل و نقل کالا فعالیت می کند. چندین سال اطلاعاتی در مورد حجم حمل و نقل 4 نوع محموله و هزینه حمل و نقل یک واحد محموله وجود دارد.

شاخص های ساده قیمت ، مقدار و ارزش را برای هر نوع محصول ، و همچنین شاخص های Laspeyres و Pasche و یک شاخص ارزش را تعیین کنید. نتایج بدست آمده را به صورت معنی دار بیان کنید.

راه حل. بیایید شاخصهای ساده را محاسبه کنیم:

فهرست Laspeyres:

فهرست Pasche:

هزینه بوقلمون:

شاخص های جداگانه نشان دهنده مغایرت در تغییر قیمت و مقدار کالاهای A ، B ، C ، D. شاخص های کل نشان دهنده روند کلی تغییرات است. به طور کلی ، هزینه کالاهای حمل شده 13 درصد کاهش یافته است. دلیل این امر این است که گران ترین محموله از نظر کمیت 42 درصد کاهش یافته و تعرفه آن تقریباً بدون تغییر باقی مانده است.

سالهای 16 تا 20 به ترتیب از 1 تا 5 شماره گذاری می شوند. داده های اولیه به شکل زیر است:

ابتدا ، پویایی مقدار محموله A را بررسی می کنیم.

فهرست مطالب	دستاوردهای مطلق	نرخ رشد ، درصد	نرخ رشد،٪

در این سرعت رشد به طور متوسط بر فرمول ها :

, .

برای سرعت کسب کردن v هر کدام مورد تی NS = T R -1 .

اکنون در نظر گرفتن محموله د .

فهرست مطالب	دستاوردهای مطلق	نرخ رشد ، درصد	نرخ رشد،٪

نتیجه

مقادیر متوسط و انواع آنها نقش مهمی در آمار بازی می کنند. شاخص های متوسط به طور گسترده ای در تجزیه و تحلیل مورد استفاده قرار می گیرند ، زیرا در آنها است که نظم پدیده ها و فرایندهای توده ای هم در زمان و هم در فضا تجلی پیدا می کند. به عنوان مثال ، منظم بودن افزایش بهره وری نیروی کار در شاخص های آماری رشد متوسط تولید به ازای هر کارگر در صنعت بیان می شود ، منظم بودن رشد مداوم در سطح رفاه جمعیت در شاخص های آماری افزایش متوسط درآمد کارگران و کارکنان و غیره

چنین ویژگی های توصیفی از توزیع یک ویژگی متغیر به عنوان حالت و میانه به طور گسترده استفاده می شود. آنها ویژگی های خاصی هستند ، اهمیت آنها به هر نوع خاصی در سری تنوع داده می شود.

بنابراین ، برای توصیف رایج ترین مقدار یک ویژگی ، از مد استفاده می شود و برای نشان دادن حد کمی ارزش یک ویژگی متغیر ، که نیمی از افراد جامعه به آن رسیده اند ، میانه است.

بنابراین ، میانگین ها به مطالعه الگوهای توسعه صنعت ، صنعت خاص ، جامعه و کشور به طور کلی کمک می کند.

کتابشناسی - فهرست کتب

1. نظریه آمار: کتاب درسی / R.A. شمویلوا ، V.G. میناشکین ، N.A. سادوونیکوا ، E.B. شوالوف ؛ ویرایش شده توسط R.A. شمویلوا. - ویرایش چهارم ، Rev. و اضافه کنید - م .: امور مالی و آمار ، 2005. - 656 ص.

2. گوساروف V.M. آمار: آموزشبرای دانشگاه ها - م .: UNITY-DANA ، 2001.

4. مجموعه مشکلات در نظریه آمار: کتاب درسی / اد. پروفسور V. V. Glinsky و Ph.D. D. ، دانشیار L.K. سرگا اد Z-e. - M: INFRA-M ؛ نووسیبیرسک: توافقنامه سیبری ، 2002.

5. آمار: کتاب درسی / خارچنکو L-P. ، Dolzhenkova V.G. ، Ionin V.G. و دیگران ، اد. V.G. یونینا - ویرایش دوم ، Rev. و اضافه کنید - M: INFRA-M 2003

اسناد مشابه

آمار توصیفی و استنباط آماری. روشهای انتخاب برای اطمینان از نمایندگی نمونه. تأثیر نوع نمونه بر میزان خطا. وظایف هنگام استفاده از روش نمونه گیری. انتشار داده های مشاهده برای عموم مردم.

تست ، اضافه شده 02/27/2011

روش انتخابی و نقش آن توسعه نظریه مدرن مشاهده گزینشی گونه شناسی روش های انتخاب اجرای عملی نمونه گیری تصادفی ساده. سازماندهی نمونه معمولی (طبقه ای). اندازه نمونه برای انتخاب سهمیه

گزارش اضافه شده 09/03/2011

هدف از نمونه گیری و نمونه گیری. ویژگیهای سازمان انواع متفاوتمشاهده انتخابی خطاهای نمونه برداری و روش های محاسبه آنها. کاربرد روش نمونه گیری برای تجزیه و تحلیل شرکت های مجموعه سوخت و انرژی.

مقاله ترم اضافه شده در 10/06/2014

مشاهده انتخابی به عنوان یک روش تحقیقات آماری، ویژگی های آن انواع تصادفی ، مکانیکی ، معمولی و سریالی در تشکیل مجموعه نمونه. مفهوم و علل خطای نمونه برداری ، روشهای تعیین آن

چکیده ، اضافه شده 06/04/2010

مفهوم و نقش آمار در سازوکار مدیریت اقتصاد نوین مشاهده آماری مستمر و غیر مداوم ، شرح روش نمونه گیری. انواع انتخاب برای مشاهده انتخابی ، خطاهای نمونه گیری. شاخص های تولید و مالی

مقاله ترم ، اضافه شده 03/17/2011

مطالعه اجرای طرح. 10٪ نمونه گیری تصادفی غیرتکراری. هزینه تولید کارخانه. خطای نمونه گیری نهایی پویایی قیمت متوسط و فروش محصول. شاخص قیمت ترکیب متغیر

تست ، اضافه شده 02/09/2009

بدست آوردن نمونه ای از اندازه توزیع نرمال n یک متغیر تصادفی. یافتن ویژگی های عددی نمونه. گروه بندی داده ها و سری تنوع. هیستوگرام فرکانس عملکرد توزیع تجربی برآورد آماری پارامترها.

کار آزمایشگاهی ، اضافه شده 03/31/2013

ماهیت مفاهیم نمونه گیری و مشاهده نمونه ، انواع و دسته های اصلی انتخاب. تعیین اندازه و اندازه نمونه. استفاده عملیتجزیه و تحلیل آماری مشاهده نمونه. محاسبه خطاهای میزان نمونه و میانگین نمونه.

مقاله ترم اضافه شده 02/17/2015

مفهوم مشاهده انتخابی خطاهای نمایندگی ، اندازه گیری خطای نمونه گیری. تعیین حجم نمونه مورد نیاز استفاده از روش نمونه گیری به جای روش جامد. پراکندگی در جمعیت و مقایسه شاخص ها.

تست ، اضافه شده 07/23/2009

خطاهای انتخاب و مشاهده. روشهای انتخاب واحد در نمونه ویژگی های فعالیت تجاری شرکت. نمونه بررسی مصرف کنندگان محصولات. توزیع ویژگی های نمونه به جمعیت عمومی.

طرح:

1. مسائل مربوط به آمار ریاضی

2. انواع نمونه.

3. روشهای انتخاب

4. توزیع آماری نمونه.

5. عملکرد توزیع تجربی

6. چند ضلعی و هیستوگرام.

7. ویژگی های عددی سری تنوع.

8. برآورد آماری پارامترهای توزیع.

9. برآورد فاصله پارامترهای توزیع.

1. مسائل و روشهای آمار ریاضی

آمار ریاضی بخشی از ریاضیات است که به روشهای جمع آوری ، تجزیه و تحلیل و پردازش نتایج داده های مشاهده آماری برای اهداف علمی و عملی اختصاص داده شده است.

فرض کنید لازم است مجموعه ای از اجسام همگن را در ارتباط با برخی ویژگی های کمی یا کیفی که این اجسام را مشخص می کند ، مطالعه کنید. به عنوان مثال ، اگر دسته ای از قطعات وجود داشته باشد ، استاندارد قطعه می تواند به عنوان یک شاخص کیفی عمل کند و اندازه کنترل شده قطعه می تواند به عنوان یک شاخص کمی عمل کند.

گاهی اوقات یک مطالعه مداوم انجام می شود ، به عنوان مثال هر شی را برای ویژگی مورد نظر بازرسی کنید. در عمل ، از یک نظرسنجی کامل به ندرت استفاده می شود. به عنوان مثال ، اگر جمعیتی دارای تعداد زیادی اشیاء باشد ، انجام یک نظرسنجی کامل از نظر فیزیکی غیرممکن است. اگر بررسی یک شی با تخریب آن همراه باشد یا نیاز به هزینه های سنگین مادی داشته باشد ، انجام یک بررسی کامل منطقی نیست. در چنین مواردی ، تعداد محدودی از اشیاء (جمعیت نمونه) به طور تصادفی از کل جمعیت انتخاب شده و مورد مطالعه قرار می گیرند.

وظیفه اصلی آمار ریاضی مطالعه کل جمعیت با استفاده از داده های نمونه است ، بسته به هدف ، به عنوان مثال. مطالعه ویژگیهای احتمالی جمعیت: قانون توزیع ، ویژگیهای عددی و غیره برای تصمیم گیری های مدیریتی در شرایط عدم قطعیت.

2. انواع نمونه

جمعیت عمومی مجموعه ای از اشیاء است که از آنها انتخابی انجام می شود.

نمونه نمونه (نمونه) مجموعه ای از اشیاء تصادفی انتخاب شده است.

حجم جمعیت آیا تعداد اجسام این جمعیت است. حجم جمعیت عمومی نشان داده شده است N ، انتخابی - n.

مثال:

اگر از 1000 قسمت 100 قسمت برای بازرسی انتخاب شود ، حجم کل جمعیت است N = 1000 ، و حجم نمونه n = 100

انتخاب را می توان به دو صورت انجام داد: پس از انتخاب و مشاهده شی بر روی آن ، می توان آن را به جمعیت عادی برگرداند یا بازگردانده نشود. که نمونه ها به نمونه های تکراری و غیر تکراری تقسیم می شوند.

تکرار شدنامیده می شوند نمونه گیری، که در آن شی انتخاب شده (قبل از انتخاب مورد بعدی) به جمعیت عمومی بازگردانده می شود.

تکرار نشدنینامیده می شوند نمونه گیری، که در آن شی انتخاب شده به جمعیت عمومی بازگردانده نمی شود.

در عمل معمولاً از نمونه گیری تصادفی بدون تکرار استفاده می شود.

برای اطمینان از داده های نمونه به اندازه کافی برای قضاوت در مورد ویژگی مورد علاقه در جمعیت عمومی ، لازم است اشیاء نمونه آن را به درستی نشان دهند. نمونه باید نسبت جمعیت را به درستی نشان دهد. نمونه باید باشد نماینده (نماینده).

با توجه به قانون اعداد بزرگ ، می توان استدلال کرد که اگر نمونه به صورت تصادفی گرفته شود ، نماینده خواهد بود.

اگر اندازه جمعیت عمومی به اندازه کافی بزرگ باشد و نمونه فقط بخش ناچیزی از این جمعیت باشد ، آنگاه تمایز بین نمونه های تکراری و غیرتکراری پاک می شود. در حالت محدود ، هنگامی که یک جمعیت عمومی نامحدود در نظر گرفته می شود و نمونه دارای اندازه محدود است ، این تفاوت از بین می رود.

مثال:

در مجله آمریکایی "Literary Review" ، با استفاده از روش های آماری ، پیش بینی هایی در مورد نتیجه انتخابات ریاست جمهوری آینده در ایالات متحده در سال 1936 انجام شد. مدعیان این پست F.D. روزولت و A.M. لندون. کتابهای مرجع مشترکین تلفن به عنوان منبع برای عموم مردم آمریکایی مورد بررسی در نظر گرفته شد. از این تعداد ، 4 میلیون آدرس به طور تصادفی انتخاب شد ، که تحریریه مجله با ارسال کارت پستال از آنها خواست تا نگرش خود را نسبت به نامزدهای ریاست جمهوری ابراز کنند. پس از پردازش نتایج نظرسنجی ، مجله پیش بینی جامعه شناسی را منتشر کرد که لندون در انتخابات آینده با اختلاف زیادی پیروز می شود. و ... من اشتباه کردم: روزولت برنده شد.
این مثال را می توان به عنوان نمونه ای از نمونه غیر نماینده در نظر گرفت. واقعیت این است که در ایالات متحده در نیمه اول قرن بیستم ، تنها بخش ثروتمند مردم دارای تلفن بودند که از نظرات لندون پشتیبانی می کرد.

3. روشهای انتخاب

در عمل ، کاربردی است روش های مختلفانتخاب ، که می تواند به 2 نوع تقسیم شود:

1. انتخاب مستلزم تجزیه عموم مردم به بخشها نیست تصادفی ساده غیرقابل تکرار؛ ب) تکرار تصادفی ساده).

2. انتخاب ، که در آن جمعیت به قسمتهایی تقسیم می شود. (آ) انتخاب معمولی؛ ب) انتخاب مکانیکی؛ v) سریال انتخاب).

ساده گاه به گاه این را صدا کن انتخاب، که در آن اشیاء یک به یک از کل جمعیت (به طور تصادفی) بازیابی می شوند.

معمولنامیده می شوند انتخاب، که در آن اشیاء نه از کل جمعیت عمومی ، بلکه از هر قسمت "معمولی" آن انتخاب می شوند. به عنوان مثال ، اگر قطعه ای بر روی چندین دستگاه ساخته شود ، انتخاب نه از کل مجموعه قطعات تولید شده توسط همه ماشین ها ، بلکه از محصولات هر دستگاه به طور جداگانه انجام می شود. چنین انتخابی زمانی مورد استفاده قرار می گیرد که موضوع مورد بررسی در نواحی "معمولی" مختلف جمعیت به طور قابل توجهی دارای نوسان باشد.

مکانیکینامیده می شوند انتخاب، که در آن جمعیت عمومی "به صورت مکانیکی" به تعداد گروههایی که تعداد اشیاء باید در نمونه گنجانده شود تقسیم می شود و از هر گروه یک شیء انتخاب می شود. به عنوان مثال ، اگر شما نیاز به انتخاب 20 از قطعات ساخته شده توسط ماشین دارید ، پس هر قسمت پنجم انتخاب می شود. اگر شما نیاز به انتخاب 5 از قطعات ، هر 20 ، و غیره دارید. گاهی اوقات چنین انتخابی ممکن است نمایندگی نمونه را تضمین نکند (اگر هر 20 رول آسیاب انتخاب شود و بلافاصله پس از انتخاب کاتر تعویض شود ، سپس همه رول های خرد شده با برش های بلانت انتخاب می شوند).

سریالنامیده می شوند انتخاب، که در آن اشیاء از جمعیت عمومی نه یک به یک ، بلکه در "سری" انتخاب می شوند ، که مورد بررسی مداوم قرار می گیرند. به عنوان مثال ، اگر محصولات توسط گروه بزرگی از ماشین آلات اتوماتیک تولید می شوند ، تنها چند دستگاه تحت بازرسی کامل قرار می گیرند.

در عمل ، اغلب از انتخاب ترکیبی استفاده می شود که در آن روشهای فوق ترکیب شده اند.

4. توزیع آماری نمونه

اجازه دهید یک نمونه از جمعیت عمومی و مقدار x 1 استخراج شود- بار مشاهده شده ، x 2 -n 2 بار ،… x k - n k بار. n = n 1 + n 2 + ... + n k اندازه نمونه است. مقادیر مشاهده شدهنامیده می شوند گزینه ها، و ترتیب انواع ، به ترتیب صعودی نوشته شده است- سری تنوع... شماره های مشاهدهنامیده می شوند فرکانس (فرکانس مطلق)، و ارتباط آنها با حجم نمونه- فرکانس های نسبییا احتمالات آماری

اگر تعداد گونه ها زیاد است یا نمونه از یک جمعیت عمومی پیوسته تهیه شده است ، سری تنوع نه بر اساس مقادیر نقطه ای فردی ، بلکه بر اساس فواصل مقادیر جمعیت عمومی گردآوری می شود. چنین سری تنوع نامیده می شود فاصلهدر این حالت ، طول فواصل باید برابر باشد.

توزیع آماری نمونه لیستی از گزینه ها و فرکانس های مربوط به آنها یا فرکانس های نسبی نامیده می شود.

توزیع آماری را می توان در قالب دنباله ای از فواصل و فرکانس های مربوطه (مجموع فرکانس هایی که در این بازه مقادیر قرار می گیرند) مشخص کرد.

محدوده تنوع نقطه فرکانس ها را می توان با جدول نشان داد:

x i	x 1	x 2	…	x k
n i	n 1	n 2	…	n k

به طور مشابه ، می توانید سری تغییرات نقطه فرکانس های نسبی را نشان دهید.

علاوه بر این:

مثال:

تعداد حروف در برخی از متن X برابر 1000 بود. اولین حرف "I" ، دوم "i" ، سوم "a" ، و چهارم "u" بود. ”. سپس حروف "o" ، "e" ، "y" ، "e" ، "s" آمد.

بگذارید مکانهایی را که آنها به ترتیب در الفبا اشغال کرده اند بنویسیم: 33 ، 10 ، 1 ، 32 ، 16 ، 6 ، 21 ، 31 ، 29.

پس از مرتب سازی این اعداد به ترتیب صعودی ، سری تنوع را بدست می آوریم: 1 ، 6 ، 10 ، 16 ، 21 ، 29 ، 31 ، 32 ، 33.

فراوانی حروف در متن: "a" - 75 ، "e" - 87 ، "i" - 75 ، "o" - 110 ، "y" - 25 ، "s" - 8 ، "e" - 3 ، " تو ""- 7 ، "من"- 22.

بیایید یک سری تنوع نقطه ای از فرکانس ها را بسازیم:

مثال:

توزیع فرکانس نمونه برداری از حجم داده شده است n = 20

یک سری تنوع نقطه ای از فرکانس های نسبی ایجاد کنید.

x i	2	6	12
n i	3	10	7

راه حل:

فرکانس های نسبی را بیابید:

x i	2	6	12
w i	0,15	0,5	0,35

هنگام ایجاد توزیع فاصله ، قوانینی برای انتخاب تعداد فواصل یا مقدار هر فاصله وجود دارد. معیار در اینجا نسبت بهینه است: با افزایش تعداد فواصل ، نمایندگی بهبود می یابد ، اما حجم داده ها و زمان پردازش آنها افزایش می یابد. تفاوت x max - x min بین بزرگترین و کوچکترین مقادیر ، نوع آن نامیده می شود جارو کردننمونه گیری

برای شمارش تعداد فواصلک معمولاً از فرمول تجربی استروژ استفاده می شود (با فرض گرد شدن به نزدیکترین عدد صحیح مناسب): k = 1 + 3.322 lg n.

بر این اساس ، مقدار هر فاصلهساعت را می توان با فرمول محاسبه کرد:

5. عملکرد توزیع تجربی

بیایید نمونه ای از جمعیت عمومی را در نظر بگیریم. اجازه دهید توزیع آماری فرکانس های ویژگی کمی X مشخص باشد. اجازه دهید علامت را معرفی کنیم: n x- تعداد مشاهداتی که در آنها مقدار صفت مشاهده شده است ، کمتر از x ؛ n - تعداد کل مشاهدات (اندازه نمونه). فراوانی نسبی رویداد X<х равна n x / n اگر x تغییر کند ، فرکانس نسبی نیز تغییر می کند ، یعنی فراوانی نسبیn x / n- تابع x وجود دارد. زیرا به صورت تجربی یافت می شود ، سپس به آن تجربی می گویند.

تابع توزیع تجربی (تابع توزیع نمونه) تابع را فراخوانی کنید، که برای هر x فرکانس نسبی رویداد X را تعیین می کند<х.

جایی که تعداد گزینه ها کمتر از x است ،

n اندازه نمونه است.

بر خلاف تابع توزیع تجربی نمونه ، تابع توزیع F (x) جمعیت عمومی نامیده می شود تابع توزیع نظری.

تفاوت بین توابع توزیع تجربی و نظری در این است که تابع نظری F (x) احتمال رویداد X را تعیین می کند F * (x)به احتمال F (x) این رویداد تمایل دارد. یعنی برای n بزرگ F * (x)و F (x) تفاوت کمی با یکدیگر دارند.

که توصیه می شود از تابع توزیع تجربی نمونه برای نمایش تقریبی تابع توزیع نظری (انتگرال) جمعیت عمومی استفاده کنید.

F * (x)دارای تمام خواص است F (x)

1. ارزشها F * (x)متعلق به فاصله است.

2. F * (x) یک تابع بدون کاهش است.

3. اگر کوچکترین گزینه است ، F * (x) = 0 ، برای x < x 1 ؛ اگر x k بزرگترین گزینه باشد ، F * (x) = 1 ، برای x> x k.

آن ها F * (x)برای برآورد F (x) عمل می کند.

اگر نمونه توسط سری تغییرات ارائه شده باشد ، تابع تجربی شکل زیر را دارد:

نمودار تابع تجربی تجمعی نامیده می شود.

مثال:

یک تابع تجربی برای توزیع داده شده نمونه ایجاد کنید.

راه حل:

اندازه نمونه n = 12 + 18 +30 = 60. کوچکترین گزینه 2 ، یعنی. در x < 2. رویداد X<6, (x 1 = 2) наблюдалось 12 раз, т.е. F * (x) = 12/60 = 0.2در 2 < ایکس < 6. رویداد X<10, (x 1 =2, x 2 = 6) наблюдалось 12 + 18 = 30 раз, т.е.F*(x)=30/60=0,5 при 6 < ایکس < 10. چون x = 10 بزرگترین گزینه است F * (x) = 1برای x> 10 عملکرد تجربی مورد نظر عبارت است از:

Cumulata:

تجمیع ، درک اطلاعات ارائه شده به صورت گرافیکی را ممکن می سازد ، به عنوان مثال ، به س questionsالات پاسخ می دهد: "تعداد مشاهداتی را که مقدار ویژگی آنها کمتر از 6 یا کمتر از 6 بود تعیین کنید. F * (6) = 0.2 »سپس تعداد مشاهداتی که مقدار ویژگی مشاهده شده در آنها کمتر از 6 بود معادل 0.2 * است n = 0.2 * 60 = 12. تعداد مشاهداتی که مقدار ویژگی مشاهده شده در آنها حداقل 6 بوده است برابر است با (1-0.2) * n = 0.8 * 60 = 48.

اگر یک سری تغییرات بازه مشخص شده باشد ، برای جمع آوری یک تابع توزیع تجربی ، نقاط میانی فواصل پیدا شده و از آنها یک تابع توزیع تجربی شبیه به یک سری تنوع نقطه ای بدست می آید.

6. چند ضلعی و هیستوگرام

برای وضوح ، نمودارهای مختلف توزیع آماری ساخته شده است: چند جمله ای و هیستوگرام

چند ضلعی فرکانسیاین یک خط شکسته است ، بخشهایی از آن که نقاط (x 1 ؛ n 1) ، (x 2 ؛ n 2) ،… ، (x k؛ n k) را متصل می کند ، جایی که گزینه ها هستند ، فرکانس های مربوطه است.

چند ضلعی فرکانس های نسبیاین یک خط شکسته است که بخشهای آن نقاط (x 1؛ w 1) ، (x 2؛ w 2) ،… ، (xk؛ wk) را متصل می کند ، جایی که xi گزینه ها هستند ، wi فرکانس های نسبی مربوط به آنها هستند به

مثال:

چندجمله ای از فرکانس های نسبی را در یک توزیع نمونه داده شده ترسیم کنید:

راه حل:

در مورد یک ویژگی پیوسته ، توصیه می شود که یک هیستوگرام بسازید ، که برای آن فاصله ای که همه مقادیر مشاهده شده ویژگی در آن محصور شده است به چندین فاصله جزئی از طول h تقسیم می شود و برای هر فاصله جزئی ni یافت می شود - مجموع فرکانس های متغیری که در فاصله i-th قرار می گیرند. (به عنوان مثال ، هنگام اندازه گیری قد یا وزن شخص ، با علامت پیوسته روبرو هستیم).

هیستوگرام فرکانساین یک شکل پله ای است که شامل مستطیل هایی است که پایه های آن فواصل جزئی طول h و ارتفاع آنها برابر با نسبت (چگالی فرکانس) است.

مربع از مستطیل نسبی i- برابر است با مجموع فرکانس های نوع فاصله i -th ، یعنی مساحت هیستوگرام فرکانس برابر است با مجموع همه فرکانس ها ، به عنوان مثال اندازهی نمونه.

مثال:

نتایج تغییرات ولتاژ (بر حسب ولت) در شبکه برق آورده شده است. اگر مقادیر ولتاژ به شرح زیر است ، چند ضلعی و هیستوگرام فرکانس ها را ترسیم کنید ، 227 ، 215 ، 230 ، 232 ، 223 ، 220 ، 228 ، 222 ، 221 ، 226 ، 226 ، 215 ، 218 ، 220 ، 216 ، 220 ، 225 ، 212 ، 217 ، 220.

راه حل:

بیایید یک سری تنوع ایجاد کنیم. ما n = 20 ، x دقیقه = 212 ، x max = 232 داریم.

بیایید فرمول Strojess را برای شمارش تعداد سطل ها اعمال کنیم.

سری تناوب فرکانسها به شرح زیر است:

		چگالی فرکانس
212-21 6		0,75
21 6-22 0		0,75
220-224		1,75
224-228
228-232		0,75

بیایید یک هیستوگرام فرکانس بسازیم:

بیایید با یافتن نقاط میانی فواصل ، یک چند ضلعی فرکانسی بسازیم:

هیستوگرام فرکانس های نسبیبه شکل پله ای متشکل از مستطیل ها گفته می شود که پایه های آن فواصل جزئی طول h و ارتفاع آنها برابر با نسبت w است من/ ساعت (چگالی فرکانس نسبی).

مربع مستطیل جزئی i- برابر با فرکانس نسبی واریانت است که در فاصله i- قرار می گیرد. آن ها مساحت هیستوگرام فرکانس های نسبی برابر است با مجموع فرکانس های نسبی ، یعنی واحد.

7. ویژگی های عددی سری تنوع

ویژگی های اصلی جمعیت عمومی و نمونه را در نظر بگیرید.

وسط عمومیمیانگین حسابی مقادیر صفت جمعیت عمومی نامیده می شود.

برای مقادیر مختلف x 1 ، x 2 ، x 3 ،… ، x n. از جمعیت عمومی جلد N داریم:

اگر مقادیر ویژگی دارای فرکانس های مربوطه N 1 + N 2 +… + N k = N باشد ، پس

میانگین نمونهمیانگین حسابی مقادیر صفت جامعه نمونه نامیده می شود.

اگر مقادیر ویژگی دارای فرکانس های مربوطه n 1 + n 2 + ... + n k = n باشد ، پس

مثال:

میانگین نمونه را برای نمونه محاسبه کنید: x 1 = 51.12؛ x 2 = 51.07 ؛ x 3 = 52.95 ؛ x 4 = 52.93 ؛ x 5 = 51.1 ؛ x 6 = 52.98 ؛ x 7 = 52.29 ؛ x 8 = 51.23 ؛ x 9 = 51.07 ؛ x 10 = 51.04

راه حل:

واریانس عمومیمیانگین حسابی مربعات انحراف مقادیر ویژگی X جمعیت عمومی از میانگین عمومی است.

برای مقادیر مختلف x 1 ، x 2 ، x 3 ، ... ، x N از ویژگی های جمعیت عمومی حجم N ، داریم:

اگر مقادیر ویژگی دارای فرکانس های مربوطه N 1 + N 2 +… + N k = N باشد ، پس

انحراف عمومی ریشه میانگین مربع (استاندارد)ریشه مربع واریانس عمومی نامیده می شود

واریانس انتخابیمیانگین حسابی مربعات انحراف مقادیر مشاهده شده ویژگی از میانگین است.

برای مقادیر مختلف x 1 ، x 2 ، x 3 ، ... ، x n از ویژگی جمعیت نمونه حجم n داریم:

اگر مقادیر ویژگی دارای فرکانس های مربوطه n 1 + n 2 + ... + n k = n باشد ، پس

انحراف استاندارد انتخاب شده (استاندارد)ریشه مربع واریانس نمونه نامیده می شود.

مثال:

جامعه نمونه با جدول توزیع مشخص می شود. واریانس نمونه را بیابید.

راه حل:

قضیه: واریانس برابر است با تفاوت میانگین مربعات مقادیر ویژگی و مربع میانگین کل.

مثال:

واریانس توزیع داده شده را بیابید.

راه حل:

8. برآورد آماری پارامترهای توزیع

اجازه دهید عموم مردم برای نمونه خاصی مورد بررسی قرار گیرند. در این حالت ، تنها می توان مقدار تقریبی پارامتر ناشناخته Q را بدست آورد که به عنوان برآورد آن عمل می کند. بدیهی است که برآوردها می توانند از یک نمونه به نمونه دیگر تغییر کنند.

ارزیابی آماریQ *پارامتر ناشناخته توزیع نظری تابع f نامیده می شود که به مقادیر مشاهده شده نمونه بستگی دارد. وظیفه برآورد آماری پارامترهای ناشناخته از یک نمونه ، ساختن چنین تابعی از داده های مشاهده آماری موجود است ، که دقیق ترین مقادیر تقریبی مقادیر واقعی ، ناشناخته برای محقق را برای این پارامترها ارائه می دهد.

برآوردهای آماری بسته به نحوه ارائه (تعداد یا فاصله) به نقطه و فاصله تقسیم می شوند.

یک نقطه برآورد آماری نامیده می شود.پارامتر Q توزیع نظری تعیین شده توسط یک مقدار پارامتر Q * = f (x 1 ، x 2 ، ... ، x n) ، جایی کهx 1 ، x 2 ، ... ، x n- نتایج مشاهدات تجربی ویژگی کمی X یک نمونه خاص.

چنین برآورد پارامترهای بدست آمده از نمونه های مختلف اغلب با یکدیگر متفاوت است. تفاوت مطلق / Q * -Q / نامیده می شود خطای نمونه برداری (برآورد)

برای اینکه ارزیابی های آماری نتایج قابل اطمینان در مورد پارامترهای مورد ارزیابی ارائه دهند ، لازم است که آنها بی طرفانه ، کارآمد و سازگار باشند.

برآورد نقطه، که انتظار ریاضی آن برابر (با پارامتر برآورد شده برابر نیست) نامیده می شود بی طرف (جانبدار)... M (Q *) = Q.

تفاوت M ( Q *) - Q نامیده می شود سوگیری یا سوگیری... برای برآوردهای بی طرفانه ، سوگیری 0 است.

تاثير گذار ارزیابی Q *، که برای اندازه نمونه معین n کوچکترین واریانس ممکن را دارد: Dدقیقه (n = const). برآورد م effectiveثر کوچکترین تغییر را در مقایسه با سایر برآوردهای بی طرفانه و سازگار دارد.

ثروتمنداین را آماری بنامید ارزیابی Q *، که برای nبه احتمال زیاد به پارامتر برآورد گرایش داردس ، یعنی با افزایش حجم نمونه n برآورد به احتمال زیاد به مقدار واقعی پارامتر متمایل استس

الزام سازگاری با قانون اعداد بزرگ سازگار است: هرچه اطلاعات اولیه بیشتر در مورد شی مورد مطالعه بیشتر باشد ، نتیجه دقیق تر است. اگر اندازه نمونه کوچک باشد ، برآورد نقطه ای پارامتر می تواند منجر به خطاهای جدی شود.

هر کدام نمونه (حجمن)می توان آن را به عنوان یک مجموعه سفارش شده تصور کردx 1 ، x 2 ، ... ، x nمتغیرهای تصادفی مستقل یکسان توزیع شده

نمونه نمونه برای اندازه های مختلف نمونه n از همان جمعیت عمومی متفاوت خواهد بود. یعنی میانگین نمونه را می توان به عنوان یک متغیر تصادفی در نظر گرفت ، به این معنی که می توان در مورد توزیع میانگین نمونه و ویژگی های عددی آن صحبت کرد.

میانگین نمونه تمام الزامات تحمیل شده برآوردهای آماری را برآورده می کند ، به عنوان مثال. برآورد بی طرفانه ، کارآمد و سازگار از میانگین کلی را ارائه می دهد.

می توان ثابت کرد که... بنابراین ، واریانس نمونه یک برآورد مغرضانه از واریانس عمومی است و به آن مقدار کم برآورد شده می دهد. یعنی با حجم نمونه کوچک ، خطای سیستماتیک ایجاد می کند. برای برآورد بی طرفانه و سازگار ، کافی است مقدار را در نظر بگیریم، که به آن واریانس تصحیح شده گفته می شود. یعنی

در عمل ، برای برآورد واریانس کلی ، از واریانس تصحیح شده در استفاده می شود n < 30. در موارد دیگر ( n> 30) انحراف از به سختی قابل توجه است بنابراین ، برای ارزش های بزرگ n خطای جبران ناچیز است.

همچنین می توانید ثابت کنید که فرکانس نسبی استn i / n برآورد بی طرفانه و سازگار از احتمال است P (X = x i ) عملکرد توزیع تجربی F * (x ) یک برآورد بی طرفانه و سازگار از عملکرد توزیع نظری است F (x) = P (X< x ).

مثال:

برآورد بی طرفانه میانگین و واریانس را از جدول نمونه بیابید.

x i
n i

راه حل:

اندازه نمونه n = 20.

برآورد بی طرفانه انتظار ریاضی میانگین نمونه است.

برای محاسبه برآورد واریانس بی طرفانه ، ابتدا واریانس نمونه را پیدا می کنیم:

حال بیایید برآورد بی طرفانه را بیابیم:

9. برآورد فاصله پارامترهای توزیع

فاصله یک برآورد آماری است که توسط دو مقدار عددی تعیین می شود ، انتهای فاصله مورد مطالعه.

عدد> 0 برای آن | Q - Q * |< ، صحت تخمین فاصله را مشخص می کند.

امینتماس گرفت فاصله ، که با احتمال معینمقدار ناشناخته پارامتر را پوشش می دهدس ... گسترش فاصله اطمینان به مجموعه همه مقادیر پارامترهای ممکنس تماس گرفت منطقه بحرانی... اگر ناحیه بحرانی فقط در یک طرف فاصله اطمینان قرار داشته باشد ، فاصله اطمینان نامیده می شود یک طرفه: چپ دستاگر منطقه بحرانی فقط در سمت چپ وجود داشته باشد ، و راست دستاگر فقط در سمت راست در غیر این صورت ، فاصله اطمینان نامیده می شود دو طرفه.

قابلیت اطمینان ، یا سطح اطمینان ، برآورد Q (با استفاده از Q *) احتمال عدم نابرابری زیر است: | Q - Q * |< .

بیشتر اوقات ، سطح اطمینان از قبل تعیین شده است (0.95 ؛ 0.99 ؛ 0.999) و الزام بر آن است که نزدیک به یک باشد.

احتمالنامیده می شوند احتمال خطا یا سطح اهمیت

بگذار | Q - Q * |< ، سپس... این بدان معناست که با احتمالمی توان استدلال کرد که مقدار واقعی پارامترس متعلق به فاصله است... هرچه انحراف کوچکتر باشد، برآورد دقیق تر است.

مرزها (انتهای) فاصله اطمینان نامیده می شود محدودیت های اطمینان یا محدودیت های بحرانی

مقادیر مرزهای فاصله اطمینان به قانون توزیع پارامتر بستگی دارد Q *.

میزان انحرافبرابر با نصف عرض فاصله اطمینان ، نامیده می شود دقت ارزیابی

روش های ایجاد فاصله اطمینان برای اولین بار توسط آمارشناس آمریکایی J. Neumann توسعه داده شد. دقت برآورد، احتمال اطمینان و اندازه نمونه n مربوط. بنابراین ، با دانستن مقادیر خاص دو کمیت ، همیشه می توانید سوم را محاسبه کنید.

یافتن فاصله اطمینان برای برآورد انتظار ریاضی از یک توزیع نرمال ، در صورت مشخص بودن انحراف استاندارد.

بگذارید نمونه از جمعیت عمومی و با رعایت قانون توزیع عادی تهیه شود. اجازه دهید انحراف استاندارد کلی مشخص شود، اما انتظار ریاضی توزیع نظری ناشناخته استآ ().

فرمول زیر معتبر است:

آن ها در مقدار انحراف معینمی توان با آن میانگین کلی ناشناخته متعلق به فاصله یافت... و بالعکس. از فرمول می توان دریافت که با افزایش اندازه نمونه و مقدار ثابت احتمال اطمینان ، مقدار- کاهش می یابد ، یعنی دقت برآورد افزایش می یابد. با افزایش قابلیت اطمینان (سطح اطمینان) ، ارزشافزایش می یابد ، یعنی دقت برآورد کاهش می یابد.

مثال:

در نتیجه آزمایشات ، مقادیر زیر -25 ، 34 ، -20 ، 10 ، 21 به دست آمد. مشخص است که آنها از قانون توزیع نرمال با انحراف استاندارد 2 پیروی می کنند. برآورد a * را برای انتظار ریاضی a. برای آن 90٪ فاصله اطمینان ایجاد کنید.

راه حل:

برآورد بی طرفانه را بیابید

سپس

فاصله اطمینان برای a: 4 - 1.47 است< آ< 4+ 1,47 или 2,53 < a < 5, 47

یافتن فاصله اطمینان برای تخمین انتظار ریاضی از یک توزیع نرمال در صورت ناشناخته بودن انحراف استاندارد.

بگذارید بدانیم که عموم مردم تابع قانون توزیع عادی هستند ، جایی که a و... دقت فاصله اطمینان با قابلیت اطمینان پوشش می دهدمقدار واقعی پارامتر a ، در این مورد با فرمول محاسبه می شود:

, جایی که n اندازه نمونه است ، , - ضریب دانش آموز (باید با توجه به مقادیر داده شده پیدا شود n و از جدول "نکات مهم توزیع دانش آموز").

مثال:

در نتیجه آزمایشات ، مقادیر زیر -35 ، -32 ، -26 ، -35 ، -30 ، -17 بدست آمد. مشخص است که آنها از قانون توزیع عادی پیروی می کنند. فاصله اطمینان برای انتظارات ریاضی را در سطح عمومی با سطح اطمینان 0.9 پیدا کنید.

راه حل:

برآورد بی طرفانه را بیابید.

پیدا کردن.

سپس

فاصله اطمینان می شود(-29.2 -5.62 ؛ -29.2 + 5.62) یا (-34.82 ؛ -23.58).

یافتن فاصله اطمینان برای واریانس و انحراف استاندارد توزیع عادی

بگذارید یک نمونه حجم تصادفی از برخی از جمعیت عمومی مقادیر مطابق قانون عادی گرفته شودn < 30 ، که برای آن واریانس های نمونه محاسبه می شود: مغرضانهو s 2 را تصحیح کرد... سپس ، برای پیدا کردن برآورد فاصله با قابلیت اطمینان معینبرای واریانس کلیدانحراف استاندارد کلیفرمول های زیر استفاده می شود.

یا,

ارزش ها- با استفاده از جدول مقادیر نقطه بحرانی پیدا کنیدتوزیع پیرسون

فاصله اطمینان برای واریانس از این نابرابریها با مربع قرار دادن تمام قسمتهای نابرابری بدست می آید.

مثال:

کیفیت 15 پیچ مورد بررسی قرار گرفت. با فرض اینکه خطا در ساخت آنها منوط به قانون توزیع عادی و انحراف استاندارد نمونه باشدبرابر با 5 میلی متر ، با قابلیت اطمینان تعیین کنیدفاصله اطمینان برای پارامتر ناشناخته

ما مرزهای فاصله را به عنوان یک نابرابری مضاعف نشان می دهیم:

انتهای فاصله اطمینان دو طرفه برای واریانس را می توان بدون انجام عملیات حسابی برای سطح اطمینان مشخص و اندازه نمونه با استفاده از جدول مناسب (مرزهای فاصله اطمینان برای واریانس بسته به تعداد درجه آزادی و قابلیت اطمینان) تعیین کرد. برای انجام این کار ، انتهای فاصله بدست آمده از جدول در واریانس تصحیح شده 2 ضرب می شود.

مثال:

بیایید مشکل قبلی را به روش دیگری حل کنیم.

راه حل:

بیایید واریانس تصحیح شده را پیدا کنیم:

با استفاده از جدول "مرزهای فاصله اطمینان برای واریانس ، بسته به تعداد درجه آزادی و قابلیت اطمینان" ، مرزهای فاصله اطمینان برای واریانس را درک= 14 و: حد پایین 0.513 و حد بالایی 2.354 است.

مرزهای به دست آمده را ضرب کنیدs 2 و ریشه را استخراج کنید (زیرا ما به فاصله اطمینان نه برای واریانس ، بلکه برای انحراف استاندارد نیاز داریم).

همانطور که در مثالها مشخص است ، مقدار فاصله اطمینان به روش ساخت آن بستگی دارد و نتایج مشابه اما متفاوتی را ارائه می دهد.

با نمونه های به اندازه کافی بزرگ (n> 30) مرزهای فاصله اطمینان برای انحراف استاندارد کلی را می توان با فرمول تعیین کرد: - تعدادی عدد ، که جدول بندی شده و در جدول مرجع مربوطه آورده شده است.

اگر 1- س<1, то формула имеет вид:

مثال:

اجازه دهید مشکل قبلی را به روش سوم حل کنیم.

راه حل:

قبلاً پیدا شده استs= 5,17. س(0.95 ؛ 15) = 0.46 - آن را از جدول پیدا می کنیم.

سپس: