ساخت یک سری تغییرات. انواع ردیف رتبه بندی داده ها مفهوم سری های متغیر. ردیف رتبه بندی شده

هنگام کار با داده ها، اغلب نیاز به یافتن این است که این یا آن شاخص از نظر ارزش چه جایگاهی را در لیست کل اشغال می کند. در آمار به این رتبه بندی می گویند. اکسل دارای ابزارهایی است که به کاربران اجازه می دهد تا به سرعت و به راحتی این روش را انجام دهند. بیایید نحوه استفاده از آنها را دریابیم.

توابع رتبه بندی

برای انجام رتبه بندی در اکسل توابع ویژه ای ارائه شده است. در نسخه های قدیمی برنامه، یک اپراتور برای حل این مشکل طراحی شده بود - RANK. برای اهداف سازگاری، آن را در داخل گذاشته شده است دسته جداگانهفرمول های موجود در نسخه های مدرن برنامه، اما در صورت امکان همچنان مطلوب است که با آنالوگ های جدیدتر کار کنید. اینها شامل عملگرهای آماری RANK.EQ و RANK.AVG است. در ادامه در مورد تفاوت ها و الگوریتم کار با آنها صحبت خواهیم کرد.

روش 1: تابع RANK.EQ

اپراتور RANK.RV داده ها و خروجی ها را به سلول مشخص شده پردازش می کند شماره سریالآرگومان داده شده از فهرست انبوه اگر چندین مقدار دارای سطح یکسانی باشند، اپراتور بالاترین مقدار را در لیست مقادیر نشان می دهد. به عنوان مثال، اگر دو مقدار دارای مقدار یکسانی باشند، به هر دوی آنها عدد دوم اختصاص داده می شود و مقدار بزرگ بعدی عدد چهارم را خواهد داشت. به هر حال، اپراتور RANK در نسخه های قدیمی اکسل همین کار را انجام می دهد، بنابراین این توابع را می توان یکسان در نظر گرفت.

سینتکس این عملگر به صورت زیر نوشته شده است:

آرگومان های "تعداد" و "مرجع" مورد نیاز هستند، در حالی که آرگومان های "ترتیب" اختیاری هستند. به عنوان آرگومان «عدد»، باید یک مرجع به سلولی وارد کنید که حاوی مقداری است که می خواهید شماره ترتیبی آن را پیدا کنید. آرگومان مرجع حاوی آدرس کل محدوده ای است که رتبه بندی می شود. آرگومان "order" می تواند دو مقدار داشته باشد - "0" و "1". در حالت اول ترتیب به ترتیب نزولی و در حالت دوم به ترتیب صعودی شمارش می شود. اگر این آرگومان مشخص نشده باشد، به طور خودکار توسط برنامه صفر در نظر گرفته می شود.

این فرمول را می توان به صورت دستی، در سلولی که می خواهید نتیجه پردازش نمایش داده شود، نوشت، اما برای بسیاری از کاربران تنظیم ورودی از طریق پنجره Function Wizard راحت تر است.


درس: Function Wizard در اکسل

روش 2: تابع RANK.AVG

دومین تابعی که عملیات رتبه بندی را در اکسل انجام می دهد RANK.AVG است. برخلاف توابع RANK و RANK.RW، اگر مقادیر چندین عنصر مطابقت داشته باشند، این عملگر سطح متوسط ​​را برمی‌گرداند. یعنی اگر دو مقدار با قدر مساوی باشند و بعد از مقدار 1 بیایند، به هر دو عدد 2.5 اختصاص داده می شود.

نحو RANK.AVG بسیار شبیه به دستور قبلی است. به نظر می رسد این است:

فرمول را می توان به صورت دستی یا از طریق Function Wizard وارد کرد. ما در مورد آخرین گزینه با جزئیات بیشتر صحبت خواهیم کرد.

  1. یک سلول روی برگه را برای نمایش نتیجه انتخاب می کنیم. مانند دفعه قبل، از طریق دکمه "Insert Function" به Function Wizard بروید.
  2. پس از باز کردن پنجره Function Wizard، نام RANK.AVG را در لیست دسته «Statistical» انتخاب کرده و بر روی دکمه «OK» کلیک کنید.
  3. پنجره آرگومان ها فعال می شود. آرگومان های این عملگر دقیقاً مشابه تابع RANK.EQ است:
    • شماره (آدرس سلول حاوی عنصری که سطح آن باید تعیین شود)؛
    • پیوند (مختصات محدوده ای که در آن رتبه بندی انجام می شود)؛
    • ترتیب (آرگهان اختیاری).

    وارد کردن داده ها در فیلدها دقیقاً به همان روشی که در عملگر قبلی انجام می شود انجام می شود. پس از انجام تمام تنظیمات، بر روی دکمه "OK" کلیک کنید.

  4. همانطور که مشاهده می کنید، پس از اقدامات انجام شده، نتیجه محاسبه در سلول مشخص شده در پاراگراف اول این دستورالعمل نمایش داده شد. مجموع خود نشان دهنده جایگاهی است که یک مقدار خاص در بین مقادیر دیگر در محدوده اشغال می کند. برخلاف نتیجه RANK.EQ، نتیجه عملگر RANK.AVG می تواند مقدار کسری داشته باشد.
  5. همانند فرمول قبلی، با تغییر ارجاعات از نسبی به مطلق و دسته انتخاب، می توانید کل محدوده داده ها را با استفاده از تکمیل خودکار رتبه بندی کنید. الگوریتم اقدامات دقیقاً مشابه است.

درس: سایر توابع آماری در مایکروسافت اکسل

درس: نحوه تکمیل خودکار در اکسل

همانطور که می بینید، دو تابع در اکسل برای تعیین رتبه بندی یک مقدار خاص در یک محدوده داده وجود دارد: RANK.EQ و RANK.AVG. برای نسخه های قدیمی برنامه از عملگر RANK استفاده می شود که در واقع آنالوگ کامل تابع RANK.RV است. تفاوت اصلی بین فرمول های RANK.EQ و RANK.AVG این است که اولی آنها بالاترین سطح را هنگام مطابقت مقادیر نشان می دهد و دومی میانگین را به عنوان کسری اعشاری نشان می دهد. این تنها تفاوت بین این اپراتورها است، اما باید در هنگام انتخاب بهترین عملکرد برای استفاده کاربر در نظر گرفته شود.

خوشحالیم که توانستیم به شما در حل مشکل کمک کنیم.

سوال خود را در نظرات بپرسید و ماهیت مشکل را با جزئیات شرح دهید. کارشناسان ما سعی خواهند کرد در اسرع وقت پاسخ دهند.

آیا این مقاله به شما کمک کرد؟

بیا یاد بگیریم رتبه بندی داده های عددی در اکسلبا استفاده از مرتب سازی استاندارد و همچنین تابع RANK و موارد خاص آن (RANK.RV و RANK.SR) که به مرتب سازی خودکار کمک می کند.

با سلام به همه، خوانندگان عزیز وبلاگ TutorExcel.Ru.

مشکل رتبه بندی داده های عددی به طور مداوم در کار با هدف یافتن بزرگترین یا کوچکترین مقادیر در یک لیست ایجاد می شود.
در اکسل، این کار به دو روش قابل انجام است: یک ابزار استاندارد مرتب سازیو با کمک کارکرد.

به عنوان مثال، بیایید یک جدول ساده با لیستی از مقادیر عددی در نظر بگیریم، که در آن داده ها را در آینده رتبه بندی خواهیم کرد:

مرتب سازی داده ها

بیایید با ساده ترین و مقرون به صرفه ترین گزینه - مرتب سازی شروع کنیم.

ما قبلاً تا حدی تجزیه و تحلیل کرده ایم که چگونه داده ها را می توان با استفاده از فیلترها و مرتب سازی ساختار داد.
به طور خلاصه، برای مرتب سازی، باید یک محدوده با داده را انتخاب کنید و در نوار برگه انتخاب کنید خانه -> ویرایش -> مرتب سازی و فیلتر کردن، و سپس مشخص کنید که با چه معیاری می خواهید مرتب کنید.

در این صورت ما انتخاب می کنیم مرتب سازی نزولی، که در آن مقادیر از بزرگترین به کوچکترین مرتب شده اند:


نقطه ضعف این روش تغییر در ساختار داده‌های منبع است، زیرا در فرآیند مرتب‌سازی داده‌ها، ردیف‌ها و ستون‌ها را می‌توان تعویض کرد که در برخی موارد ناخوشایند یا غیرممکن است.
همچنین عدم وجود قابلیت مرتب سازی خودکار را می توان به معایب مهم این گزینه نسبت داد. بنابراین، هر بار که داده ها تغییر می کنند، مرتب سازی باید دوباره انجام شود.

به عنوان راه حل این مشکل، راه دیگری را برای رتبه بندی در نظر می گیریم که البته می توان آن را جدا از راه حل این مشکل در نظر گرفت.

رتبه بندی داده ها

در صورت عدم امکان تغییر ساختار سند، می توانیم یک ردیف داده اضافی ایجاد کنیم که شامل شماره سریال داده های اصلی خواهد بود.
تابع به ما کمک می کند تا این شماره های سریال را بدست آوریم. رتبه(همچنین RANK.RVو RANK.SR).

تابع RANK در اکسل

نحو و شرح تابع:

  • عدد(برهان اجباری) - عددی که رتبه برای آن محاسبه می شود.
  • ارتباط دادن(آگومان مورد نیاز) - آرایه یا ارجاع به آرایه ای از اعداد.
  • سفارش(استدلال اختیاری) - روش سفارش. اگر آرگومان 0 باشد یا مشخص نشده باشد، مقدار 1 به حداکثر عنصر در لیست اختصاص داده می شود (به طور نسبی، مرتب سازی به ترتیب نزولی)، در غیر این صورت مقدار 1 به حداقل عنصر (مرتب شده به ترتیب صعودی) اختصاص می یابد.

این ویژگی در تمام نسخه های اکسل موجود است، اما از اکسل 2010، جایگزین آن شده است RANK.RVو RANK.SR، آ رتبهبرای سازگاری با Excel 2007 باقی مانده است، بیایید نگاهی دقیق تر به نحوه کار آنها بیندازیم.

توابع RANK.EQ و RANK.AVG در اکسل

نحو و شرح توابع:

RANK.EQ (شماره؛ پیوند؛)
رتبه یک عدد را در لیست اعداد برمی‌گرداند: ترتیب آن نسبت به سایر اعداد موجود در لیست. اگر چندین مقدار دارای رتبه یکسانی باشند، بالاترین رتبه از آن مجموعه مقادیر برمی گردد.

هر سه تابع آرگومان های یکسانی دارند، یعنی. اساساً آنها تقریباً یکسان هستند ، تفاوت های کوچکی در جزئیات وجود دارد.
با استفاده از جدول منبع به عنوان مثال، بیایید ببینیم که هر یک از توابع چگونه با داده ها کار می کنند:


همانطور که می بینیم، تفاوت فقط در نوع رتبه بندی عناصر داده منطبق است.

در صورت RANK.RVعناصر مساوی بالاترین رتبه را به خود اختصاص می دهند.
در مثال ما، دسته ها لپ تاپ هاو مولتی اجاقمربوط به همان مقدار عنصر - 710 است که به ترتیب 3 به ترتیب نزولی است، به هر دو مقدار بالاترین رتبه - 3 اختصاص داده می شود.
برای RANK.SRبرای مقادیر یکسان، میانگین رتبه آنها تنظیم می شود، یعنی. میانگین بین 3 تا 4 شماره سریال 3.5 است.

اینجاست که تفاوت بین آنها به پایان می رسد، بنابراین بسته به وظایف خود، می توانید از یک یا آن تابع استفاده کنید.
اگر نیاز دارید که مقادیر را به ترتیب صعودی مرتب کنید، به عنوان یک آرگومان سفارشباید مقدار 1 را مشخص کنید:

مرتب سازی خودکار

بیایید کار را کمی پیچیده کنیم و تصور کنیم که در آینده باید یک جدول مرتب شده ایجاد کنیم که با تغییر داده های جدول منبع به طور خودکار به روز شود.

به عنوان مثال، این کار را می توان با استفاده از تابع VLOOKUP یا ترکیبی از INDEX و MATCH انجام داد، اما اگر مقادیر یکسانی در لیست وجود داشته باشد، نمی توانیم داده ها را به درستی جمع آوری کنیم و یک خطا دریافت کنیم:


در این صورت می توانید استفاده کنید ترفند سادهبه عنوان یک ترفند کوچک
بیایید به هر مقدار از جدول مبدا اعداد تصادفی غیرمطابق نزدیک به صفر را اضافه کنیم، به عنوان مثال، برای این منظور من از توابع ROW یا COLUMN استفاده می کنم، تقسیم بر یک مقدار آگاهانه بزرگ.

این مرحله به ما امکان می دهد تا اعداد مختلفی را در داده های اصلی دریافت کنیم، از تصادف رتبه ها و خطاها هنگام بالا کشیدن داده ها جلوگیری کنیم:

اکنون برای همه عناصر جدول (حتی آنهایی که در ابتدا مطابقت دارند) رتبه فردی آنها تعریف شده است که با بقیه متفاوت است، بنابراین می توان از خطا در رتبه بندی خودکار داده ها جلوگیری کرد.

دانلود فایل نمونه.

با تشکر از توجه شما!
اگر سوالی دارید - در نظرات بنویسید.

موفق باشید و به زودی شما را در صفحات وبلاگ TutorExcel.Ru می بینیم!

برای رتبه بندی داده ها در اکسل از توابع آماری RANK، RANK.RV، RANK.AVG استفاده می شود. همه آنها تعداد یک عدد را در یک لیست رتبه بندی شده از مقادیر عددی برمی گردانند. بیایید نگاهی دقیق تر به نحو، مثال ها بیندازیم.

مثال تابع RANK در اکسل

این تابع هنگام رتبه بندی در لیستی از اعداد استفاده می شود. یعنی به شما امکان می دهد ارزش یک عدد را نسبت به مقادیر عددی دیگر دریابید. اگر لیست را به ترتیب صعودی مرتب کنید، تابع موقعیت عدد را برمی گرداند. به عنوان مثال، در آرایه اعداد (30;2;26)، عدد 2 دارای رتبه 1 خواهد بود. 26 -2; 30-3 (به عنوان بالاترین ارزشدر لیست).

نحو توابع:

  1. عدد. که می خواهید تعداد آن را در رتبه بندی تعیین کنید.
  2. ارتباط دادن. آرایه ای از اعداد یا محدوده ای از سلول ها با مقادیر عددی. اگر فقط اعداد را به عنوان آرگومان مشخص کنید، تابع یک خطا برمی گرداند. به مقادیر غیر عددی عددی اختصاص داده نمی شود.
  3. سفارش. روشی برای مرتب کردن اعداد در یک لیست. گزینه ها: آرگومان "0" یا حذف شده است - مقدار 1 به حداکثر تعداد در لیست اختصاص داده می شود (مثل اینکه لیست به ترتیب نزولی مرتب شده است). آرگومان هر عدد غیر صفر است - رتبه بندی شماره 1 به کوچکترین عدد در لیست اختصاص داده می شود (مثل اینکه لیست به ترتیب صعودی مرتب شده است).

بیایید رتبه بندی اعداد در لیست را بدون تکرار تعریف کنیم:

آرگومان تعیین کننده نحوه ترتیب اعداد "0" است. بنابراین، در این تابع، اعداد به مقادیر از بزرگترین به کوچکترین اختصاص داده شد. به حداکثر عدد 87 عدد 1 اختصاص داده شده است.

ستون سوم فرمول را با رتبه صعودی نشان می دهد.

بیایید تعداد مقادیر را در لیستی که مقادیر تکراری وجود دارد تعیین کنیم.

اعداد تکراری با رنگ زرد مشخص شده اند. همه آنها یک شماره دارند. به عنوان مثال، شماره 7 در ستون دوم به عدد 9 اختصاص داده شده است (هم در ردیف دوم و هم در ردیف نهم). در ستون سوم - 3. اما هیچ یک از اعداد ستون دوم 10 نخواهد داشت و در سوم - 4.

برای اینکه رتبه ها تکرار نشوند (گاهی اوقات این کار باعث می شود کاربر نتواند کار را حل کند) از فرمول زیر استفاده می شود:

شما می توانید محدودیت هایی را برای عملکرد عملکرد تعیین کنید. به عنوان مثال، شما فقط باید مقادیر را از 0 تا 30 رتبه بندی کنید. برای حل مشکل، تابع IF (=IF(A2) را اعمال کنید.

مقادیری که با شرایط مشخص شده مطابقت دارند با رنگ خاکستری برجسته می شوند. برای اعداد بزرگتر از 30، یک رشته خالی نمایش داده می شود.

مثال تابع RANK.EQ در اکسل

نسخه های اکسل از سال 2010 تابع RANK.EQ را معرفی کرده اند. این یک آنالوگ مطلق از عملکرد قبلی است. نحو یکسان است. حروف "PB" در نام نشان می دهد که اگر فرمول مقادیر یکسانی پیدا کند، تابع بالاترین عدد رتبه بندی (یعنی اولین عنصر موجود در لیست برابرها) را برمی گرداند.

همانطور که از مثال می بینید، عملکرد داده شدهبا اعداد تکراری در یک لیست دقیقاً مانند یک فرمول معمولی رفتار می کند. اگر لازم است از تکرار رتبه ها جلوگیری شود، از فرمول دیگری استفاده می کنیم (به بالا مراجعه کنید).

مثال تابع RANK.AVG در اکسل

اعداد یک مقدار عددی را در لیست (عدد ترتیبی نسبت به مقادیر دیگر) برمی‌گرداند. یعنی همان وظیفه را انجام می دهد. تنها در صورت یافتن مقادیر یکسان، میانگین را برمی‌گرداند.

در اینجا خروجی تابع است:

فرمول در ستون نزولی این است: =RANK.AVG(A2,$A$2:$A$9,0). بنابراین، تابع مقدار 87 را یک عدد متوسط ​​1.5 اختصاص داد.

فرض کنید در لیستی از اعداد سه مقدار تکراری وجود دارد (با رنگ نارنجی مشخص شده است).

این تابع به هر یک از آنها رتبه 5 اختصاص می دهد که میانگین 4، 5 و 6 است.

بیایید کار دو تابع را با هم مقایسه کنیم:

به یاد داشته باشید که این دو تابع فقط در اکسل 2010 و بالاتر کار می کنند. در نسخه های قبلی می توانید از فرمول آرایه برای این منظور استفاده کنید.

نمونه هایی از تابع رتبه بندی RANK را در اکسل دانلود کنید.

بنابراین، تمام مثال‌هایی که در بالا توضیح داده شد به شما امکان می‌دهند کار رتبه‌بندی داده‌ها و رتبه‌بندی مقادیر را بدون مرتب‌سازی خودکار کنید.

مفهوم خلاصه، گروه بندی، طبقه بندی

خلاصه- سیستم سازی و جمع بندی: گزارش آب و هوا، خلاصه از زمینه ها. خلاصه اجازه تجزیه و تحلیل دقیق اطلاعات را نمی دهد. هر خلاصه ای باید بر اساس گروه بندی داده ها باشد. ابتدا گروه بندی، سپس داده ها خلاصه می شود.

گروه بندی- تقسیم جمعیت ها به تعدادی گروه بر اساس شاخص ترین ویژگی ها.

بین گروه بندی کیفی و کمی تمایز قائل شوید. کیفیت- اسنادی کمی- تغییر. به نوبه خود، متغیر به ساختاری و تحلیلی تقسیم می شود . ساختاریگروه بندی شامل محاسبه نسبت هر گروه است. مثال: در یک بنگاه اقتصادی 80% کارگر، 20% کارمند، 5% مدیر، 3% کارمند، 12% متخصص. هدف تحلیلیگروه بندی - برای شناسایی رابطه بین علائم: سابقه کار و درآمد متوسط، تجربه و خروجی، و دیگران.

هنگام گروه بندی، باید:

انجام یک تحلیل جامع از ماهیت پدیده مورد مطالعه؛

شناسایی یک ویژگی گروه بندی (یک یا چند)؛

مرزهای گروه ها را به گونه ای تنظیم کنید که گروه ها به طور قابل توجهی با یکدیگر تفاوت داشته باشند و عناصر همگن در هر گروه ترکیب شوند.

با توجه به میزان پیچیدگی، گروه بندی ها می توانند ساده و ترکیبی (با توجه به ویژگی ها) باشند.

توسط اطلاعات پس زمینهتمایز بین گروه های اولیه و ثانویه، اولیهبر اساس داده های مشاهدات اولیه انجام شده است، ثانویاز داده های گروه بندی اولیه استفاده می کند.

تعداد گروه ها مشخص می شود طبق فرمول استرجس:

جایی که n- تعداد گروه ها، ن- جمعیت عمومی.

اگر از فواصل مساوی استفاده شود، پس مقدار فاصلهبرابر است با .

فواصلممکن است برابر باشد یا نباشد. دومی ها به نوبه خود به مواردی تقسیم می شوند که مطابق قانون پیشرفت حسابی یا هندسی تغییر می کنند. بازه های اول و آخر می توانند باز یا بسته باشند. فواصل بسته شامل یا شامل مرزهای بازه ای نمی شود.

اگر فواصل بسته باشند، و چیزی در مورد گنجاندن کرانهای بالایی گفته نشده باشد، فرض می کنیم که کرانهای بالایی گنجانده شده است.

اگر فواصل باز باشد، ما توسط آخرین بازه هدایت می شویم.

یک علامت در این فواصل را می توان به طور مجزا و پیوسته اندازه گیری کرد (یعنی تقسیم). با علامت پیوسته، مرزها 1-10، 10-20، 20-30 بسته می شوند. اگر ویژگی به طور گسسته تغییر کند، می توان از ورودی زیر استفاده کرد: 1 - 10، 11 - 20، 21 - 30.

اگر فواصل باز باشد، مقدار آخرین بازه برابر با قبلی است و مقدار اولی - به دومی.

طبقه بندیگروه بندی بر اساس کیفیت این نسبتاً پایدار، استاندارد شده و توسط مقامات آمار دولتی تأیید شده است.


3.2. رتبه های توزیع: انواع و ویژگی های اصلی

زیر نزدیک توزیعبه مجموعه ای از داده ها اشاره دارد که هر پدیده اجتماعی-اقتصادی را بر یک مبنای مشخص می کند. آی تی ساده ترین شکلگروه بندی بر دو مبنای

سری های توزیع به کیفی و کمی، رتبه بندی شده و رتبه بندی نشده، گروه بندی و غیر گروه بندی شده، با گسسته و توزیع پیوستهامضاء کردن.

نمونه‌ای از مجموعه‌های حقوق و دستمزد غیر گروه‌بندی‌شده و رتبه‌بندی نشده، بیانیه‌ای است دستمزد. در عین حال، لیست کارکنان را می توان بر اساس حروف الفبا یا بر اساس شماره پرسنل رتبه بندی کرد. نمونه ای از سری های رتبه بندی شده لیست تیم ها، رتبه بندی بازیکنان تنیس است.

ردیف رتبه بندی شدهتوزیع ها - مجموعه ای از داده ها که به ترتیب نزولی یا صعودی یک ویژگی مرتب شده اند.

برای سری های رتبه بندی شده گروه بندی شده، اختصاص دهید ویژگی های زیر: نوع، فرکانس یا فرکانس، تجمع و چگالی توزیع.

گونه()میانگین مقدار بازه مشخصه است. زیرا هنگام ایجاد یک گروه بندی، باید از اصل توزیع یکنواخت یک ویژگی در هر بازه پیروی کرد، سپس این متغیر را می توان به صورت نصف مجموع مرزهای فواصل محاسبه کرد.

فرکانس() نشان می دهد که چند بار مقدار مشخصه داده شده رخ می دهد. عبارت فرکانس نسبی است فرکانس(.) ، یعنی سهم، وزن مخصوص از مجموع فرکانس ها.

تجمع کنید() - فرکانس یا فرکانس تجمعی، محاسبه تجمعی. حجم، هزینه ها، درآمدها به صورت تجمعی محاسبه می شوند، یعنی. نتایج فعالیت

میز 1

گروه بندی مؤسسات اعتباری عامل
توسط ثبت شده سرمایه مجاز

در سال 2008 در روسیه

گام اول مطالعه آماریتغییرات در حال ساخت هستند سری تغییرات - توزیع منظم واحدهای جمعیت با توجه به افزایش (بیشتر) یا کاهش (کمتر) مقادیر ویژگی و شمارش تعداد واحدها با یک یا مقدار دیگری از ویژگی.

سه شکل از یک سری تغییرات وجود دارد: یک سری محدوده، یک سری گسسته، یک سری فاصله. سری تغییرات اغلب نامیده می شود نزدیک توزیعاین اصطلاح در بررسی تنوع در صفات کمی و غیر کمی استفاده می شود. سری توزیع است گروه بندی ساختاری(به فصل 6 مراجعه کنید).

ردیف رتبه بندی شده -این فهرستی از واحدهای فردی جمعیت به ترتیب صعودی (نزولی) صفت مورد مطالعه است.

جدول 1 می تواند به عنوان نمونه ای از یک سری رتبه بندی شده باشد. 5.5.

جدول 5.5

بانک های بزرگ سن پترزبورگ، رتبه بندی شده بر اساس اندازهسرمایه خود از تاریخ 96/07/01

اگر تعداد واحدهای جمعیت به اندازه کافی زیاد باشد، سری رتبه بندی شده دست و پا گیر می شود و ساخت آن، حتی با کمک کامپیوتر، طول می کشد. مدت زمان طولانی. در چنین مواردی، سری تغییرات با گروه بندی واحدهای جمعیت بر اساس مقادیر صفت مورد مطالعه ساخته می شود.

اگر مشخصه تعداد کمی از مقادیر را بگیرد، یک سری تغییرات گسسته ساخته می شود. نمونه ای از این سری ها توزیع مسابقات فوتبال بر اساس تعداد گل های زده شده است (جدول 5.1). سری تغییرات گسسته -این یک جدول متشکل از دو ردیف یا یک نمودار است: مقادیر خاص یک ویژگی متغیر ایکسمنو تعداد واحدهای جمعیت با مقدار داده شده ویژگی فیفرکانس ها (f حرف ابتدایی کلمه انگلیسی فرکانس است).

تعیین تعداد گروه ها

تعداد گروه ها در یک سری تغییرات گسسته با تعداد مقادیر واقعی موجود مشخصه متغیر تعیین می شود. اگر این صفت بتواند مقادیر گسسته ای داشته باشد، اما تعداد آنها بسیار زیاد باشد (به عنوان مثال، تعداد دام ها در اول ژانویه سال در شرکت های مختلف کشاورزی می تواند از صفر تا ده ها هزار راس باشد)، آنگاه یک سری تغییرات بازه ای است. ساخته شده. یک سری متغیر بازه‌ای نیز برای مطالعه ویژگی‌هایی ساخته شده است که می‌توانند هر مقدار، اعم از صحیح و کسری، را در ناحیه وجود خود بگیرند. اینها به عنوان مثال، سودآوری محصولات فروخته شده، هزینه یک واحد تولید، درآمد به ازای هر 1 نفر از ساکنان شهر، سهم افراد با آموزش عالیدر میان جمعیت مناطق مختلف و به طور کلی، همه ویژگی های ثانویه، که مقادیر آنها با تقسیم ارزش یک ویژگی اصلی بر ارزش دیگری محاسبه می شود (به فصل 3 مراجعه کنید).

سری تغییرات فاصلهجدولی است (شامل دو ستون (یا خط) - فواصل صفت که تنوع آن در حال مطالعه است و تعداد واحدهای جمعیتی که در این بازه (فرکانس ها) قرار می گیرند یا نسبت این تعداد از کل جمعیت (فرکانس ها).

هنگام ساخت یک سری تغییرات بازه ای، لازم است تعداد بهینه گروه ها (فاصله کاراکترها) را انتخاب کنید و طول بازه را تعیین کنید. از آنجایی که هنگام تجزیه و تحلیل یک سری متغیر، فرکانس ها در بازه های مختلف مقایسه می شوند، لازم است مقدار بازه ثابت باشد. تعداد بهینه گروه ها به گونه ای انتخاب می شود که تنوع مقادیر صفت در کل به اندازه کافی منعکس شود و در عین حال نظم توزیع، شکل آن با نوسانات فرکانس تصادفی تحریف نشود. اگر گروه‌ها خیلی کم باشند، هیچ الگوی تنوع وجود نخواهد داشت. اگر گروه‌ها خیلی زیاد باشند، جهش‌های فرکانس تصادفی شکل توزیع را مخدوش می‌کند.

اغلب، تعداد گروه‌ها در سری تغییرات با رعایت فرمول توصیه شده توسط آماردان آمریکایی استرجس تعیین می‌شود. (استرجس):

جایی که ک- تعداد گروه ها؛ n- اندازه جمعیت

این فرمول نشان می دهد که تعداد گروه ها تابعی از مقدار داده است.

فرض کنید لازم است یک سری توزیع متغیر در منطقه با توجه به عملکرد محصولات غلات برای یک سال خاص ایجاد شود. تعداد شرکت های کشاورزی با محصولات غلات 143 بود. کمترین مقدار عملکرد 10.7 سانتی‌گراد در هکتار و بیشترین آن 53.1 سانتی‌گراد در هکتار است. ما داریم:

از آنجایی که تعداد گروه ها عدد صحیح است، توصیه می شود 8 یا 9 گروه بسازید.

تعیین اندازه فاصله

با دانستن تعداد گروه ها، مقدار فاصله را محاسبه کنید:

در مثال ما، مقدار بازه:

الف) با 8 گروه

ب) با 9 گروه

برای ساخت یک سری و تجزیه و تحلیل تغییرات، در صورت امکان، مقادیر گرد شده اندازه فاصله و مرزهای آن بسیار بهتر است. بنابراین بهترین راه حل ساخت یک سری تغییرات با 9 گروه با فاصله 5 c/ha خواهد بود. این سری تغییرات در جدول آورده شده است. 5.6، و نمایش گرافیکی آن در شکل. 5.1.

مرزهای بازه ها را می توان به روش های مختلفی مشخص کرد: مرز بالایی بازه قبلی، مرز پایینی فاصله بعدی را تکرار می کند، همانطور که در جدول نشان داده شده است. 5.6 یا تکرار نمی شود.

در مورد دوم، فاصله دوم به عنوان 15.1-20، سوم به عنوان 20.1-25، و غیره تعیین می شود، یعنی. فرض بر این است که تمام مقادیر بازدهی لزوماً به یک دهم گرد می شوند. علاوه بر این، یک عارضه نامطلوب با وسط فاصله 15.1-20 ایجاد می شود، که، به طور دقیق، در حال حاضر برابر با 17.5 نیست، بلکه 17.55 خواهد بود. بر این اساس، هنگام جایگزینی فاصله گرد شده 40-60 با 40.1-6.0، به جای مقدار گرد شده 50 وسط آن، 50.5 به دست می آید.بنابراین، ترجیح داده می شود که فواصل را با یک حاشیه گرد تکراری رها کنیم و موافقت کنیم که واحدهای جمعیتی که دارای یک مقدار مشخصه برابر با مرز فاصله هستند، در بازه‌ای که برای اولین بار این مقدار دقیق گزارش می‌شود، لحاظ می‌شوند. به این ترتیب مزرعه ای با عملکرد 15 سنت در هکتار در گروه اول، ارزش 20 سنت در هکتار در گروه دوم و غیره قرار می گیرد.

برنج. 5.1. توزیع مزارع بر اساس عملکرد

جدول 5.6

توزیع مزارع در منطقه بر اساس عملکرد غلات

گروه های مزارع بر اساس عملکرد،

c/ha ایکسj

تعداد مزارع

وسط فاصله

c/ha ایکسj"

فرکانس انباشته شده f'j

نمایش گرافیکی سری تغییرات

کمک قابل توجهی در تجزیه و تحلیل سری تغییرات و ویژگی های آن توسط یک نمایش گرافیکی ارائه می شود. سری بازه ایبا یک نمودار میله ای نشان داده می شود که در آن پایه میله های واقع در محور آبسیسا فواصل مقادیر ویژگی متغیر است و ارتفاع میله ها فرکانس های مربوط به مقیاس در امتداد محور y است. . یک نمایش گرافیکی از توزیع مزارع در منطقه از نظر عملکرد غلات در شکل 1 نشان داده شده است. 5.1. این نوع نمودار اغلب نامیده می شود هیستوگرام(از کلمه یونانی "histos" - بافت، ساختار).

داده های جدول 5.5 و شکل. 5.1 شکل توزیع مشخصه بسیاری از علائم را نشان می دهد: مقادیر میانگین فواصل علامت رایج تر است، کمتر - شدید. مقادیر کوچک و بزرگ ویژگی شکل این توزیع به قانون در نظر گرفته شده در درس آمار ریاضی نزدیک است توزیع نرمال. ریاضیدان بزرگ روسی A. M. Lyapunov (1857 - 1918) ثابت کرد که توزیع نرمال زمانی تشکیل می شود که متغیر متغیر تحت تأثیر تعداد زیادی از عوامل قرار گیرد که هیچ یک از آنها تأثیر غالب ندارند. ترکیب تصادفی بسیاری از عوامل تقریباً مساوی که بر تغییرات عملکرد محصولات غلات، اعم از طبیعی و کشاورزی، اقتصادی تأثیر می‌گذارند، توزیعی از مزارع منطقه را بر اساس عملکرد نزدیک به قانون توزیع عادی ایجاد می‌کند.

اگر یک سری تغییرات گسسته وجود داشته باشد یا از نقاط میانی فواصل استفاده شود، نمایش گرافیکی چنین سری تغییراتی نامیده می شود. چند ضلعی(از کلمات یونانی - چند ضلعی). هر یک از شما می توانید به راحتی این نمودار را با اتصال نقاط با مختصات با خطوط مستقیم بسازید ایکس،و /.

نسبت ارتفاع یک چند ضلعی یا نمودار به قاعده آن در نسبت تقریباً 5:8 توصیه می شود.

مفهوم فرکانس

اگر در جدول 5.6 تعداد مزارع با سطح خاصی از بهره وری را به صورت درصدی از کل بیان کنید و تعداد کل مزارع (143) را 100% در نظر بگیرید، سپس متوسط ​​عملکرد را می توان به صورت زیر محاسبه کرد:

جایی که w- فرکانس دسته هفتم سری تغییرات؛

توزیع تجمعی

شکل تبدیل شده سری تغییرات است تعدادی از فرکانس های انباشته شده،در جدول آورده شده است 5.6، ستون 5. این مجموعه ای از مقادیر برای تعداد واحدهای جمعیت با کمتر از و برابر با مرز پایینی مقادیر فاصله مربوط به ویژگی است. چنین سریالی نامیده می شود انباشته.می توانید یک توزیع تجمعی "نه کمتر از" یا "بیشتر از" بسازید. در حالت اول، نمودار توزیع تجمعی نامیده می شود انباشته کردن،در دوم - دادن(شکل 5.2).

چگالی، توزیع

اگر باید با یک سری متغیر با فواصل نامساوی برخورد کنید، برای مقایسه باید فرکانس یا فرکانس را به واحد بازه بیاورید. نسبت حاصل نامیده می شود چگالی توزیع:

چگالی توزیع هم برای محاسبه شاخص های تعمیم دهنده و هم برای نمایش گرافیکی سری های تغییرات با فواصل نامساوی استفاده می شود.

برنج. 5.2. Ogiva و توزیع عملکرد تجمعی

5.7. ویژگی های ساختاری متغیر ردیف

میانه توزیع

هنگام مطالعه تنوع، از چنین ویژگی هایی از سری تغییرات استفاده می شود که ساختار، ساختار آن را به طور کمی توصیف می کند. چنین است، برای مثال، میانه-مقدار ویژگی متغیر که جمعیت را به دو قسمت مساوی تقسیم می کند ~ با مقادیر ویژگی کمتر از میانه و با مقادیر ویژگی بزرگتر از میانه (سومین بانک از پنج در جدول 5.5، یعنی 196 میلیارد روبل).

در مثال جدول. 5.5 تفاوت اساسی بین میانه و میانگین را نشان می دهد. میانه به مقادیر ویژگی در لبه های سری رتبه بندی شده بستگی ندارد. حتی اگر سرمایه بزرگترین بانک در سن پترزبورگ ده برابر بزرگتر بود، ارزش متوسط ​​تغییر نمی کرد. بنابراین، میانه اغلب به عنوان یک شاخص قابل اعتمادتر از مقدار معمولی یک ویژگی نسبت به میانگین حسابی استفاده می شود، اگر سری مقادیر ناهمگن باشد، شامل انحرافات شدید از میانگین است. AT این ردیفمیانگین ارزش سهام، معادل 269 میلیارد روبل، تحت تأثیر قوی تشکیل شد بهترین گزینه ها. 80 درصد بانک ها کمتر از متوسط ​​سرمایه دارند و تنها 20 درصد بیشتر. بعید است که چنین میانگینی را بتوان یک مقدار معمولی در نظر گرفت. با تعداد واحدهای جمعیتی زوج، میانه به عنوان میانگین حسابی دو گزینه مرکزی، به عنوان مثال، با ده مقدار ویژگی، میانگین مقادیر پنجم و ششم در سری رتبه‌بندی شده در نظر گرفته می‌شود.

در یک سری تغییرات بازه ای، از فرمول (5.14) برای یافتن میانه استفاده می شود.

جایی که من میانه است.

x 0 -حد پایین بازه ای که میانه در آن قرار دارد.

f M e-1 - فرکانس انباشته شده در فاصله قبل از میانه.

f Me- فرکانس در بازه میانه؛

من- مقدار فاصله؛

ک - تعداد گروه ها

روی میز. 5.6 میانه میانگین 143 مقدار است، یعنی. هفتاد و دومین از ابتدای سری ارزش بهره وری. همانطور که از تعداد فرکانس های انباشته شده مشخص است، در بازه چهارم قرار دارد. سپس

با تعداد فرد واحدهای جمعیت، عدد میانه، همانطور که می بینیم، برابر است با نه , همانطور که در فرمول (5.14)، a ، اما این تمایز قابل توجه نیست و معمولا در عمل نادیده گرفته می شود.

در یک سری تغییرات گسسته، میانه باید مقدار ویژگی در گروهی که در آن فرکانس انباشته شده در نظر گرفته شود.

بیش از نیمی از جمعیت به عنوان مثال، برای داده های جدول. 5.1 میانگین تعداد گل های زده شده در هر بازی 2 گل خواهد بود.

چارک های توزیع

به طور مشابه با میانه، مقادیر مشخصه محاسبه می شود و جمعیت را به چهار قسمت مساوی از نظر تعداد واحدها تقسیم می کند. این مقادیر نامیده می شوند یک چهارمو با حرف بزرگ لاتین نشان داده می شوند سبا نشان شماره چارک امضا شده. واضح است که س 2 با من مطابقت دارد. برای چارک اول و سوم، فرمول و محاسبه را مطابق جدول ارائه می دهیم. 5.6.

زیرا س 2 = Me = 29.5 c/ha، مشاهده می شود که تفاوت بین چارک اول و میانه کمتر از چارک میانه و سوم است. این واقعیت نشان دهنده وجود مقداری عدم تقارن در ناحیه میانی توزیع است که در شکل 1 نیز قابل توجه است. 5.1.

مقادیر مشخصه ای که سری را به پنج قسمت مساوی تقسیم می کنند نامیده می شوند پنجک هابه ده قسمت دهک ها،صد قسمت صدک هااز آنجایی که این ویژگی ها تنها زمانی مورد استفاده قرار می گیرند که نیاز به مطالعه دقیق ساختار سری های متغیر باشد، فرمول و محاسبه آنها را ارائه نمی دهیم.

حالت توزیع

بدون شک چنین ارزشی از یک صفت که در سری های مورد مطالعه، در مجموع اغلب رخ می دهد، از اهمیت بالایی برخوردار است. این مقدار نامیده می شود روشو Mo را نشان می دهند. AT سری گسستهحالت بدون محاسبه به عنوان مقدار ویژگی با بالاترین فرکانس تعیین می شود. به عنوان مثال، طبق جدول. 5.1 اغلب 2 گل در یک مسابقه فوتبال به ثمر رسید - 71 بار. حالت شماره 2 است. معمولاً ردیف هایی با یک مقدار مودال ویژگی وجود دارد. اگر دو یا چند مقدار برابر (و حتی چندین مقدار متفاوت، اما بزرگتر از همسایه) یک ویژگی در سری تغییرات وجود داشته باشد، به ترتیب دو وجهی ("شتر مانند") یا چندوجهی در نظر گرفته می شود. این نشان دهنده ناهمگونی مجموعه است، که احتمالاً نشان دهنده مجموعه ای از چندین مجموعه با حالت های مختلف است.

بنابراین در انبوه گردشگرانی که از کشورهای مختلف آمده بودند، به جای اینکه یکی در میان آنها غالب باشد ساکنان محلی لباس های مدشما می توانید ترکیبی از "مدهای" مختلف را پیدا کنید که توسط مردمان مختلف جهان پذیرفته شده است.

در یک سری تغییرات بازه ای، به ویژه با تغییرات مداوم یک ویژگی، به طور دقیق، هر مقدار از ویژگی فقط یک بار رخ می دهد. بازه مودال بازه ای با بالاترین فرکانس است.در این بازه، مقدار شرطی صفت پیدا می شود که در نزدیکی آن چگالی توزیع، یعنی. تعداد واحدهای جمعیت در واحد اندازه گیری یک ویژگی متغیر به حداکثر می رسد. این یک مقدار شرطی است و در نظر گرفته می شود مد نقطهمنطقی است که فرض کنیم چنین حالت نقطه ای نزدیک تر به مرزهای بازه قرار دارد، که فراتر از آن فرکانس در بازه همسایه بیشتر از فرکانس در بازه فراتر از مرز دیگر بازه مدال است. از این رو ما فرمول رایج (5.15) را داریم:

جایی که ایکس 0 - حد پایین بازه مودال؛

fMo - فرکانس در بازه مودال؛

fMo -1 - فرکانس در بازه قبلی؛

fMo +1 - فرکانس در بازه بعدی بعد از مدال.

من - مقدار فاصله

طبق جدول. 5.6 محاسبه مد:

محاسبه حالت در سری بازه ای نسبتاً مشروط است. تقریباً، Mo را می توان به صورت گرافیکی تعیین کرد (شکل 5.1 را ببینید).

مقدار میانگین حسابی نیز به مطالعه ساختار سری تغییرات مربوط است، اگرچه مقدار اصلی این شاخص تعمیم‌دهنده متفاوت است. در سری توزیع مزارع بر اساس عملکرد (جدول 5.6)، میانگین عملکرد به عنوان وسط فواصل وزنی فراوانی محاسبه می شود. ایکس(با فرمول (5.2)):

رابطه میانگین، میانه و حالت

تفاوت بین میانگین حسابی، میانه و مد در این توزیع کم است. اگر توزیع از نظر شکل به قانون عادی نزدیک باشد، آنگاه میانه بین حالت و مقدار میانگین و به میانگین نزدیکتر از حالت است.

با عدم تقارن سمت راست ایکس̅ > من > مو.

با عدم تقارن سمت چپ ایکس̅ < من< Mo.

برای توزیع‌های دارای اریب متوسط، برابری درست است:

5.8. اندازه گیری اندازه و شدت تغییرات

میانگین مطلق اندازه های تنوع

مرحله بعدی در مطالعه تغییر صفت در کل، اندازه گیری ویژگی های نیرو، بزرگی تغییرات است. ساده ترین آنها می تواند باشد محدودهیا دامنه تغییرات -تفاوت مطلق بین مقادیر حداکثر و حداقل یک صفت از مقادیر موجود در مجموعه مقادیر مورد مطالعه. بنابراین، دامنه تغییرات با فرمول محاسبه می شود

از آنجایی که بزرگی محدوده تنها حداکثر تفاوت در مقادیر ویژگی را مشخص می کند، نمی تواند قدرت منظم تغییرات آن را در کل جمعیت اندازه گیری کند. شاخصی که برای این منظور در نظر گرفته شده است باید تمام تفاوت های مقادیر ویژگی را در مجموع بدون استثنا در نظر گرفته و تعمیم دهد. تعداد این تفاوت ها برابر است با تعداد ترکیبات دو نفره از همه واحدهای جمعیت. مطابق جدول 5.6 خواهد بود: C^= 10 153. با این حال، نیازی به در نظر گرفتن، محاسبه و میانگین تمام انحرافات وجود ندارد. استفاده از میانگین انحراف مقادیر ویژگی های فردی از میانگین آسان تر است مقدار حسابیصفت و تنها 143 مورد وجود دارد اما میانگین انحراف مقادیر صفت از میانگین مقدار حسابیبا توجه به ویژگی معروف دومی برابر با صفر است. بنابراین، شاخص قدرت تغییرات، میانگین جبری انحرافات نیست، بلکه میانگین مدول انحرافات:

طبق جدول. 5.6 ماژول وسط یا میانگین انحراف خطی،در قدر مطلق به عنوان مدول انحراف وزن دار فرکانس، نقاط میانی فواصل از میانگین حسابی محاسبه می شود، یعنی. طبق فرمول

به این معنی که به طور متوسط ​​عملکرد در مجموعه مزارع مورد مطالعه 6.85 سانتی‌گراد در هکتار از میانگین عملکرد منطقه انحراف داشت. سهولت در محاسبه و تفسیر را تشکیل می دهند جنبه های مثبتبا این حال، از این شاخص، ویژگی های ریاضی ماژول ها "ضعیف" است: آنهانمی توان با هیچ قانون احتمالی، از جمله توزیع نرمال، که پارامتر آن مدول انحراف متوسط ​​نیست، مطابقت داد، اما انحراف معیار(در برنامه های کامپیوتری انگلیسی به نام "انحراف معیار"، به اختصار "s.d." یا به سادگی « س», به زبان روسی - NKO). در ادبیات آماری، انحراف معیار از مقدار متوسط ​​معمولاً با یک حرف یونانی کوچک (کوچک) سیگما (st) یا نشان داده می شود. س(به فصل 7 مراجعه کنید):

برای سریال های رتبه بندی شده

برای سری های فاصله ای

طبق جدول. 5.6 انحراف معیار عملکرد دانه:

لازم به ذکر است که مقداری گرد کردن مقدار متوسط ​​و نقاط میانی فواصل، به عنوان مثال، به اعداد صحیح، تأثیر کمی بر مقدار σ دارد که در این صورت به 8.55 c/ha می رسد.

انحراف استاندارد در بزرگی در جمعیت های واقعی همیشه بیشتر از مدول انحراف متوسط ​​است. نسبت (در: آبه وجود انحرافات شدید و برجسته در سنگدانه ها بستگی دارد و می تواند به عنوان نشانگر "آلودگی" سنگدانه با عناصر ناهمگن با جرم اصلی باشد: هر چه این نسبت بزرگتر باشد، چنین "آلودگی" قوی تر است. برای قانون توزیع نرمال σ: a = 1,2.

مفهوم پراکندگی

مربع انحراف معیار مقدار را می دهد پراکندگی σ 2 .فرمول پراکندگی:

ساده (برای داده های گروه بندی نشده):

وزن دار (برای داده های گروه بندی شده):

تقریباً تمام روش های آمار ریاضی بر اساس پراکندگی است. بزرگ ارزش عملییک قانون برای اضافه کردن واریانس دارد (به فصل 6 مراجعه کنید).

سایر معیارهای تغییر

یکی دیگر از شاخص های قدرت تنوع، که آن را نه در کل جمعیت، بلکه فقط در بخش مرکزی آن مشخص می کند، این است. میانگین فاصله یک چهارم،آن ها میانگین مقدار اختلاف بین چارک ها که در زیر نشان داده شده است q:

برای توزیع شرکت های کشاورزی بر اساس عملکرد در جدول. 5.2

q\u003d (36.25 - 25.09): 2 \u003d 5.58 کیلوگرم در هکتار. قدرت تنوع در بخش مرکزی جمعیت، به عنوان یک قاعده، کمتر از کل جمعیت است. نسبت بین میانگین مدول انحرافات و میانگین انحراف فصلی نیز برای مطالعه ساختار تغییرات مفید است: پراهمیتچنین نسبتی نشان‌دهنده وجود یک "هسته" با متغیر ضعیف و یک محیط به شدت پراکنده در اطراف این هسته یا "هاله" در جمعیت مورد مطالعه است. برای داده های جدول نسبت 5.6 الف: ق= 1.23، که نشان دهنده تفاوت کمی در قدرت تغییرات در بخش مرکزی جمعیت و در حاشیه آن است.

برای ارزیابی شدت تنوع و مقایسه آن در جمعیت های مختلف و حتی بیشتر از آن برای صفات مختلف، لازم است شاخص های نسبی تنوعآنها به صورت نسبت محاسبه می شوند شاخص های مطلققدرت تغییر، که قبلاً بحث شد، به مقدار میانگین حسابی ویژگی. ما شاخص های زیر را دریافت می کنیم:

1) محدوده نسبی تغییرات p:

2) مدول انحراف نسبی t:

3) ضریب تغییرات به عنوان انحراف مربع نسبی v:

4) فاصله ربع نسبی د:

جایی که q - میانگین فاصله چارکی

برای تغییر عملکرد بر اساس جدول. 5.6 این شاخص ها عبارتند از:

ρ = 42.4: 30.3 = 1.4 یا 140%؛

تی= 6.85: 30.3 = 0.226، یا 22.6٪.

v = 8.44: 30.3 = 0.279 یا 27.9%؛

د= 5.58: 30.3 = 0.184 یا 18.4%.

ارزیابی درجه شدت تغییرات فقط برای هر ویژگی فردی یک جمعیت از یک ترکیب خاص امکان پذیر است. بنابراین، برای مجموعه‌ای از شرکت‌های کشاورزی، تغییرات عملکرد در همان منطقه طبیعی را می‌توان ضعیف ارزیابی کرد اگر v < 10%, умеренная при 10% < v < 25% и сильная при v > 25%.

در مقابل، تغییر قد در جمعیت مردان یا زنان بالغ در حال حاضر با ضریب برابر با 7٪ باید توسط مردم ارزیابی و درک شود. بنابراین، ارزیابی شدت تغییرات شامل مقایسه تغییرات مشاهده شده با مقداری از شدت معمول آن است که به عنوان یک استاندارد در نظر گرفته شده است. ما به این واقعیت عادت کرده ایم که بهره وری، درآمد یا درآمد سرانه، عددی است اتاق های نشیمندر یک ساختمان می تواند چندین یا حتی ده ها بار متفاوت باشد، اما تفاوت قد افراد حداقل یک و نیم برابر در حال حاضر بسیار قوی تلقی می شود.

تغییرات قدرت و شدت متفاوت به دلایل عینی است. به عنوان مثال، قیمت فروش دلار آمریکا در بانک های تجاری در سن پترزبورگ در 24 ژانویه 1997 از 5675 تا 5640 روبل متغیر بود. در قیمت میانگین 5664 روبل. محدوده نسبی تنوع ρ = 35:5664 = 0.6%. چنین تغییر کوچکی به این دلیل است که با تفاوت قابل توجهی در نرخ دلار، بلافاصله خروج خریداران از بانک "گران قیمت" به بانک های "ارزان تر" رخ می دهد. برعکس، قیمت یک کیلوگرم سیب زمینی یا گوشت گاو در مناطق مختلفروسیه بسیار متفاوت است - ده ها درصد یا بیشتر. این به دلیل هزینه های متفاوت برای تحویل کالا از منطقه تولید کننده به منطقه مصرف کننده است، یعنی. ضرب المثل "یک تلیسه در خارج از کشور نصف است، اما یک روبل حمل می شود."

5.9. لحظه های توزیع و شاخص ها اشکال آن

لحظه های مرکزی توزیع

برای مطالعه بیشتر ماهیت تغییرات، از مقادیر متوسط ​​درجات مختلف انحراف مقادیر فردی یک صفت از مقدار میانگین حسابی آن استفاده می شود. این شاخص ها نامیده می شوند لحظات مرکزیتوزیع‌هایی از ترتیب مربوط به قدرتی که انحرافات به آن افزایش می‌یابد (جدول 5.7)، یا به سادگی ممان‌ها (لمان‌های غیرمرکزی به ندرت استفاده می‌شوند و در اینجا در نظر گرفته نمی‌شوند). مقدار لحظه سوم ts- مانند علامت آن به غلبه مکعب های مثبت انحراف بر مکعب های منفی بستگی دارد یا برعکس. در حالت عادی و هر توزیع کاملاً متقارن دیگری، مجموع مکعب‌های مثبت کاملاً برابر با مجموع مکعب‌های منفی است.

شاخص های عدم تقارن

بر اساس لحظه مرتبه سوم، می توان شاخصی ساخت که درجه عدم تقارن توزیع را مشخص می کند:

مانندتماس گرفت ضریب عدم تقارنمی توان آن را از داده های گروه بندی شده و گروه بندی نشده محاسبه کرد. طبق جدول. 5.6 شاخص عدم تقارن بود:

آن ها عدم تقارن اندک است K. Pearson آماردان انگلیسی، بر اساس تفاوت بین مقدار متوسط ​​و حالت، شاخص دیگری از عدم تقارن را پیشنهاد کرد.

جدول 5.7

لحظات محوری

طبق جدول. 5.6 شاخص پیرسون:

شاخص پیرسون به درجه عدم تقارن در قسمت میانی سری توزیع بستگی دارد و شاخص عدم تقارن بر اساس لحظه مرتبه سوم به مقادیر شدید صفت بستگی دارد. بنابراین، در مثال ما، در قسمت میانی توزیع، عدم تقارن بیشتر است، که از نمودار نیز قابل مشاهده است (شکل 5.1). توزیع‌هایی با چولگی قوی سمت راست و چپ (مثبت و منفی) در شکل‌ها نشان داده شده است. 5.3.

خصوصیات کشش توزیع

با کمک لحظه مرتبه چهارم، ویژگی پیچیده‌تر سری توزیع نسبت به عدم تقارن، نامیده می‌شود کشیدگی


برنج. 5.3. عدم تقارن، توزیع

شاخص کشش با فرمول محاسبه می شود

(5.30)

اغلب کشش به عنوان "شیب" توزیع تفسیر می شود، اما این نادقیق و ناقص است. نمودار توزیع بسته به قدرت تغییر صفت می‌تواند به‌طور دلخواه شیب‌دار به نظر برسد: هرچه این تغییرات ضعیف‌تر باشد، منحنی توزیع در یک مقیاس معین تندتر است. ناگفته نماند که با تغییر مقیاس ها در امتداد آبسیسا و در امتداد منتخب، می توان هر توزیعی را به طور مصنوعی "تند" و "شیب" کرد. برای نشان دادن میزان کشیدگی توزیع و تفسیر صحیح آن، باید سری‌هایی را با قدرت تغییر یکسان (مقدار σ یکسان) مقایسه کنید و شاخص های مختلفکشیدگی برای اینکه کشیدگی با چولگی اشتباه نشود، تمام ردیف های مقایسه شده باید متقارن باشند. چنین مقایسه ای در شکل نشان داده شده است. 5.4.

شکل 5.4. کشش توزیع

برای یک سری متغیر با توزیع نرمال، مقادیر من شاخص کشش، محاسبه شده با فرمول (5.30)، j برابر با سه است.

با این حال ، چنین شاخصی را نباید اصطلاح "kurtosis" نامید که در ترجمه به معنای "زیاد" است. اصطلاح "کورتوز" را باید نه بر خود نسبت طبق فرمول (5.30) بلکه برای مقایسه چنین نسبتی برای توزیع مورد مطالعه با مقدار نسبت داده شده توزیع نرمال به کار برد. با مقدار 3. از این رو فرمول های نهایی برای شاخص کشیدگی، i.e. مازاد در مقایسه با توزیع نرمال با قدرت تغییرات یکسان، به شکل زیر است:

برای سریال های رتبه بندی شده

برای سری تغییرات بازه ای و گسسته

وجود یک کشش مثبت، و همچنین تفاوت قابل توجهی که قبلاً ذکر شد بین یک فاصله کوچک سه ماهه و یک انحراف استاندارد بزرگ، به این معنی است که در توده پدیده های مورد مطالعه یک "هسته" وجود دارد که در این ویژگی کمی متفاوت است، که توسط یک پراکنده "هاله". با یک کشش منفی قابل توجه، چنین "هسته ای" به هیچ وجه وجود ندارد.

با مقادیر شاخص های چولگی و کشیدگی توزیع، می توان نزدیکی توزیع به نرمال را قضاوت کرد که می تواند برای ارزیابی نتایج همبستگی و نیز ضروری باشد. تجزیه و تحلیل رگرسیون، احتمالات ارزیابی احتمالی پیش بینی ها (به فصل های 7،8،9 مراجعه کنید). توزیع را می توان نرمال در نظر گرفت، یا به طور دقیق تر، فرضیه شباهت توزیع واقعی با توزیع نرمال را نمی توان رد کرد اگر شاخص های چولگی و کشیدگی از انحراف استاندارد دو برابری سانتی متر تجاوز نکنند. این انحرافات استاندارد با فرمول های زیر محاسبه می شوند:

5.10. حداکثر مقادیر ممکن شاخص های تنوع و کاربرد آنها

هنگام استفاده از هر نوع شاخص آماری، دانستن اینکه حداکثر مقادیر ممکن یک شاخص معین برای سیستم مورد مطالعه چقدر است و نسبت مقادیر واقعی مشاهده شده به حداکثر ممکن چقدر است مفید است. این مشکل به ویژه هنگام مطالعه تغییرات شاخص های حجم، مانند حجم تولید یک نوع خاص از محصول، در دسترس بودن منابع خاص، توزیع سرمایه گذاری های سرمایه، درآمدها و سود بسیار مهم است. نظری و عملی را در نظر بگیرید این سوالبه عنوان مثال توزیع محصولات سبزیجات بین شرکت های کشاورزی در منطقه.

بدیهی است که حداقل مقدار ممکن شاخص های تغییرات با توزیع کاملاً یکنواخت صفت حجم بین همه واحدهای جمعیت، یعنی با حجم یکسان تولید در هر یک از شرکت های کشاورزی به دست می آید. در چنین توزیع محدود کننده (البته در عمل بسیار بعید) هیچ گونه تغییری وجود ندارد و همه شاخص ها، تغییرات برابر با صفر هستند.

حداکثر مقدار ممکن شاخص‌های تغییرات با چنین توزیعی از صفت حجمی در جمعیت به دست می‌آید که در آن کل حجم آن در یک واحد از جمعیت متمرکز می‌شود. به عنوان مثال، کل حجم تولید سبزیجات - در یک شرکت کشاورزی منطقه در غیاب تولید آنها در مزارع دیگر. احتمال چنین غلظت فوق العاده ممکنی از حجم یک ویژگی در یک واحد جمعیت چندان کم نیست. در هر صورت، بسیار بیشتر از احتمال توزیع کاملاً یکنواخت است.

توان های تغییر را برای حالت محدود نشان داده شده حداکثر آن در نظر بگیرید. اجازه دهید تعداد واحدهای جمعیت را مشخص کنیم پ،میانگین ارزش صفت ایکس̅ , سپس حجم کل ویژگی در مجموع به صورت بیان می شود ایکس̅ پ.تمام این حجم در یک واحد جمعیت متمرکز شده است، به طوری که ایکسحداکثر= x̅ ص xدقیقه = 0, از این رو نتیجه می شود که حداکثر مقدار دامنه (محدوده تغییرات) برابر است با:

برای محاسبه حداکثر مقادیرمیانگین انحرافات مدول و درجه دوم جدولی از انحرافات خواهیم ساخت (جدول 5.8).

جدول 5.8

ماژول ها و مربع های انحراف از میانگین در حداکثرتنوع ممکن

اعداد واحد جمعیت

مقادیر ویژگی

انحراف از میانگین

x i - ایکس̅

ماژول های انحراف

|x i - x̅|

مربع های انحراف

(ایکسمن- ایکس̅ ) 2

ایکس̅ پ

ایکس̅ (پ - 1)

-ایکس̅

-ایکس̅

-ایکس̅

ایکس̅ (پ - 1)

ایکس̅

ایکس̅

ایکس̅

ایکس̅ 2 (پ - 1) 2

ایکس̅ 2

ایکس̅ 2

ایکس̅ 2

ایکس̅ پ

2ایکس̅ (پ - 1)

ایکس̅ 2 [(پ - 1) 2 +(n-1)]

بر اساس عبارات خط پایانی جدول. 5.8، ما حداکثر مقادیر ممکن زیر را از شاخص های تغییرات بدست می آوریم.

میانگین مدول انحرافات یا انحراف خطی متوسط:

انحراف معیار:

انحراف مدولار نسبی (خطی):

ضریب تغییرات:

همانطور که برای فاصله سه ماهه، سیستم با حداکثر تنوع ممکندارای ساختار توزیع منحط مشخصه است، که در آن ویژگی های ساختار وجود ندارد ("کار نمی کند"): میانه، چارک ها و موارد مشابه.

بر اساس فرمول های به دست آمده برای حداکثر مقادیر ممکن شاخص های اصلی تغییرات، اول از همه، نتیجه گیری در مورد وابستگی این مقادیر به حجم جمعیت به دست می آید. پ.این وابستگی در جدول خلاصه شده است. 5.9.

محدودترین محدودیت‌های تغییر و وابستگی ضعیف به اندازه جمعیت، مدول متوسط ​​و انحراف خطی نسبی را نشان می‌دهد. برعکس، انحراف معیار و ضریب تغییرات به شدت به تعداد واحدهای جمعیت بستگی دارد. این وابستگی باید در هنگام مقایسه شدت تنوع در جمعیت های با اندازه های مختلف در نظر گرفته شود. اگر در مجموع شش بنگاه ضریب تغییرات در حجم تولید 0.58 و در مجموع 20 بنگاه 0.72 بود، آیا منصفانه است که نتیجه بگیریم که حجم تولید در جمعیت دوم ناهموارتر است؟ در واقع، در اولین، کوچکتر، 0.58: 2.24 = 25.9٪ از حداکثر ممکن، یعنی. حد، سطح تمرکز تولید در یک شرکت از شش شرکت، و در مجموعه دوم، بزرگتر، ضریب تغییرات مشاهده شده تنها 0.72 بود: 4.36 = 16.5٪ از حداکثر ممکن.

جدول 5.9

مقادیر حدی شاخص های تنوع یک ویژگی حجمی برای اندازه های مختلف جمعیت

میزان جمعیت

حداکثر مقادیر شاخص ها

ایکس̅

ایکس̅

1,5ایکس̅

1,73ایکس̅

1,67ایکس̅

2,24ایکس̅

1,80ایکس̅

3ایکس̅

1,90ایکس̅

4,36ایکس̅

1,96ایکس̅

7ایکس̅

1,98ایکس̅

9,95ایکس̅

2ایکس̅

از اهمیت عملی چنین شاخصی مانند نسبت ماژول انحراف متوسط ​​واقعی به حداکثر ممکن است. بنابراین، برای مجموع شش شرکت، این نسبت: 0.47: 1.67 = 0.281 یا 28.1٪ بود. تفسیر شاخص به دست آمده به شرح زیر است: برای انتقال از توزیع مشاهده شده تولید بین بنگاه ها به توزیع یکنواخت، لازم است دوباره توزیع شود.

23.4 درصد از کل تولید در کل. اگر درجه غلظت واقعی تولید (مقدار واقعی σ یا v) کسری معین از ارزش نهایی در مورد انحصار تولید در یک شرکت است، سپس نسبت شاخص واقعیتا حد ممکن می تواند میزان تمرکز (یا انحصار) تولید را مشخص کند.

نسبت مقادیر واقعی شاخص های تغییر یا تغییر در ساختار به حداکثر ممکن نیز در تجزیه و تحلیل تغییرات سازه استفاده می شود (به فصل 11 مراجعه کنید).

1. جین کی.مقادیر متوسط - م.: آمار، 1970.

2. Krivenkova L. N.، Yuzbashev M. M.دامنه وجود شاخص های تغییرات و کاربرد آن // بولتن آمار. - 1991. - شماره 6. - S. 66-70.

3. پسخاور I. S.مقادیر متوسط ​​در آمار - م.: آمار. 1979.

4. شوراکوف V. V.، Dayitbegov D. M. و دیگران.ایستگاه کاری خودکار برای پردازش داده های آماری (فصل 4. پردازش داده های آماری اولیه). - م.: امور مالی و آمار، 1990.

یک سری تغییرات ترتیبی از مقادیر یک ویژگی هر واحد آماری در یک ترتیب معین است. در این مورد، مقادیر فردی یک ویژگی معمولاً یک نوع (نوع) نامیده می شود. . به هر یک از اعضای سری تغییرات (واریانت) آمار ترتیبی و تعداد متغیرها را رتبه (ترتیب) آمار می گویند.

مهمترین ویژگی های سری تغییرات، انواع شدید آن (X 1 = Xmin؛ X n = Xmax) و محدوده تغییرات (Rx = Xn - X 1) است.

سری تغییرات به طور گسترده در پردازش اولیه اطلاعات آماری به دست آمده در نتیجه مشاهدات آماری استفاده می شود. آنها به عنوان مبنایی برای ساخت تابع توزیع تجربی واحدهای آماری در جامعه آماری عمل می کنند. بنابراین سری متغیر نامیده می شود ردیف های توزیع.

در آمار، تشخیص دهید انواع زیرسری تغییرات: رتبه بندی، گسسته، فاصله.

سری رتبه بندی شده (از لاتین rang - rank).- این مجموعه ای از توزیع واحدهای جامعه آماری است که در آن انواع صفت به ترتیب صعودی یا نزولی هستند. هر سری رتبه بندی شده از اعداد رتبه بندی (1 تا n) و نوع مربوط به آنها تشکیل شده است. تعداد گزینه‌های یک سری رتبه‌بندی که بر اساس یک ویژگی ضروری شکل می‌گیرد معمولاً برابر با تعداد واحدهای جامعه آماری است.

برای تشکیل یک سری رتبه بندی شده بر اساس معین (مثلاً بر اساس تعداد کارگران دام در 100 شرکت کشاورزی)، می توانید از طرح جدول استفاده کنید. 5.1.

T a b l e 5.1. ترتیب تشکیل یک سری رتبه بندی شده

پایان کار -

این موضوع متعلق به:

آمار

و غذای جمهوری بلاروس .. وزارت آموزش، علوم و پرسنل ..

اگر احتیاج داری مواد اضافیدر مورد این موضوع، یا آنچه را که به دنبال آن بودید پیدا نکردید، توصیه می کنیم از جستجو در پایگاه داده آثار ما استفاده کنید:

با مطالب دریافتی چه خواهیم کرد:

اگر این مطالب برای شما مفید بود، می توانید آن را در صفحه خود در شبکه های اجتماعی ذخیره کنید:

تمامی موضوعات این بخش:

شوندالوف بی.ام.
نظریه عمومی آمار. آموزشبرای تخصص های اقتصادی مؤسسات آموزش عالی کشاورزی. راهنمای مطالعه با

موضوع آمار
کلمه "statistics" از کلمه لاتین "status" (status) گرفته شده است که به معنای وضعیت، وضعیت امور است. این امکان تأکید بر جوهر شناختی نظری را فراهم می کند

ماهیت مشاهده آماری
هر مطالعه آماری، همانطور که در بالا ذکر شد (مبحث 1)، همیشه با جمع آوری اطلاعات اولیه (اولیه) در مورد هر واحد از جامعه آماری آغاز می شود. با این حال، نه همه

برنامه پایش آماری
در فصل اول، توجه به این واقعیت جلب شد که هر واحد آماری، به عنوان یک شیء به عنوان یک کل، دارای بسیاری از ویژگی ها، کیفیت ها، ویژگی های خاص، که نامیده می شوند

فهرستی از ویژگی های ثبت شده در طول فرآیند مشاهده معمولاً برنامه مشاهده آماری نامیده می شود.
توسعه برنامه یکی از مهمترین مسائل نظری و عملی مشاهده آماری است. کیفیت برنامه تا حد زیادی کیفیت را تعیین می کند مواد جمع آوری شده، قابلیت اطمینان آن و

اشکال مشاهده آماری
کل تنوع مشاهدات آماری به دو شکل کاهش می یابد: گزارش آماری و مشاهدات آماری سازماندهی شده خاص. گزارش آماری

فرم های آماری
فرم آماری، بانکی است حاوی سوالات برنامه آمارگیری و محلی برای پاسخگویی به آنها. فرم حامل اطلاعات آماری به دست آمده در نتیجه است

انواع مشاهدات آماری
مشاهدات آماری به انواعی طبقه بندی می شوند که ممکن است بر اساس اصول مختلف متفاوت باشند. بنابراین، بسته به میزان پوشش شی مورد مطالعه، مشاهدات آماری را می توان تقسیم بندی کرد

روشهای انجام مشاهدات آماری
مشاهدات آماری را می توان به روش های مختلفی انجام داد، که در میان آنها اغلب موارد زیر یافت می شود: گزارش، اعزامی، خود محاسبه، خود ثبت نام، پرسشنامه، خبرنگار.

مکان، تاریخ و دوره مشاهدات آماری
در طرح هر مشاهده آماری، محل این مشاهده باید به وضوح مشخص شود، یعنی. مکانی که اطلاعات جمع آوری شده در آن ثبت می شود، به صورت آماری پر می شود

خطاهای مشاهدات آماری و اقدامات لازم برای مبارزه با آنها
یکی از مهمترین الزامات مهمتحمیل شده بر نتایج مشاهدات آماری، دقت آنها است، که به عنوان معیاری از مطابقت دانش آماری درک می شود.

خلاصه آماری اولیه
نتایج مشاهدات آماری حاوی اطلاعات همه کاره در مورد هر واحد از جمعیت یا شی است و معمولاً بی نظم هستند. این ماده خاملازم، قبل از

ماهیت و اهمیت شاخص های آماری نسبی
شاخص‌های نسبی مقادیری آماری هستند که نسبت کمی مقادیر مطلق یک صفت را بیان می‌کنند و اندازه‌های نسبی پدیده‌ها و فرآیندها را نشان می‌دهند. O

انواع شاخص های نسبی شاخص های نسبی دینامیک
بسته به وظایفی که باید با آنها حل شود ارزش های نسبیانواع شاخص های نسبی زیر را متمایز می کند: پویایی، ساختار، هماهنگی، شدت، مقایسه، انجام سفارش،

شاخص های نسبی سازه
یکی از ویژگی های کلیدیهمه پدیده ها در پیچیدگی آنها نهفته است. حتی یک مولکول آب مقطر از اتم های هیدروژن و اکسیژن تشکیل شده است. بسیاری از پدیده های طبیعت، جامعه، انسان

شاخص های نسبی هماهنگی
شاخص های نسبی هماهنگی نسبت بین اندازه های مطلق اجزای تشکیل دهنده در یک کل مطلق است. برای محاسبه این شاخص ها یکی از مولفه های

شاخص های شدت نسبی
شاخص‌های نسبی شدت (درجه) نسبت اندازه‌های مطلق دو ویژگی کیفی متفاوت، اما مرتبط با هم در اسکوپ آماری است.

شاخص های مقایسه نسبی
شاخص های نسبی مقایسه (مقایسه) با نسبت شاخص های مطلق همنام مربوط به واحدهای آماری مختلف جغدها به دست می آید.

نرخ های نسبی انجام سفارش
شاخص‌های عملکرد نسبی یک سفارش (وظیفه، طرح) نسبت شاخص‌های مطلق و واقعی به دست آمده برای یک دوره معین یا از آن تاریخ است.

شاخص های نسبی سطح توسعه اقتصادی
شاخص های نسبی سطح توسعه اقتصادی نسبت اندازه های مطلق دو ویژگی کیفی متفاوت (متضاد) اما مرتبط با یکدیگر است. همزمان

ماهیت و معنای روش گرافیکی
شاخص های آماری مطلق به دست آمده در نتیجه مشاهدات آماری و شاخص های نسبی مختلف که بر این اساس محاسبه می شوند، می توانند بهتر، عمیق تر و در دسترس تر باشند.

الزامات اساسی برای ساخت نمودارهای مختصات
رایج ترین و راه راحتیک نمایش گرافیکی از شاخص های مطلق و نسبی دینامیک، شاخص های مقایسه و غیره یک نمودار مختصات در نظر گرفته می شود.

روش های نمایش گرافیکی شاخص های دینامیک و ساختار
در بسیاری از موارد، نیاز به تأمل در نمودار مختصات یکسان وجود دارد، نه یک، بلکه چندین خط که پویایی شاخص های مختلف مطلق یا نسبی را مشخص می کند، یا

روش های نمایش گرافیکی شاخص های مقایسه
در یک مفهوم گسترده، مقایسه شاخص ها هم در زمان و هم در مکان انجام می شود، یعنی. روش‌های مقایسه می‌توانند پویایی، ساختار و اشیاء سرزمینی را پوشش دهند. بنابراین، pr

ماهیت و معنای کارتوگرام و کارتوگرام
در بسیاری از موارد، نیاز به ترسیم گرافیکی مهم ترین ویژگی های مشخصه اشیاء سرزمینی وسیع وجود دارد. در سیستم APC، اینها می توانند باشند شهرک ها، کشاورزی

کنترل سوالات مبحث 4
1. روش گرافیکی چیست و بر چه اساسی استوار است؟ 2. برای چه اهداف اصلی از روش گرافیکی استفاده می شود. 3. چگونه طبقه بندی می شوند

جوهر تنوع انواع علائم تغییرات
تنوع (از variatio لاتین - تغییر) تغییر در یک ویژگی (نوع) در یک جامعه آماری است، یعنی. پذیرش دانش مختلف توسط واحدهای جمعیت یا گروه های آنها به رسمیت شناخته می شود

بر اساس تعداد کارگران دام
شماره رتبه (#) گزینه مربوط به شماره رتبه (#) نماد تعداد کارگران دام

محدوده توزیع گسسته
یک سری گسسته (جداکننده) یک سری متغیر است که در آن گروه های آن بر اساس یک ویژگی که به طور ناپیوسته تغییر می کند، تشکیل می شود. پس از تعداد معینی از

کارگران دام
تعداد انواع متغیر (مقدار علامت)، Х علائم فرکانس فرکانس‌های محلی، fl فرکانس‌های تجمعی، fн

سری توزیع فاصله
در بسیاری از موارد، این مجموعه آماری شامل تعداد زیادی یا حتی بیشتر از آن تعداد بی نهایت گزینه است که اغلب با تغییرات مداوم رخ می دهد، عملا غیر ممکن و نامناسب است.

ماهیت میانگین ها
سری‌های تنوع، طیف گسترده‌ای از پدیده‌ها و فرآیندهایی را منعکس می‌کنند که جوهر واقعیت ما را تشکیل می‌دهند. برای مطالعه کاملتر و عمیق تر پدیده ها و فرآیندهای جهان پیرامون

میانگین حسابی
اگر مقدار K = 1 را در فرمول 6.2 جایگزین کنیم، آنگاه مقدار میانگین حسابی را بدست می آوریم، یعنی. .

در توزیع رتبه بندی شده
رتبه №№ انواع (مقادیر کاراکتر) نمادها منطقه برش، هکتار

توزیع ردیف
شماره p.p. متغیرها فرکانسهای محلی میانگین وزنی متغیرها نمادها بازده

ویژگی های اساسی میانگین حسابی
میانگین حسابی تعداد زیادی دارد خواص ریاضی، که اهمیت ریاضی مهمی در محاسبه آن دارند. آگاهی از این خواص به کنترل صحیح و دقیق کمک می کند

میانگین ارزش زمانی
یکی از انواع میانگین حسابی، میانگین زمانی است. مقدار متوسط ​​محاسبه شده بر اساس مجموع مقادیر ویژگی در لحظات مختلف یا برای دوره های مختلف در

RMS
به شرط تنظیم مقدار K=2 در فرمول 6.2. مقدار میانگین مربع را بدست می آوریم. در یک سری رتبه بندی شده، مقدار مجذور میانگین از وزن نشده محاسبه می شود (pr

میانگین هندسی
اگر مقدار K = 0 را در فرمول 6.2 جایگزین کنیم، در نتیجه به میانگین هندسی می رسیم که شکلی ساده (بدون وزن) و وزن دارد. میانگین هندسی ساده است

مقدار هارمونیک متوسط
به شرط تعویض در فرمول کلی 6.2، مقدار K \u003d -1، می توانید مقدار میانگین هارمونیک را دریافت کنید که شکلی ساده و وزن دارد. نام آکاردئون میانی

میانگین ساختاری جوهر و معنای مد
در برخی موارد، برای به دست آوردن یک مشخصه تعمیم دهنده جامعه آماری برای هر ویژگی، باید از اصطلاح استفاده کرد. میانگین های ساختاری شامل می شوند

ماهیت و معنای میانه
میانه - گزینه هایی که در وسط سری تغییرات قرار دارند. میانه در سری های رتبه بندی شده به شرح زیر است. ابتدا تعداد میانه گزینه ها را محاسبه کنید:

مفهوم ساده ترین شاخص های تنوع
ماهیت تنوع در فصل 5 کتاب درسی مورد توجه قرار گرفت، جایی که اشاره شد که تغییر نوسان است، تغییر در مقدار یک ویژگی در یک جامعه آماری، به عنوان مثال. پذیرش توسط واحدها

انحراف معیار
میانگین انحراف مربعبر اساس میانگین مربع محاسبه می شود. به اشکال غیر وزنی (ساده) و وزن دار ظاهر می شود. برای رتبه بندی p

ضریب تغییرات
ضریب تغییرات یک شاخص نسبی است که با استفاده از فرمول زیر قابل محاسبه است:

کنترل سوالات مبحث 6
1. مقدار متوسط ​​چیست و چه چیزی را بیان می کند؟ 2. ویژگی تعیین کننده یک جمعیت چیست و چرا در آمار استفاده می شود؟ 3. انواع اصلی رسانه کدامند

ماهیت جامعه عمومی و نمونه
در آمار، یک نوع مشاهده مستمر نسبتاً نادر است، مانند سرشماری عمومی جمعیت. با این حال، اغلب لازم است از مشاهدات ناپیوسته استفاده شود، که

مفهوم جمعیت تصادفی
در شرایط واقعی، موارد کار آماری با جمعیت عمومی نسبتاً نادر است و بنابراین، دستیابی به موارد اصلی همیشه ممکن نیست. ویژگی های آماری

جوهر متوپ انتخابی
کار آماری در بیشتر موارد به نحوی با داده های به دست آمده در نتیجه استفاده از روش نمونه گیری مرتبط است. بسیاری از مطالعات بدون استفاده از آن غیرممکن خواهد بود

مزایا و معایب روش نمونه گیری
روش نمونه گیری نسبت به مشاهده مستمر دارای مزایای متعددی است. اولاً، مشاهده انتخابی می تواند به طور قابل توجهی در کار، پول و زمان برای اجرای آن صرفه جویی کند. جغد

روش های انتخاب، مزایا و معایب آنها
انتخاب واحدهای آماری از جامعه عمومی به روش های مختلفی انجام می شود و به شرایط زیادی بستگی دارد. روش نمونه گیری شامل روش های زیر برای انتخاب واحدهای آماری می باشد

ماهیت خطاهای نمایندگی و روش محاسبه آنها
یکی از مسائل محوری در روش نمونه‌گیری، محاسبه نظری ویژگی‌های آماری اصلی و بالاتر از همه، میانگین مقدار یک صفت در اسکوپ آماری عمومی است.

مفهوم یک نمونه کوچک. برآورد نقطه ای از ویژگی های آماری اصلی
استفاده از روش نمونه گیری می تواند بر اساس انتخاب هر تعداد واحد آماری از جامعه عمومی باشد. از نظر ریاضی ثابت شده است که جمعیت نمونه می تواند باشد

خطای نمونه برداری حاشیه ای برآورد فاصله ای از ویژگی های آماری اصلی
خطای نمونه گیری حاشیه ای اختلاف بین ویژگی های آماری به دست آمده در نمونه و جامعه عمومی است.همانطور که در بالا نشان داده شده است (فرمول

روش‌های محاسبه حجم نمونه برای روش‌های مختلف انتخاب
کار مقدماتیانجام مشاهده نمونه مستقیماً با تعیین حجم نمونه مورد نیاز مرتبط است که به روش انتخاب و تعداد واحدها در حالت کلی بستگی دارد.

مفهوم خلاصه آماری ثانویه (پیچیده).
نتایج یک خلاصه ساده که محتوای آن در مبحث 2 مورد بحث قرار گرفته است، همیشه نمی تواند محقق را راضی کند، زیرا آنها فقط یک ایده کلی از موضوع مورد مطالعه ارائه می دهند، یعنی. از آمار تی

گروه بندی های گونه شناختی
گروه‌بندی گونه‌شناختی، تقسیم‌بندی جامعه آماری به گروه‌های گونه‌شناختی با کیفیت اساساً یکسان است. گروه بندی تیپولوژیک

گروه بندی های ساختاری
گروه بندی ساختاری شامل تقسیم یک مجموعه همگن و کیفی از واحدهای آماری به گروه هایی است که ترکیب یک شی پیچیده را مشخص می کند. از طریق ساختاری

ماهیت و روش انجام یک گروه بندی ساده و تحلیلی
گروه بندی تحلیلی که در آن جامعه آماری بر اساس یکی از ویژگی های عاملی به گروه های همگن تقسیم می شود، ساده نامیده می شود.

گروه بندی تحلیلی
شماره p.p. گروه های مزارع دهقانی بر اساس دوز کود، تن در هکتار. علائم فراوانی در گروه ها (تعداد واحدهای جمعیتی در یک گروه)

شاخص های عملکرد در کشت سیب زمینی
شماره p.p. شاخص‌ها گروه‌های مزرعه در دوز کود، تن در هکتار مجموع (متوسط) 10-20

ماهیت و معنای جداول آماری
نتایج پردازش داده‌های مشاهده‌ای با استفاده از روش‌های آماری متنوع (خلاصه، نسبی، مقادیر متوسط، تشکیل‌ها، سری تغییرات، شاخص‌های تغییرات، تحلیلی

ترکیب ابتدایی جداول آماری
پردازش آماری پیچیده نتایج مشاهدات معمولاً با استفاده از جداول متعدد همراه است. بنابراین، به هر جدول یک شماره اختصاص داده می شود.

انواع و اشکال جداول آماری
بسته به ساختار موضوع جدولی، انواع جدول های آماری زیر متمایز می شوند: ساده، گروهی و ترکیبی. جدول آماری ساده - حرا

جداول آماری کمکی و حاصل
جداول آماری می توانند نقش های عملکردی مختلفی را انجام دهند. برخی از آنها، به عنوان مثال، برای خلاصه کردن نتایج مشاهدات آماری و کمک به عملکرد عملکرد اولیه هستند.

نتایج تولید، 2003
(جدول ترکیبی) شماره p.p. گروه های مزارع بر اساس بار زمین کشاورزی در هر 1 تراکتور، هکتار زیر گروه های مزارع بر اساس بار

شرکت های فرآوری کتان مجتمع کشت و صنعت در سال 1382
(کاربرگ) شماره p.p. اعتماد حجم پردازش سالانه، t تعداد کارکنان، افراد ظرفیت حمل a

ثبت جداول آماری
دستیابی به اهداف تعیین شده با استفاده از روش جدولی در مواردی امکان پذیر است که الزامات لازم برای طراحی جداول آماری برآورده شود. به طور کلی، همه جداول باید داشته باشند

مفهوم روش پراکندگی
نام روش به دلیل است استفاده گستردهانواع واریانس ها که ماهیت و روش های محاسبه آنها در مبحث ششم کتاب درسی مورد بحث قرار گرفته است. شایان ذکر است که واریانس در مقدار

نتیجه-نشانه
№ p / n گزینه های فردی انحرافات خطی فردی. متغیری از میانگین مربعات انحرافات خطی

مزارع دهقانی
شماره عملکرد، q/ha انحراف خطی بازده فردی از میانگین، q/ha مربع انحرافات خطی عملکرد

سوختگی دیررس، بر عملکرد سیب زمینی
تعداد گروه‌های مزارع بر اساس سهم محصولات زیر کشت، درصد تعداد مزارع در گروه میانگین سهم محصولات تیمار شده،

نتیجه-نشانه
تعداد گروه فواصل بر اساس شاخص عامل فرکانس محلی میانگین متغیر نشانگر حاصل

انواع پراکندگی. قانون جمع واریانس
اصل محاسبه واریانس (میانگین مجذور انحرافات) به طور کلی در مبحث 6 در نظر گرفته شده است. با توجه به روش پراکندگی، این بدان معناست که هر نوع تغییرات مربوط به مقدار معینی است.

محصول سیب زمینی (گروه اول)
شماره p.p. عملکرد، c/ha انحراف خطی از میانگین بازده گروه مربع انحرافات خطی

مفهوم معیار آر فیشر
روش پراکندگی شامل تخمین نسبت واریانس اصلاح شده است که نوسانات سیستماتیک مقادیر میانگین گروه صفت مؤثر مورد مطالعه را مشخص می کند، به پراکندگی اصلاح شده.

کمپلکس پراکندگی دو عاملی
راه حل این مجموعه با هدف بررسی تأثیر کیفی دو علامت عامل تأثیر دو علامت عامل بر یک یا چند نشانه مؤثر است. مجتمع دو عاملی

محصولات غلات
شماره زیرگروه تعداد مزارع در زیرگروه میانگین عملکرد در هر هکتار انحراف خطی عملکرد در زیر گروه از

ویژگی های کمپلکس پراکندگی چند عاملی
مطالعه کیفیت ارتباطات، یعنی. اهمیت تأثیر چند علامت عامل (سه، چهار یا بیشتر) بر شاخص های عملکرد، در اصل، مدت زمان مصرف ترکیبی است.

بازده محصولات غلات
شماره p.p. عناصر تنوع نمادها تنوع کل تنوع سیستماتیک تغییرات باقیمانده

ماهیت و انواع همبستگی ها
در فصل قبل نشان داده شد که کیفیت (اهمیت) رابطه بین ویژگی های عامل و نتیجه در جامعه آماری با استفاده از پراکندگی تعیین و ارزیابی می شود.

اشکال اصلی همبستگی بین ویژگی ها
شناسایی شکل ارتباط بین نشانه ها با تعیین رابطه علی بین آنها مقدم است. این مهم ترین و سرنوشت سازترین لحظه برای استفاده صحیحروش همبستگی توسط

شاخص های تنگاتنگی همبستگی ها. رابطه همبستگی
یکی از مسائل محوری که با کمک روش همبستگی حل می شود، تعریف و ارزیابی یک معیار کمی از نزدیکی رابطه بین عامل و ویژگی های حاصل است. در

ضرایب همبستگی جفت مستقیم
اگر رابطه بین ویژگی های جفت ویژگی مورد مطالعه به شکلی نزدیک به یک خط مستقیم بیان شود، می توان درجه نزدیکی رابطه بین این ویژگی ها را با استفاده از ضریب pr محاسبه کرد.

ضریب همبستگی رتبه
مشخصات آماری اصلی در مواردی که جمعیت عمومی، که نمونه از آن گرفته شده است، معلوم می شود که خارج از پارامترهای قانون توزیع نرمال یا نزدیک به آن است.

ضریب همبستگی چندگانه
هنگام مطالعه نزدیکی رابطه بین چندین ویژگی فاکتوریل و مؤثر، ضریب تجمعی همبستگی چندگانه محاسبه می‌شود. بنابراین، هنگام تعیین مجموع m

شاخص های تعیین
هنگام مطالعه تأثیر کمی صفات - عوامل بر نتایج، مهم است که مشخص شود چه بخشی از نوسانات صفت حاصل مستقیماً به دلیل تأثیر تغییر است.

ماهیت، انواع و معنای معادلات رگرسیون
رگرسیون به عنوان یک تابع طراحی شده برای توصیف وابستگی تغییر در علائم مؤثر تحت تأثیر نوسانات علائم - عوامل درک می شود. مفهوم رگرسیون در آمار معرفی شد

معادله رگرسیون خط مستقیم
همبستگی در یک فرم نزدیک به یک خط مستقیم را می توان به عنوان یک معادله خط مستقیم نشان داد:

معادله رگرسیون هایپربولیک
اگر شکل رابطه بین ویژگی-عامل و ویژگی-نتیجه که با استفاده از نمودار مختصات (میدان همبستگی) شناسایی شده است، هذلولی باشد، باید معادله را ایجاد و حل کرد.

رگرسیون ها
شماره p.p. علامت-عامل علامت-نتیجه معنی معکوسفاکتور ویژگی مربع ارزش متقابل

رگرسیون هایپربولیک
شماره p.p. عملکرد نخود، dt/ha X هزینه نخود، هزار روبل/dt Y مقادیر تخمینی

معادله رگرسیون سهموی
در برخی موارد، داده‌های تجربی جامعه آماری که با استفاده از نمودار مختصات تجسم شده‌اند، نشان می‌دهند که افزایش ضریب با افزایش بیش از حد واکنش همراه است.

رگرسیون سهموی
شماره p.p. X Y XY X2 X2Y X4

رگرسیون سهموی
شماره p.p. وزن مخصوص محصولات سیب زمینی، Х عملکرد سیب زمینی، هزار ج. محاسبات ارزش

معادله رگرسیون چندگانه
استفاده از روش همبستگی در مطالعه وابستگی یک ویژگی - نتیجه بر روی چندین ویژگی عامل بر اساس طرحی شبیه به یک همبستگی ساده (جفت) شکل می گیرد. یکی از

ضرایب کشسانی
برای توصیف (تفسیر) معنی دار و قابل دسترس نتایج، منعکس کننده همبستگی - وابستگی رگرسیونبین ویژگی ها از طریق معادلات رگرسیون مختلف، معمولا استفاده می شود

ماهیت سری زمانی
همه پدیده های جهان پیرامون در زمان دستخوش تغییرات مداوم می شوند. در طول زمان، یعنی حجم، سطح، ترکیب، ساختار و غیره آنها در دینامیک تغییر می کنند. ذکر این نکته مناسب است

بنگاه های کشاورزی
(ابتدای سال؛ هزار واحد فیزیکی) شاخص ها 2000 2001 2002 2003

شاخص های اصلی سری پویا
تجزیه و تحلیل جامع سری های پویا، الگوهایی را که در آن ظاهر می شوند، آشکار و مشخص می کند مراحل مختلفتوسعه پدیده ها، برای شناسایی روندها و ویژگی های توسعه این پدیده ها. در حرفه ای

افزایش سطح مطلق
یکی از ساده ترین شاخص های توسعه دینامیک افزایش مطلق سطح است. رشد مطلق تفاوت بین دو سطح از محدوده دینامیکی است

سطح نرخ رشد
برای توصیف نرخ نسبی تغییر، شاخص نرخ رشد. نرخ رشد نسبت یک سطح از سری پویا به سطح دیگر است که به عنوان مبنای مقایسه در نظر گرفته می شود. نرخ رشد می تواند باشد

سطح نرخ رشد
اگر نرخ رشد مطلق سطوح سری پویا با بزرگی افزایش مطلق مشخص شود، آنگاه نرخ رشد نسبی سطوح با نرخ های رشد مشخص می شود. تمپو در

قدر مطلق یک درصد افزایش می یابد
هنگام تجزیه و تحلیل سری های زمانی، اغلب این وظیفه مطرح می شود: پیدا کردن اینکه چه مقادیر مطلقی 1٪ افزایش (کاهش) در سطوح را بیان می کنند، زیرا در تعدادی از موارد، با کاهش (کاهش) در سطوح

برای 1999-2003
سال بهره وری، c/ha افزایش عملکرد مطلق، c/ha نرخ رشد، % نرخ رشد، %

تکنیک های تراز سری دینامیک
برای شناسایی الگوهای زمانی، به عنوان یک قاعده، به تعداد کافی سطوح، یک سری پویا نیاز است. اگر سری پویا از تعداد محدودی از سطوح تشکیل شده باشد، تراز آن

روش‌هایی برای هم‌ترازی سری‌های زمانی تحلیلی
آشکار شدن روند کلیتوسعه سطوح سری پویا را می توان با استفاده از روش های مختلف تراز تحلیلی انجام داد که اغلب انجام می شود.

تراز تحلیلی به منحنی نمایی
در برخی موارد، به عنوان مثال، در طول راه اندازی و توسعه ظرفیت های تولید جدید، سری های زمانی ممکن است با تغییر سریع در حال رشد در سطوح مشخص شود، به عنوان مثال. زنجیره ای

تراز سهموی تحلیلی مرتبه دوم
اگر سری پویا مورد مطالعه با افزایش مطلق مثبت مشخص شود، با شتاب توسعه سطوح، آنگاه تراز سری را می توان طبق یک سهمی مرتبه دوم انجام داد.

تراز تحلیلی بر اساس معادله هذلولی
اگر سری دینامیک با کاهش مطلق میرایی در سطوح مشخص شود (به عنوان مثال، پویایی شدت کار محصولات، عرضه نیروی کار تولید در کشاورزی، و غیره)، پس

مفهوم درون یابی و برون یابی سطوح سری های زمانی
در برخی موارد، یافتن مقادیر سطوح میانی گمشده سری زمانی بر اساس مقادیر شناخته شده آن ضروری است. در چنین مواردی می توان از درون یابی استفاده کرد

اولین گام در مطالعه آماری تغییرات، ساخت یک سری تغییرات است - توزیع مرتب واحدهای جمعیت بر اساس مقادیر افزایشی (بیشتر) یا کاهشی (کمتر) یک صفت و شمارش تعداد واحدها با یک. یا مقدار دیگری از صفت.

سه شکل از سری تغییرات وجود دارد: محدوده، گسسته، فاصله. یک سری متغیر اغلب سری توزیع نامیده می شود. این اصطلاح هنگام مطالعه تغییرات صفات کمی و غیر کمی استفاده می شود. سری توزیع یک گروه بندی ساختاری است (فصل 6).

سری رتبه‌بندی‌شده فهرستی از واحدهای فردی جمعیت به ترتیب صعودی (نزولی) صفت مورد مطالعه است.

در زیر اطلاعاتی در مورد بانک های بزرگ سن پترزبورگ، رتبه بندی شده بر اساس سرمایه سهام تا 1999/01/10 آمده است.

نام سرمایه سهام بانک، میلیون روبل

بانک بالتونکسیم 169

بانک سن پترزبورگ 237

پتروفسکی 268

بالتیک 290

Promstroybank 1007

اگر تعداد واحدهای جمعیتی به اندازه کافی زیاد باشد، سری رتبه بندی شده دست و پا گیر می شود و ساخت آن، حتی با کمک کامپیوتر، زمان زیادی می برد. در چنین مواردی، سری تغییرات با گروه بندی واحدهای جمعیت بر اساس مقادیر صفت مورد مطالعه ساخته می شود.

تعیین تعداد گروه ها

تعداد گروه ها در یک سری تغییرات گسسته با تعداد مقادیر واقعی موجود مشخصه متغیر تعیین می شود. اگر این صفت مقادیر گسسته ای داشته باشد، اما تعداد آنها بسیار زیاد باشد (به عنوان مثال، تعداد دام ها در اول ژانویه سال در شرکت های مختلف کشاورزی می تواند از صفر تا ده ها هزار راس باشد)، سپس یک سری تغییرات بازه ای ساخته می شود. . یک سری تغییرات بازه‌ای نیز برای مطالعه ویژگی‌هایی ساخته شده است که می‌توانند هر عدد صحیح و کسری را در ناحیه وجود خود بگیرند. به عنوان مثال، سودآوری محصولات فروخته شده، هزینه یک واحد تولید، درآمد به ازای هر ساکن شهر، نسبت افراد دارای تحصیلات عالی در میان جمعیت مناطق مختلف و به طور کلی تمام ویژگی های ثانویه، ارزش ها هستند. که با تقسیم مقدار یک مشخصه اولیه بر مقدار دیگری محاسبه می شود (به فصل 3 مراجعه کنید).

سری تغییرات بازه ای جدولی است متشکل از دو ستون (یا ردیف) - فواصل صفت که تغییرات آن در حال مطالعه است و تعداد واحدهای جمعیت که در این بازه (فرکانس ها) قرار می گیرند یا نسبت این تعداد از کل جمعیت (فرکانس ها).

دو نوع سری تغییرات بازه ای بیشتر مورد استفاده قرار می گیرند: فاصله مساوی و فرکانس مساوی. اگر تغییر صفت خیلی قوی نباشد، از سری با فاصله مساوی استفاده می شود. برای یک جمعیت همگن که توزیع آن بر اساس یک صفت معین نزدیک به قانون عادی است. (چنین سری در جدول 5.6 ارائه شده است.) اگر تنوع ویژگی بسیار قوی باشد، اما توزیع نرمال نیست، اما، برای مثال، هذلولی باشد (جدول 5.5) از یک سری فرکانس مساوی استفاده می شود.

هنگام ساخت یک سری با فاصله مساوی، تعداد گروه ها به گونه ای انتخاب می شود که تنوع مقادیر صفت در مجموع به اندازه کافی منعکس شود و در عین حال، نظم توزیع، شکل آن به طور تصادفی تحریف نشود. نوسانات فرکانس اگر گروه‌ها خیلی کم باشند، هیچ الگوی تنوع وجود نخواهد داشت. اگر گروه‌ها خیلی زیاد باشند، جهش‌های فرکانس تصادفی شکل توزیع را مخدوش می‌کند.


مرزهای بازه ها را می توان به روش های مختلفی مشخص کرد: مرز بالایی بازه قبلی، مرز پایینی فاصله بعدی را تکرار می کند، همانطور که در جدول نشان داده شده است. 5.5 یا تکرار نمی شود.

در مورد دوم، فاصله دوم به عنوان 15.1-20 تعیین می شود، سوم - به عنوان 20.1-25، و غیره، یعنی. فرض بر این است که تمام مقادیر بازدهی لزوماً به یک دهم گرد می شوند. علاوه بر این، یک عارضه نامطلوب با وسط فاصله 15.1-20 ایجاد می شود، که، به طور دقیق، در حال حاضر برابر با 17.5 نیست، بلکه 17.55 خواهد بود. بر این اساس، هنگام جایگزینی فاصله گرد شده 40-60 با 40.1-60، به جای مقدار گرد شده 50 وسط آن، 50.5 می گیریم. بنابراین، ترجیح داده می شود که فواصل با یک مرز گرد تکرار شونده باقی بماند و توافق شود که واحدهای جمعیتی که مقدار مشخصه ای برابر با مرز فاصله دارند در بازه ای که این مقدار دقیق برای اولین بار گزارش می شود، لحاظ شود. به این ترتیب مزرعه ای با عملکرد 15 سنت در هکتار در گروه اول، ارزش 20 سنت در هکتار در گروه دوم و غیره قرار می گیرد.

یک سری متغیر با فرکانس مساوی با یک تنوع بسیار قوی از یک صفت ضروری است زیرا با توزیع فاصله مساوی، اکثر واحدهای جمعیت

جدول 5.5

توزیع 100 بانک روسی بر اساس ارزیابی مانده دارایی ها از 01.01.2000

مرزهای فواصل برای توزیع مساوی مقادیر واقعی دارایی های بانک های اول، دهم، یازدهم، بیستم و غیره است.

نمایش گرافیکی سری تغییرات

کمک قابل توجهی در تجزیه و تحلیل سری تغییرات و ویژگی های آن توسط یک نمایش گرافیکی ارائه می شود. سری بازه ها با یک نمودار میله ای نشان داده می شود که در آن پایه های میله های واقع در محور آبسیسا فواصل مقادیر ویژگی متغیر هستند و ارتفاع میله ها فرکانس های مربوط به مقیاس در امتداد محور y یک نمایش گرافیکی از توزیع مزارع در منطقه از نظر عملکرد غلات در شکل 1 نشان داده شده است. 5.1. نموداری از این نوع اغلب هیستوگرام (gr. histos - بافت) نامیده می شود.

داده های جدول 5.6 و شکل. 5.1 شکل توزیع مشخصه بسیاری از صفات را نشان می دهد: مقادیر میانگین فواصل صفت رایج تر است، کمتر اوقات مقادیر شدید، کوچک و بزرگ صفت. شکل این توزیع به قانون توزیع نرمال در نظر گرفته شده در درس آمار ریاضی نزدیک است. ریاضیدان بزرگ روسی A. M. Lyapunov (1857-1918) ثابت کرد که طبیعی است.

جدول 5.6 توزیع مزارع در منطقه بر اساس عملکرد محصول غلات

یک توزیع کوچک زمانی تشکیل می شود که یک متغیر تحت تأثیر تعداد زیادی از عوامل قرار می گیرد که هیچ یک از آنها تأثیر غالب ندارند. ترکیب تصادفی بسیاری از عوامل تقریباً برابر که بر تغییرات عملکرد محصولات غلات، اعم از طبیعی و کشاورزی، اقتصادی تأثیر می‌گذارند، توزیعی از مزارع منطقه را بر اساس عملکرد نزدیک به قانون توزیع نرمال ایجاد می‌کند.

برنج. 5.2. انباشته و توزیع مزارع بر اساس عملکرد

به چنین مجموعه ای تجمعی می گویند. می توانید یک توزیع تجمعی "نه کمتر از" یا "بیشتر از" بسازید. در مورد اول، نمودار توزیع تجمعی تجمعی نامیده می شود، در مورد دوم - ogive (شکل 5.2).

چگالی توزیع

اگر باید با یک سری متغیر با فواصل نامساوی برخورد کنید، برای مقایسه باید فرکانس یا فرکانس را به واحد بازه بیاورید. نسبت حاصل را چگالی توزیع می نامند:

چگالی توزیع هم برای محاسبه شاخص های تعمیم دهنده و هم برای نمایش گرافیکی سری های تغییرات با فواصل نامساوی استفاده می شود.

مقالات مشابه

parki48.ru 2022. ما در حال ساخت یک خانه قاب هستیم. محوطه سازی. ساخت و ساز. پایه.