විසඳුම සමඟ එක්සෙල් උදාහරණයේ බහු ප්‍රතිගාමී වීම. එක්සෙල් හි රේඛීය නොවන ප්‍රතිගාමීත්වය

ඇඩෝනය භාවිතයෙන් සංඛ්‍යාන දත්ත සැකසීම ද සිදු කළ හැක විශ්ලේෂණ පැකේජය(රූපය 62).

යෝජිත අයිතම වලින්, අයිතමය තෝරන්න " පසුබෑම” සහ වම් මූසික බොත්තම සමඟ එය මත ක්ලික් කරන්න. ඊළඟට, හරි ක්ලික් කරන්න.

රූපයේ දැක්වෙන කවුළුව. 63.

විශ්ලේෂණ මෙවලම " පසුබෑම» ක්‍රමය භාවිතා කරමින් නිරීක්ෂණ සමූහයක් සඳහා ප්‍රස්ථාරයක් සවි කිරීමට භාවිතා කරයි අවම වශයෙන් වර්ග. ස්වාධීන විචල්‍ය එකක හෝ වැඩි ගණනක අගයන්හි තනි යැපෙන විචල්‍යයක බලපෑම විශ්ලේෂණය කිරීමට ප්‍රතිගාමීත්වය භාවිතා කරයි. නිදසුනක් වශයෙන්, මලල ක්‍රීඩකයෙකුගේ මලල ක්‍රීඩා කාර්ය සාධනය වයස, උස සහ බර ඇතුළු සාධක කිහිපයකින් බලපායි. මලල ක්‍රීඩකයෙකුගේ කාර්ය සාධනය කෙරෙහි මෙම එක් එක් සාධක තුනේ බලපෑමේ තරම ගණනය කළ හැකි අතර පසුව ලබාගත් දත්ත වෙනත් ක්‍රීඩකයෙකුගේ දක්‍ෂතාවය පුරෝකථනය කිරීමට භාවිතා කරයි.

Regression මෙවලම ශ්‍රිතය භාවිතා කරයි LINEST.

REGRESS සංවාද කොටුව

ලේබල් ආදාන පරාසයේ පළමු පේළියේ හෝ පළමු තීරුවේ මාතෘකා තිබේ නම් තේරීම් කොටුව තෝරන්න. ශීර්ෂ නොමැති නම් මෙම සලකුණු කොටුව හිස් කරන්න. මෙම අවස්ථාවෙහිදී, ප්රතිදාන වගු දත්ත සඳහා සුදුසු ශීර්ෂයන් ස්වයංක්රීයව ජනනය වේ.

විශ්වසනීයත්ව මට්ටම නිමැවුම් මුළු වගුවේ අතිරේක මට්ටමක් ඇතුළත් කිරීමට සලකුණු කොටුව තෝරන්න. සුදුසු ක්ෂේත්‍රය තුළ, පෙරනිමි 95% විශ්වාසනීය මට්ටමට අමතරව, ඔබට අයදුම් කිරීමට අවශ්‍ය විශ්වාස මට්ටම ඇතුළත් කරන්න.

නියත - ශුන්‍ය ප්‍රතිගාමී රේඛාව මූලාරම්භය හරහා ගමන් කිරීමට කොටුව සලකුණු කරන්න.

ප්‍රතිදාන පරාසය ප්‍රතිදාන පරාසයේ ඉහල වම් කොටුව වෙත යොමුවක් ඇතුලත් කරන්න. ප්‍රතිඵල ප්‍රතිදාන වගුව සඳහා අවම වශයෙන් තීරු හතක් වෙන් කරන්න, ඒවාට ඇතුළත් වනු ඇත: විචල්‍ය විශ්ලේෂණයේ ප්‍රතිඵල, සංගුණක, Y ගණනය කිරීමේ සම්මත දෝෂය, සම්මත අපගමනය, නිරීක්ෂණ සංඛ්යාව, සංගුණක සඳහා සම්මත දෝෂ.

නව වැඩ පත්‍රිකාව විවෘත කිරීමට ස්විචය මෙම ස්ථානයට සකසන්න නව කොළවැඩපොතෙහි A1 කොටුවෙන් ආරම්භ වන විශ්ලේෂණ ප්‍රතිඵල අලවන්න. අවශ්ය නම්, සුදුසු රේඩියෝ බොත්තම් ස්ථානයට විරුද්ධ ක්ෂේත්රයේ නව පත්රය සඳහා නමක් ඇතුළත් කරන්න.

නව වැඩපොත නව පත්‍රයකට ප්‍රතිඵල එක් කෙරෙන නව වැඩපොතක් සෑදීමට මෙම කොටුව සලකුණු කරන්න.

අවශේෂ ප්රතිදාන වගුවෙහි අවශේෂ ඇතුළත් කිරීමට සලකුණු කොටුව තෝරන්න.

ප්‍රමිතිගත අවශේෂ ප්‍රතිදාන වගුවේ ප්‍රමිතිගත අවශේෂ ඇතුළත් කිරීමට සලකුණු කොටුව තෝරන්න.

Residual Plot සෑම ස්වාධීන විචල්‍යයක් සඳහාම අවශේෂයන් සැලසුම් කිරීමට කොටුව සලකුණු කරන්න.

Fit Plot නිරීක්ෂිත අගයන්ට සාපේක්ෂව පුරෝකථනය කළ අගයන් සැලසුම් කිරීමට පිරික්සුම් කොටුව තෝරන්න.

සාමාන්‍ය සම්භාවිතා සැලැස්මසාමාන්‍ය සම්භාවිතාව සැලසුම් කිරීමට කොටුව සලකුණු කරන්න.

කාර්යය LINEST

ගණනය කිරීම් සිදු කිරීම සඳහා, කර්සරය සමඟ සාමාන්‍ය අගය පෙන්වීමට අවශ්‍ය කොටුව තෝරා යතුරු පුවරුවේ = යතුර ඔබන්න. ඊළඟට, නම ක්ෂේත්රයේ, උදාහරණයක් ලෙස, අපේක්ෂිත කාර්යය සඳහන් කරන්න සාමාන්ය(රූපය 22).

කාර්යය LINESTසරල රේඛාවක් ගණනය කිරීම සඳහා අවම වර්ග ක්‍රමය භාවිතා කරමින් ශ්‍රේණියක් සඳහා සංඛ්‍යාලේඛන ගණනය කරයි හොඳම මාර්ගයලබා දී ඇති දත්ත ආසන්න කර පසුව ලැබෙන රේඛාව විස්තර කරන අරාවක් ලබා දෙයි. ඔබට කාර්යය ඒකාබද්ධ කළ හැකිය LINESTබහුපද, ලඝුගණක, ඝාතීය, සහ ඇතුළුව නොදන්නා පරාමිතිවල රේඛීය වන (නොදන්නා පරාමිති රේඛීය වන) වෙනත් ආකාරයේ ආකෘති ගණනය කිරීමට වෙනත් කාර්යයන් සමඟ බල මාලාව. අගයන් මාලාවක් ආපසු ලැබෙන නිසා, ශ්‍රිතය අරා සූත්‍රයක් ලෙස සඳහන් කළ යුතුය.

සරල රේඛාවක් සඳහා සමීකරණය වේ ඊළඟ දර්ශනය:

y=m 1 x 1 +m 2 x 2 +…+b (x අගයන් පරාසයන් කිහිපයකදී),

එහිදී යැපෙන අගය y ස්වාධීන අගය x හි ශ්‍රිතයක් වන අතර, m යනු එක් එක් ස්වාධීන විචල්‍යයට අනුරූප වන සංගුණක වන අතර b යනු නියතයකි. y, x සහ m දෛශික විය හැකි බව සලකන්න. කාර්යය LINESTඅරාවක් (mn;mn-1;...;m 1 ;b) ලබා දෙයි. LINESTඅමතර ප්‍රතිගාමී සංඛ්‍යාලේඛන ද ආපසු ලබා දිය හැක.

LINEST(දන්නා_y-වටිනාකම්; දන්නා_x-අගය; අසමාන; සංඛ්‍යාලේඛන)

දන්නා_y අගයන් - y=mx+b සම්බන්ධය සඳහා දැනටමත් දන්නා y අගයන් සමූහයකි.

දන්නා_y අරාවට එක් තීරුවක් තිබේ නම්, දන්නා_x අරාවේ සෑම තීරුවක්ම වෙනම විචල්‍යයක් ලෙස අර්ථ දැක්වේ.

දන්නා_y හි අරාවට එක් පේළියක් තිබේ නම්, දන්නා_x අරාවේ සෑම පේළියක්ම වෙනම විචල්‍යයක් ලෙස අර්ථ දැක්වේ.

දන්නා_x අගයන් - y=mx+b සම්බන්ධය සඳහා දැනටමත් දන්නා x අගයන්හි විකල්ප කට්ටලයකි.

දන්නා_x අරාවෙහි විචල්‍ය කට්ටල එකක් හෝ කිහිපයක් අඩංගු විය හැක. එක් විචල්‍යයක් පමණක් භාවිතා කරන්නේ නම්, arrays_known_y_values ​​සහ known_x_values ​​ඕනෑම හැඩයකින් යුක්ත විය හැක - ඒවාට එකම මානය ඇති තාක් කල්. විචල්‍ය එකකට වඩා භාවිතා කරන්නේ නම්, දන්නා_y දෛශිකයක් විය යුතුය (එනම් පේළියක් උස හෝ තීරු එක පළල).

array_known_x ඉවත් කර ඇත්නම්, මෙම array (1;2;3;...) array_known_y ප්‍රමාණයට සමාන යැයි උපකල්පනය කෙරේ.

Const යනු b නියතය 0 වීමට අවශ්‍යද යන්න සඳහන් කරන boolean අගයකි.

"const" තර්කය සත්‍ය නම් හෝ මඟ හැර තිබේ නම්, b නියතය සාමාන්‍යයෙන් ඇගයීමට ලක් කෙරේ.

"const" තර්කය අසත්‍ය නම්, b හි අගය 0 ලෙස උපකල්පනය කරනු ලබන අතර m හි අගයන් y=mx සම්බන්ධතාවය තෘප්තිමත් වන ආකාරයට තෝරා ගනු ලැබේ.

සංඛ්‍යාලේඛන යනු අමතර ප්‍රතිගාමී සංඛ්‍යාලේඛන ආපසු ලබා දිය යුතුද යන්න පෙන්නුම් කරන බූලියන් අගයකි.

සංඛ්‍යාලේඛන සත්‍ය නම්, LINEST අතිරේක ප්‍රතිගාමී සංඛ්‍යාලේඛන ලබා දෙයි. ආපසු ලබා දුන් අරාව මේ ආකාරයෙන් පෙනෙනු ඇත: (mn;mn-1;...;m1;b:sen;sen-1;...;se1;seb:r2;sey:F;df:ssreg;ssresid).

සංඛ්‍යාලේඛන අසත්‍ය නම් හෝ මඟ හැර තිබේ නම්, LINEST ලබා දෙන්නේ සංගුණක m සහ නියත b පමණි.

අතිරේක ප්‍රතිගාමී සංඛ්‍යාලේඛන. (වගුව 17)

වටිනාකම විස්තර
se1,se2,...,sen සංගුණක m1,m2,...,mn සඳහා සම්මත දෝෂ අගයන්.
seb නියත b සඳහා සම්මත දෝෂය ('const' අසත්‍ය නම් seb = #N/A).
r2 නිර්ණය කිරීමේ සංගුණකය. y හි සැබෑ අගයන් සරල රේඛා සමීකරණයෙන් ලබාගත් අගයන් සමඟ සැසඳේ; සැසඳීමේ ප්‍රතිඵල මත පදනම්ව, නිර්ණය කිරීමේ සංගුණකය ගණනය කරනු ලැබේ, 0 සිට 1 දක්වා සාමාන්‍යකරණය වේ. එය 1 ට සමාන නම්, ආකෘතිය සමඟ සම්පූර්ණ සහසම්බන්ධයක් ඇත, එනම් සැබෑ සහ ඇස්තමේන්තුගත අගයන් අතර වෙනසක් නොමැත y හි. එසේ නොමැති නම්, නියතිවාදයේ සංගුණකය 0 නම්, y අගයන් පුරෝකථනය කිරීමට ප්‍රතිගාමී සමීකරණය භාවිතා කිරීමෙන් පලක් නැත. ලබා ගැනීම සඳහා අමතර තොරතුරු r2 ගණනය කිරීමේ ක්‍රම සඳහා, මෙම කොටසේ අවසානයේ ඇති "Remarks" බලන්න.
සේයි y ඇස්තමේන්තුව සඳහා සම්මත දෝෂය.
එෆ් F-සංඛ්‍යාන හෝ F-නිරීක්ෂිත අගය. යැපුම් සහ ස්වාධීන විචල්‍යයන් අතර නිරීක්ෂිත සම්බන්ධතාවයක් අහඹු ද යන්න තීරණය කිරීමට F සංඛ්‍යාලේඛනය භාවිතා කරයි.
ඩී එෆ් නිදහසේ උපාධි. සංඛ්‍යානමය වගුවක F-විවේචනාත්මක අගයන් සොයා ගැනීමට නිදහසේ උපාධි ප්‍රයෝජනවත් වේ. ආකෘතියේ විශ්වාසනීය මට්ටම තීරණය කිරීම සඳහා, ඔබ වගුවේ ඇති අගයන් LINEST විසින් ආපසු ලබා දෙන F-සංඛ්‍යාලේඛන සමඟ සැසඳිය යුතුය. df ගණනය කිරීම පිළිබඳ වැඩි විස්තර සඳහා මෙම කොටසේ අවසානයේ ඇති "Remarks" බලන්න. පහත උදාහරණ 4 F සහ df භාවිතය පෙන්වයි.
ssreg වර්ගවල ප්‍රතිගාමී එකතුව.
ssresid වර්ගවල අවශේෂ එකතුව. ssreg සහ ssresid ගණනය කිරීම පිළිබඳ වැඩි විස්තර සඳහා, මෙම කොටසේ අවසානයේ ඇති "Remarks" බලන්න.

පහත රූපයේ දැක්වෙන්නේ අතිරේක ප්‍රතිගාමී සංඛ්‍යාලේඛන ආපසු ලබා දෙන අනුපිළිවෙලයි (රූපය 64).

සටහන්:

ඕනෑම සරල රේඛාවක් එහි බෑවුම සහ y-අක්ෂය සමඟ ඡේදනය වීමෙන් විස්තර කළ හැකිය:

බෑවුම (m): රේඛාවක බෑවුම තීරණය කිරීම සඳහා, සාමාන්යයෙන් m මගින් දක්වනු ලැබේ, ඔබ රේඛාව මත ලකුණු දෙකක් ගත යුතුය (x 1 ,y 1) සහ (x 2 ,y 2); බෑවුම (y 2 -y 1) / (x 2 -x 1) ට සමාන වේ.

Y-ඡේදනය (b): රේඛාවක y-ඡේදනය, සාමාන්යයෙන් b මගින් දක්වනු ලැබේ, රේඛාව y-අක්ෂය ඡේදනය වන ලක්ෂ්යය සඳහා වන y අගයයි.

සරල රේඛා සමීකරණයට y=mx+b ආකෘතිය ඇත. m සහ b හි අගයන් දන්නේ නම්, රේඛාවේ ඕනෑම ලක්ෂ්‍යයක් y හෝ x හි අගයන් සමීකරණයට ආදේශ කිරීමෙන් ගණනය කළ හැකිය. ඔබට TREND කාර්යයද භාවිතා කළ හැක.

x ස්වාධීන විචල්‍යයක් පමණක් තිබේ නම්, ඔබට පහත සූත්‍ර භාවිතා කර බෑවුම සහ y-අන්තර්ශනය සෘජුවම ලබා ගත හැක:

බෑවුම: INDEX(LINEST(දන්නා_y's, known_x's), 1)

Y-අන්තරාවර්තනය: INDEX(LINEST(දන්නා_y's, දන්නා_x's), 2)

LINEST ශ්‍රිතය මගින් ගණනය කරන ලද සරල රේඛාව භාවිතයෙන් ආසන්නයේ නිරවද්‍යතාවය දත්ත විසිරීමේ ප්‍රමාණය මත රඳා පවතී. දත්ත සරල රේඛාවකට සමීප වන තරමට, LINEST විසින් භාවිතා කරන ආකෘතිය වඩාත් නිවැරදි වේ. LINEST ශ්‍රිතය දත්ත වලට හොඳම ගැළපීම තීරණය කිරීමට අවම කොටු ක්‍රමය භාවිත කරයි. එක් ස්වාධීන විචල්‍යයක් පමණක් ඇති විට x, m සහ b පහත සූත්‍ර භාවිතයෙන් ගණනය කෙරේ:

මෙහි x සහ y යනු නියැදි අදහස් වේ, උදාහරණයක් ලෙස x = AVERAGE(දන්නා_x's) සහ y = AVERAGE(known_y's).

LINEST සහ LGRFPRIBL සුදුසු ශ්‍රිතවලට දත්තවලට වඩාත් ගැලපෙන සෘජු හෝ ඝාතීය වක්‍රයක් ගණනය කළ හැක. කෙසේ වෙතත්, ගැටලුව විසඳීම සඳහා වඩාත් සුදුසු ප්‍රතිඵල දෙකෙන් කුමන ප්‍රශ්නයටද ඔවුන් පිළිතුරු නොදේ. ඔබට සරල රේඛාවක් සඳහා TREND(දන්නා_y-අගය; දන්නා_x-අගය) ශ්‍රිතය හෝ ඝාතීය වක්‍රයක් සඳහා GROWTH(දන්නා_y-අගය; දන්නා_x-අගය) ශ්‍රිතය ගණනය කළ හැක. මෙම ශ්‍රිත, new_x_values ​​තර්කයෙන් ඉවත් කර ඇත්නම්, සරල රේඛාවකට හෝ වක්‍රයට අනුව සත්‍ය x අගයන් සඳහා ගණනය කළ y අගයන් අරාවක් ආපසු ලබා දෙන්න. එවිට ඔබට ගණනය කළ අගයන් සැබෑ අගයන් සමඟ සැසඳිය හැක. ඔබට දෘශ්‍ය සංසන්දනය සඳහා ප්‍රස්ථාර ද ගොඩනගා ගත හැකිය.

ප්‍රතිගාමී විශ්ලේෂණයක් කිරීමෙන්, Microsoft Excelඑක් එක් ලක්ෂ්‍යය සඳහා, පුරෝකථනය කළ y අගය සහ සත්‍ය y අගය අතර වෙනසෙහි වර්ග ගණනය කරයි. මෙම වර්ග වෙනස්කම්වල එකතුව වර්ගවල අවශේෂ එකතුව (ssresid) ලෙස හැඳින්වේ. මයික්‍රොසොෆ්ට් එක්සෙල් පසුව මුළු වර්ග එකතුව (sstotal) ගණනය කරයි. const = TRUE නම් හෝ මෙම තර්කය නිශ්චිතව දක්වා නොමැති නම්, මුළු වර්ග එකතුව සැබෑ y අගයන් සහ මධ්‍යන්‍ය y අගයන්හි වර්ග වෙනස්කම්වල එකතුවට සමාන වේ. const = FALSE නම්, වර්ගවල එකතුව සැබෑ y අගයන්හි වර්ගවල එකතුවට සමාන වේ (y ප්‍රමාණයෙන් මධ්‍යන්‍ය y අඩු කිරීමකින් තොරව). ඊට පසු, වර්ගවල ප්‍රතිගාමී එකතුව පහත පරිදි ගණනය කළ හැක: ssreg = sstotal - ssresid. වර්ගවල අවශේෂ එකතුව කුඩා වන තරමට, ප්‍රතිගාමී විශ්ලේෂණය භාවිතයෙන් ලබාගත් සමීකරණය විචල්‍යයන් අතර සම්බන්ධතා කෙතරම් හොඳින් පැහැදිලි කරයිද යන්න පෙන්නුම් කරන නිර්ණායක r2 සංගුණකයේ අගය විශාල වේ. සංගුණකය r2 ssreg/sstotal ට සමාන වේ.

සමහර අවස්ථා වලදී, X තීරු එකක් හෝ කිහිපයක් (Y සහ X අගයන් තීරු වල ඇතැයි උපකල්පනය කරයි) වෙනත් X තීරු වල අතිරේක අනාවැකි අගයක් නොමැත. වෙනත් වචන වලින් කිවහොත්, X තීරු එකක් හෝ කිහිපයක් මකා දැමීමෙන් Y අගයන් ඇති විය හැක. එකම නිරවද්යතාවයකින් ගණනය කර ඇත. මෙම අවස්ථාවෙහිදී, අතිරික්ත X තීරු ප්‍රතිගාමී ආකෘතියෙන් බැහැර කරනු ලැබේ. X හි අතිරික්ත තීරු අතිරික්ත නොවන තීරු කිහිපයක එකතුවක් ලෙස නිරූපණය කළ හැකි නිසා මෙම සංසිද්ධිය "Colinarity" ලෙස හැඳින්වේ. LINEST සහසම්බන්ධතාවය සඳහා පරීක්‍ෂා කරන අතර ප්‍රතිගාමී ආකෘතියෙන් අනවශ්‍ය X තීරු කිසිවක් සොයා ගන්නේ නම් ඉවත් කරයි. ඉවත් කරන ලද X තීරු LINEST ප්‍රතිදානයේ 0 ගුණයකින් සහ se අගය 0කින් හඳුනාගත හැක. අතිරික්තයක් ලෙස තීරු එකක් හෝ කිහිපයක් ඉවත් කිරීම df හි අගය වෙනස් කරයි මන්ද එය අනාවැකි අරමුණු සඳහා සැබවින්ම භාවිතා කරන X තීරු ගණන මත රඳා පවතී. df ගණනය කිරීම පිළිබඳ වැඩි විස්තර සඳහා පහත උදාහරණ 4 බලන්න. අතිරික්ත තීරු ඉවත් කිරීම නිසා df වෙනස් වන විට, sey සහ F හි අගයන් ද වෙනස් වේ. collinearity භාවිතා කිරීම බොහෝ විට නිර්දේශ නොකරයි. කෙසේ වෙතත්, සමහර X තීරු වල 0 හෝ 1 අඩංගු නම් එය භාවිතා කළ යුත්තේ අත්හදා බැලීමේ විෂය වෙනම කණ්ඩායමකද යන්න පෙන්නුම් කරන දර්ශකයක් ලෙසය. const = TRUE නම් හෝ මෙම තර්කය නිශ්චිතව දක්වා නොමැති නම්, ඡේදනය වීමේ ලක්ෂ්‍යය අනුකරණය කිරීමට LINEST අමතර X තීරුවක් ඇතුල් කරයි. පිරිමි සඳහා 1 සහ ගැහැණු සඳහා 0 අගයන් සහිත තීරුවක් තිබේ නම්, සහ ගැහැණු සඳහා 1 සහ පිරිමි සඳහා 0 අගයන් සහිත තීරුවක් තිබේ නම්, අවසාන තීරුව ඉවත් කරනු ලබන්නේ එහි අගයන් ලබා ගත හැකි බැවිනි. "පිරිමි දර්ශකය" තීරුව.

සහසම්බන්ධතාවය හේතුවෙන් X තීරු ආකෘතියෙන් ඉවත් නොකළ අවස්ථා සඳහා df ගණනය කිරීම පහත පරිදි වේ: k දන්නා_x තීරු සහ const = සත්‍ය හෝ නිශ්චිතව දක්වා නොමැති නම්, df = n - k - 1. const = FALSE නම්, එවිට df = n -k. අවස්ථා දෙකේදීම, සහසම්බන්ධතාවය හේතුවෙන් X තීරු ඉවත් කිරීම df හි අගය 1 කින් වැඩි කරයි.

අරාව ආපසු ලබා දෙන සූත්‍ර අරා සූත්‍ර ලෙස ඇතුළත් කළ යුතුය.

දන්නා_x_values ​​තර්කයක් ලෙස නියත අරාවක් ඇතුළු කරන විට, උදාහරණයක් ලෙස, එකම රේඛාවේ අගයන් වෙන් කිරීමට අර්ධ කෝලයක් සහ රේඛා වෙන් කිරීමට තීරුවක් භාවිතා කරන්න. පාලක පැනලයේ "භාෂාව සහ ප්‍රමිති" කවුළුවේ ඇති සැකසුම් අනුව බෙදුම් අක්ෂර වෙනස් විය හැක.

ප්‍රතිගාමී සමීකරණය මගින් පුරෝකථනය කරන ලද y අගයන් සමීකරණය නිර්වචනය කිරීමට භාවිතා කරන ලද y අගයන් පරාසයෙන් පිටත නම් ඒවා නිවැරදි නොවිය හැකි බව සලකන්න.

කාර්යයේ භාවිතා කරන ප්රධාන ඇල්ගොරිතමය LINEST, කාර්යයන්හි ප්රධාන ඇල්ගොරිතමයෙන් වෙනස් වේ ආනතියහා රේඛා කොටස. ඇල්ගොරිතම අතර ඇති වෙනස්කම් අවිනිශ්චිත සහ collinear දත්ත සඳහා විවිධ ප්රතිඵලවලට හේතු විය හැක. උදාහරණයක් ලෙස, දන්නා_y තර්කයේ දත්ත ලක්ෂ්‍ය 0 සහ දන්නා_x තර්කයේ දත්ත ලක්ෂ්‍ය 1 නම්, එවිට:

කාර්යය LINEST 0. ක්‍රියාකාරී ඇල්ගොරිතමයට සමාන අගයක් ලබා දෙයි LINEST collinear දත්ත සඳහා සුදුසු අගයන් ලබා දීමට භාවිතා කරයි, සහ in මෙම නඩුවඅවම වශයෙන් එක් පිළිතුරක් සොයාගත හැකිය.

SLOPE සහ INTERCEPT ශ්‍රිත #DIV/0! දෝෂය ලබා දෙයි. SLOPE සහ INTERCEPT ශ්රිතවල ඇල්ගොරිතම එක් පිළිතුරක් පමණක් සොයා ගැනීමට භාවිතා කරන අතර, මෙම අවස්ථාවෙහිදී කිහිපයක් තිබිය හැක.

වෙනත් ආකාරයේ ප්‍රතිගාමීත්වයන් සඳහා සංඛ්‍යාලේඛන ගණනය කිරීමට අමතරව, LINEST සඳහා x සහ y විචල්‍යවල ශ්‍රිතයන් x සහ y විචල්‍ය ශ්‍රේණියක් ලෙස ඇතුළත් කිරීමෙන් වෙනත් ප්‍රතිගාමීත්වයන් සඳහා පරාස ගණනය කිරීමට LINEST භාවිතා කළ හැක. උදාහරණයක් ලෙස, පහත සූත්රය:

LINEST(y-අගය, x-අගය^COLUMN($A:$C))

පහත දැක්වෙන පෝරමයේ ඝනක ආසන්නයක් (3වන අංශක බහුපදයක්) ගණනය කිරීම සඳහා Y අගයන් එක් තීරුවක් සහ X අගයන් එක් තීරුවක් සමඟ ක්‍රියා කරයි:

y=m 1 x+m 2 x 2 +m 3 x 3 +b

වෙනත් ආකාරයේ ප්‍රතිගාමී ගණනය කිරීම් සඳහා සූත්‍රය වෙනස් කළ හැකිය, නමුත් සමහර අවස්ථාවල ප්‍රතිදාන අගයන් සහ වෙනත් සංඛ්‍යාලේඛන සඳහා ගැලපීම් අවශ්‍ය වේ.

විශ්ලේෂණයමයික්‍රොසොෆ්ට් එක්සෙල් හි - ව්‍යාපාර බුද්ධි ක්ෂේත්‍රයේ ප්‍රතිගාමී විශ්ලේෂණ ගැටළු විසඳීම සඳහා MS Excel භාවිතා කිරීම සඳහා වඩාත් පුළුල් මාර්ගෝපදේශය. Konrad Carlberg න්‍යායික ගැටළු ප්‍රවේශ විය හැකි ආකාරයෙන් පැහැදිලි කරයි, ඒ පිළිබඳ දැනුම ඔබට බොහෝ වැරදි වළක්වා ගැනීමට උපකාරී වනු ඇත. ස්වයං හැසිරීමප්‍රතිගාමී විශ්ලේෂණය, සහ වෙනත් පුද්ගලයින් විසින් සිදු කරන ලද විශ්ලේෂණවල ප්‍රතිඵල ඇගයීමේදී. සිට සියලුම ද්රව්ය සරල සහසම්බන්ධතාසහ බහු සහකාර විශ්ලේෂණ සඳහා t-පරීක්ෂණ, මත පදනම්ව සැබෑ උදාහරණසහ අදාළ පියවරෙන් පියවර ක්රියා පටිපාටි පිළිබඳ සවිස්තරාත්මක විස්තරයක් සමඟ ඇත.

ඒ හා බැඳුනු ලක්ෂණ සහ ප්‍රතිවිරෝධතා ගැන පොත සාකච්ඡා කරයි Excel කාර්යයන්ප්‍රතිගාමීත්වය සමඟ වැඩ කිරීමට, ඒවායේ එක් එක් විකල්පයන් සහ එක් එක් තර්කය භාවිතා කිරීමේ ප්‍රතිවිපාක සාකච්ඡා කරන අතර ප්‍රතිගාමී ක්‍රම වඩාත් විශ්වාසදායක ලෙස යෙදිය යුතු ආකාරය පැහැදිලි කරයි විවිධ ප්රදේශ, වෛද්ය පර්යේෂණ සිට මූල්ය විශ්ලේෂණය දක්වා.

කොන්රාඩ් කාල්බර්ග්. Microsoft Excel හි ප්‍රතිගාමී විශ්ලේෂණය. - එම්.: ඩයලෙක්ටික්, 2017. - 400 පි.

බාගත සටහන හෝ ආකෘතියෙන්, ආකෘතියෙන් උදාහරණ

පරිච්ඡේදය 1. දත්ත විචල්‍යතාව ඇස්තමේන්තු කිරීම

සංඛ්‍යාලේඛනඥයින් සතුව විචලනය (විචල්‍යතාවය) පිළිබඳ බොහෝ දර්ශක තිබේ. ඒවායින් එකක් වන්නේ මධ්‍යන්‍යයේ සිට තනි අගයන්හි වර්ග අපගමනයන්හි එකතුවයි. Excel මේ සඳහා SQUADROT() ශ්‍රිතය භාවිතා කරයි. නමුත් බොහෝ විට විසරණය භාවිතා වේ. විචලනය යනු අපගමනයන්හි වර්ගවල මධ්‍යන්‍යය වේ. විචලනය අධ්‍යයනයට භාජනය වන දත්ත කට්ටලයේ අගයන් ගණනට සංවේදී නොවේ (මිණුම් ගණන සමඟ වර්ග අපගමනයන්හි එකතුව වැඩි වන අතර).

Excel විචල්‍යයන් ලබා දෙන කාර්යයන් දෙකක් ඉදිරිපත් කරයි: VARP.D() සහ VARP.V():

  • පිරිසැකසුම් කළ යුතු අගයන් ජනගහනයක් සෑදෙන්නේ නම් VAR.G() ශ්‍රිතය භාවිතා කරන්න. එනම්, පරාසයේ අඩංගු අගයන් ඔබ උනන්දුවක් දක්වන එකම අගයන් වේ.
  • සැකසිය යුතු අගයන් විශාල ජනගහනයකින් නියැදියක් සාදනු ලබන්නේ නම් VAR.V() ශ්‍රිතය භාවිතා කරන්න. ඔබට විචලනය තක්සේරු කළ හැකි අමතර අගයන් ඇති බව උපකල්පනය කරයි.

මධ්යන්ය හෝ සහසම්බන්ධතා සංගුණකය වැනි අගයක් ගණනය කරන්නේ නම් ජනගහනය, එවිට එය පරාමිතියක් ලෙස හැඳින්වේ. නියැදියක පදනම මත ගණනය කරන ලද සමාන අගයක් සංඛ්‍යාලේඛනයක් ලෙස හැඳින්වේ. අපගමනය ගණනය කිරීම සාමාන්ය සිටමෙම කට්ටලය තුළ, ඔබ වෙනත් ඕනෑම අගයකින් ඒවා ගණන් කළාට වඩා කුඩා අගයක වර්ග අපගමනයන්හි එකතුව ඔබට ලැබෙනු ඇත. විසුරුම සඳහා සමාන ප්රකාශයක් සත්ය වේ.

නියැදි ප්‍රමාණය විශාල වන තරමට සංඛ්‍යාලේඛනයේ ගණනය කළ අගය වඩාත් නිවැරදි වේ. නමුත් සංඛ්‍යාලේඛනයේ අගය පරාමිතියේ අගයට සමාන බව ඔබට සහතික විය හැකි ජනගහනයේ ප්‍රමාණයට වඩා කුඩා නියැදියක් නොමැත.

ඔබ සතුව උස 100 ක කට්ටලයක් ඇති බව කියමු, එහි මධ්‍යන්‍ය ජනගහන මධ්‍යන්‍යයට වඩා වෙනස් වේ, වෙනස කුඩා වුවත්. ඔබ නියැදිය සඳහා විචලනය ගණනය කරන විට, ඔබට යම් අගයක් ලැබේ, 4 කියන්න. මෙම අගය නියැදි මධ්‍යන්‍ය හැර වෙනත් ඕනෑම අගයකින් වර්ධන අගයන් 100 න් එක් එක් අපගමනය ගණනය කිරීමෙන් ලබා ගත හැකි වෙනත් ඕනෑම අගයකට වඩා අඩුය. , සාමාන්‍ය ජනගහනය සඳහා සැබෑ මධ්‍යන්‍යය ඇතුළුව. එබැවින්, ගණනය කළ විචලනය වෙනස් වනු ඇත, සහ ඔබ කෙසේ හෝ දැනගෙන භාවිතා කළහොත් ඔබට ලැබෙන විචල්‍යතාවයෙන් තරමක් දුරට, නියැදි මධ්‍යන්‍යය නොව ජනගහන පරාමිතිය.

නියැදිය සඳහා තීරණය කර ඇති වර්ගවල මධ්‍යන්‍ය එකතුව ජනගහන විචලනය පිළිබඳ අඩු තක්සේරුවක් සපයයි. මේ ආකාරයෙන් ගණනය කරන ලද විචලනය ලෙස හැඳින්වේ අවතැන් වෙලාඇගයීම. පක්ෂග්‍රාහීත්වය තුරන් කිරීමට සහ අපක්ෂපාතී ඇස්තමේන්තුවක් ලබා ගැනීමට නම්, වර්ග අපගමන එකතුව බෙදීම ප්‍රමාණවත් නොවන බව පෙනේ. n, කොහෙද nනියැදි ප්රමාණය, සහ n - 1.

වටිනාකම n - 1නිදහසේ අංශක ගණන (සංඛ්‍යාව) ලෙස හැඳින්වේ. පවතිනවා විවිධ ක්රමමෙම අගය ගණනය කිරීම, ඒවා සියල්ලම නියැදි ප්‍රමාණයෙන් යම් සංඛ්‍යාවක් අඩු කිරීම හෝ නිරීක්ෂණ වැටෙන කාණ්ඩ ගණන ගණන් කිරීම ඇතුළත් වුවද.

DISP.G() සහ DISP.V() ශ්‍රිත අතර වෙනසෙහි සාරය පහත පරිදි වේ:

  • VARI.G() ශ්‍රිතයේ, වර්ගවල එකතුව නිරීක්ෂණ ගණනින් බෙදනු ලබන අතර එම නිසා විචලනයේ පක්ෂග්‍රාහී ඇස්තමේන්තුව, සත්‍ය මධ්‍යන්‍යය නියෝජනය කරයි.
  • VAR.B() ශ්‍රිතයේ, වර්ගවල එකතුව නිරීක්ෂණ ගණන 1 අඩුවෙන් බෙදනු ලැබේ, i.e. නියැදිය ලබා ගත් ජනගහනයේ විචලනය පිළිබඳ වඩාත් නිවැරදි, අපක්ෂපාතී තක්සේරුවක් ලබා දෙන නිදහසේ අංශක ගණන අනුව.

සම්මත අපගමනය (ඉංග්රීසි) සම්මත අපගමනය, SD) යනු විචලනයේ වර්ගමූලය වේ:

වර්ග අපගමනය මිනුම් පරිමාණය වෙනත් මෙට්‍රික් එකකට පරිවර්තනය කරයි, එය මුල් පිටපතේ වර්ග වේ: මීටර - තුළ වර්ග මීටර, ඩොලර් - වර්ග ඩොලර්, ආදිය. සම්මත අපගමනය යනු විචලනයේ වර්ගමූලය වන අතර, එය අපව මුල් ඒකක වෙත ආපසු ගෙන එයි. වඩාත් පහසු වන්නේ කුමක්ද.

ඔබ බොහෝ විට ගණන් කළ යුතුය සම්මත අපගමනයදත්ත යම් උපාමාරු වලට ලක් වූ පසු. මෙම අවස්ථා වලදී ප්රතිඵල නිසැකවම සම්මත අපගමනය වුවද, ඒවා සාමාන්යයෙන් හැඳින්වේ සම්මත දෝෂ. සම්මත මිනුම් දෝෂය, සමානුපාතිකයේ සම්මත දෝෂය සහ මධ්යන්යයේ සම්මත දෝෂය ඇතුළුව සම්මත දෝෂ වර්ග කිහිපයක් තිබේ.

ඔබ එක් එක් ප්‍රාන්ත 50 න් අහඹු ලෙස තෝරාගත් වැඩිහිටි පිරිමි 25 දෙනෙකුගේ උස පිළිබඳ දත්ත රැස් කරන බව කියමු. ඊළඟට, ඔබ එක් එක් ප්රාන්තයේ වැඩිහිටි පිරිමින්ගේ සාමාන්ය උස ගණනය කරන්න. ප්රතිඵලයක් වශයෙන් මධ්යන්ය අගයන් 50 නිරීක්ෂණ ලෙස සැලකිය හැකිය. මෙයින්, ඔබට ඔවුන්ගේ සම්මත අපගමනය ගණනය කළ හැකිය, එනම් මධ්යන්යයේ සම්මත දෝෂය. සහල්. 1. ප්‍රාන්ත 50 ක සාමාන්‍ය අගයන් බෙදා හැරීම සමඟ මුල් පුද්ගල අගයන් 1250 ක් (එක් එක් ප්‍රාන්ත 50 න් 25 දෙනෙකුගේ උස පිළිබඳ දත්ත) බෙදා හැරීමට ඔබට ඉඩ සලසයි. මධ්‍යන්‍යයේ සම්මත දෝෂය ඇස්තමේන්තු කිරීමේ සූත්‍රය (එනම් මාධ්‍යවල සම්මත අපගමනය, තනි නිරීක්ෂණ නොවේ):

මධ්යන්යයේ සම්මත දෝෂය කොහිද; sමුල් නිරීක්ෂණවල සම්මත අපගමනය වේ; nනියැදියේ නිරීක්ෂණ ගණන වේ.

සහල්. 1. ප්‍රාන්තයෙන් ප්‍රාන්තයට සාමාන්‍ය අගයන්හි විචලනය තනි නිරීක්ෂණවල විචලනයට වඩා බෙහෙවින් අඩුය

සංඛ්‍යානමය ප්‍රමාණ දැක්වීමට ග්‍රීක සහ ලතින් අකුරු භාවිතා කිරීම සම්බන්ධයෙන් සංඛ්‍යාලේඛනවල සම්මුතියක් ඇත. සාමාන්‍ය ජනගහනයේ පරාමිතීන් ග්‍රීක අක්ෂරවලින් සහ නියැදි සංඛ්‍යාලේඛන ලතින් අක්ෂරවලින් නම් කිරීම සිරිතකි. එබැවින්, අපි ජනගහනයේ සම්මත අපගමනය ගැන කතා කරන්නේ නම්, අපි එය σ ලෙස ලියන්නෙමු; නියැදියේ සම්මත අපගමනය සලකනු ලබන්නේ නම්, අපි s යන අංකනය භාවිතා කරමු. සාමාන්‍ය සඳහා සංකේත සම්බන්ධයෙන් ගත් කල, ඒවා එකිනෙකා සමඟ එතරම් එකඟ නොවේ. ජනගහන මධ්‍යන්‍යය ග්‍රීක අකුර μ මගින් දැක්වේ. කෙසේ වෙතත්, X̅ සංකේතය සාම්ප්‍රදායිකව නියැදි මධ්‍යන්‍යය නියෝජනය කිරීමට භාවිතා කරයි.

z-ස්කෝර්සම්මත අපගමනය ඒකකවල බෙදා හැරීමේ නිරීක්ෂණ තත්ත්වය ප්රකාශ කරයි. උදාහරණයක් ලෙස, z = 1.5 යන්නෙන් අදහස් වන්නේ නිරීක්‍ෂණය මධ්‍යන්‍යයේ සිට ඉහළ අගයන් දෙසට සම්මත අපගමනය 1.5 ක් වන බවයි. වාරය z-ස්කෝර්තනි ඇගයීම් සඳහා භාවිතා වේ, i.e. ආරෝපණය කරන ලද මිනුම් සඳහා තනි මූලද්රව්යසාම්පල. එවැනි සංඛ්යා ලේඛන සඳහා (උදාහරණයක් ලෙස, රාජ්ය සාමාන්යය), මෙම පදය භාවිතා වේ. z අගය:

මෙහි X̅ යනු නියැදියේ මධ්‍යන්‍ය අගය, μ යනු සාමාන්‍ය ජනගහනයේ මධ්‍යන්‍ය අගය, සාම්පල කට්ටලයේ මාධ්‍යයේ සම්මත දෝෂය වේ:

σ යනු සාමාන්‍ය ජනගහනයේ සම්මත දෝෂය (තනි පුද්ගල මිනුම්), nනියැදි ප්රමාණය වේ.

ඔබ ගොල්ෆ් උපදේශකයෙක් යැයි සිතන්න. ඔබට දිගු කාලයක් වර්ජන පරාසය මැනීමට හැකි වී ඇති අතර සාමාන්‍යය යාර 205ක් සහ සම්මත අපගමනය යාර 36ක් බව දැන ගන්න. ඔබට නව සමාජ ශාලාවක් පිරිනමා ඇත, එය ඔබගේ පරාසය යාර 10කින් වැඩි කරන බව පවසමින්. ඔබ මීළඟ ක්ලබ් යන 81 දෙනාගෙන්ම නව සමාජ ශාලාවක් සමඟ උත්සාහ කර ඔවුන්ගේ පරාසය වාර්තා කරන ලෙස ඉල්ලා සිටී. නව ක්ලබ් එකක් සමඟ වර්ජනයක සාමාන්‍ය පරාසය යාර 215 ක් බව පෙනී ගියේය. යාර 10 ක වෙනසක් (215 - 205) නියැදීමේ දෝෂයක් නිසා පමණක් ඇති වීමේ සම්භාවිතාව කුමක්ද? එසේත් නැතිනම් වෙනත් ආකාරයකින් කිවහොත්, විශාල පරීක්ෂණයකදී, නව සමාජයක් දැනට පවතින දිගුකාලීන සාමාන්‍ය යාර 205 ට සාපේක්ෂව පරාසයේ වැඩි වීමක් නොපෙන්වීමේ සම්භාවිතාව කුමක්ද?

z අගයක් ජනනය කිරීමෙන් අපට මෙය පරීක්ෂා කළ හැක. මධ්යන්යයේ සම්මත දෝෂය:

එවිට z අගය:

නියැදි මධ්‍යන්‍යය ජනගහන මධ්‍යන්‍යයෙන් 2.5σ දුරින් වීමේ සම්භාවිතාව අප සොයා ගත යුතුය. සම්භාවිතාව කුඩා නම්, වෙනස්කම් සිදුවන්නේ අහම්බෙන් නොව, නව සමාජ ශාලාවේ ගුණාත්මකභාවය මත ය. z-ස්කෝරයක සම්භාවිතාව තීරණය කිරීම සඳහා Excel හි සූදානම් කළ කාර්යයක් නොමැත. කෙසේ වෙතත්, ඔබට =1-NORM.ST.DIST(z-value, TRUE) සූත්‍රය භාවිතා කළ හැක, එහිදී NORM.ST.DIST() සාමාන්‍ය වක්‍රය යටතේ ඇති ප්‍රදේශය z අගයේ වම් පසට ලබා දෙයි (රූපය 2) .

සහල්. 2. NORM.S.DIST() ශ්‍රිතය වක්‍රය යටතේ ඇති ප්‍රදේශය z අගයේ වම් පසට ලබා දෙයි; පින්තූරයක් විශාල කිරීමට, එය මත දකුණු-ක්ලික් කර තෝරන්න රූපය නව ටැබයක විවෘත කරන්න

NORM.S.DIST() ශ්‍රිතයේ දෙවන තර්කයට අගයන් දෙකක් ගත හැක: සත්‍ය - ශ්‍රිතය වක්‍රය යටතේ ඇති ප්‍රදේශය පළමු තර්කයෙන් දක්වා ඇති ලක්ෂ්‍යයේ වමට ලබා දෙයි; FALSE - ශ්‍රිතය පළමු තර්කය මඟින් ලබා දෙන ලක්ෂ්‍යයේ වක්‍රයේ උස නැවත ලබා දෙයි.

ජනගහනයේ මධ්යන්ය (μ) සහ සම්මත අපගමනය (σ) නොදන්නේ නම්, t-අගය භාවිතා වේ (බලන්න). z- සහ t-score ව්‍යුහයන් වෙනස් වන්නේ නියැදි ප්‍රතිඵල වලින් ලබාගත් සම්මත අපගමනය s ජනගහන පරාමිතියේ දන්නා අගයට වඩා t-අගය සෙවීමට භාවිතා කරන බැවිනි. සාමාන්‍ය වක්‍රයට තනි හැඩයක් ඇති අතර, t-අගය බෙදා හැරීමේ හැඩය නිදහසේ df අංශක ගණන අනුව වෙනස් වේ (ඉංග්‍රීසියෙන්. නිදහසේ උපාධි) එය නියෝජනය කරන නියැදියේ. නියැදියේ නිදහසේ අංශක ගණන වේ n - 1, කොහෙද n- නියැදි ප්රමාණය (රූපය 3).

සහල්. 3. σ පරාමිතිය නොදන්නා විට පැන නගින t-බෙදාහැරීමේ හැඩය සාමාන්‍ය ව්‍යාප්තියේ හැඩයට වඩා වෙනස් වේ.

Excel හට t-distribution සඳහා ශ්‍රිත දෙකක් ඇත, එය Student's t-distribution ලෙසද හැඳින්වේ: STUDENT.DIST() වක්‍රය යටතේ ඇති ප්‍රදේශය ලබා දී ඇති t-අගයට වමට ද, STUDENT.DIST.RT() දකුණට ද ලබා දෙයි.

පරිච්ඡේදය 2. සහසම්බන්ධය

සහසම්බන්ධතාවය යනු ඇණවුම් කළ යුගල කට්ටලයක මූලද්‍රව්‍ය අතර පරායත්තතාවයේ මිනුමක් වේ. සහසම්බන්ධය සංලක්ෂිත වේ පියර්සන්ගේ සහසම්බන්ධතා සංගුණක– ආර්. සංගුණකය -1.0 සිට +1.0 දක්වා පරාසයක අගයන් ගත හැකිය.

කොහෙද එස් xහා එස් වයිවිචල්‍යවල සම්මත අපගමනය වේ xහා වයි, Sxy- සහජීවනය:

මෙම සූත්‍රයේ දී සහවිචල්‍යය විචල්‍යවල සම්මත අපගමනයෙන් බෙදනු ලැබේ xහා වයි, එමගින් covariance වෙතින් ඒකක ආශ්‍රිත පරිමාණ බලපෑම් ඉවත් කරයි. Excel භාවිතා කරන්නේ CORREL() ශ්‍රිතයයි. මෙම ශ්‍රිතයේ නමෙහි STDEV(), VARV(), හෝ COVARIANCE() වැනි ශ්‍රිතවල නම්වල භාවිතා වන G සහ C සුදුසුකම් ලත් මූලද්‍රව්‍ය අඩංගු නොවේ. නියැදි සහසම්බන්ධතා සංගුණකය පක්ෂග්‍රාහී ඇස්තමේන්තුවක් සපයන නමුත්, පක්ෂග්‍රාහී වීමට හේතුව විචලනය හෝ සම්මත අපගමනයට වඩා වෙනස් වේ.

සාමාන්‍ය සහසම්බන්ධතා සංගුණකයේ විශාලත්වය මත පදනම්ව (බොහෝ විට ග්‍රීක අකුරින් දැක්වේ ρ ), සහසම්බන්ධතා සංගුණකය ආර්නියැදි ප්‍රමාණය අඩුවීමත් සමඟ වැඩිවන පක්ෂග්‍රාහී බලපෑම සමඟ පක්ෂග්‍රාහී ඇස්තමේන්තුවක් ලබා දෙයි. එසේ වුවද, අපි මෙම නැඹුරුව නිවැරදි කිරීමට උත්සාහ නොකරමු, උදාහරණයක් ලෙස, සම්මත අපගමනය ගණනය කිරීමේදී අපි එය කළ ආකාරයටම, අපි අනුරූප සූත්‍රයට ආදේශ කළ විට නිරීක්ෂණ ගණන නොව නිදහසේ අංශක ගණන. යථාර්ථයේ දී, covariance ගණනය කිරීම සඳහා භාවිතා කරන නිරීක්ෂණ සංඛ්යාව විශාලත්වය මත බලපෑමක් නැත.

සම්මත සහසම්බන්ධතා සංගුණකය නිර්මාණය කර ඇත්තේ රේඛීය සම්බන්ධතාවයකින් එකිනෙකට සම්බන්ධ වන විචල්‍යයන් සමඟ භාවිතා කිරීමටය. දත්තවල රේඛීය නොවන සහ / හෝ දෝෂ පැවතීම (පිටස්තර) සහසම්බන්ධතා සංගුණකය වැරදි ලෙස ගණනය කිරීමට හේතු වේ. දත්ත ගැටළු හඳුනා ගැනීම සඳහා විසිරුම් බිම් නිර්දේශ කරනු ලැබේ. තිරස් සහ සිරස් අක්ෂ දෙකම අගය අක්ෂ ලෙස සලකන Excel හි ඇති එකම ප්‍රස්ථාර වර්ගය මෙයයි. අනෙක් අතට, රේඛා ප්‍රස්ථාරය, දත්තවල පින්තූරය විකෘති කරන කාණ්ඩයේ අක්ෂය ලෙස තීරු වලින් එකක් අර්ථ දක්වයි (රූපය 4).

සහල්. 4. ප්‍රතිගාමී රේඛා සමාන බව පෙනේ, නමුත් ඒවායේ සමීකරණ එකිනෙකා සමඟ සංසන්දනය කරන්න

රේඛා ප්‍රස්ථාරය තැනීමට භාවිතා කරන නිරීක්ෂණ තිරස් අක්ෂය දිගේ සමාන වේ. මෙම අක්ෂය දිගේ බෙදීමේ ලේබල හුදෙක් ලේබල් මිස සංඛ්‍යාත්මක අගයන් නොවේ.

සහසම්බන්ධය යන්නෙන් බොහෝ විට අදහස් වන්නේ හේතු සම්බන්ධතාවක් ඇති නමුත්, එය එය බවට සාක්ෂියක් ලෙස භාවිතා කළ නොහැක. න්‍යාය සත්‍ය ද අසත්‍ය ද යන්න නිරූපණය කිරීමට සංඛ්‍යාලේඛන භාවිතා නොකෙරේ. ඉදිරිපත් කරන ලද නිරීක්ෂණවල ප්‍රතිඵල පිළිබඳ තරඟකාරී පැහැදිලි කිරීම් බැහැර කිරීමට සැලසුම් කළ අත්හදා බැලීම්. එවැනි අත්හදා බැලීම් වලදී එකතු කරන ලද තොරතුරු සාරාංශ කිරීමට සහ සාක්ෂි පදනම මත තීරණය වැරදි විය හැකි සම්භාවිතාව ගණනය කිරීමට ද සංඛ්‍යාලේඛන භාවිතා වේ.

3 වන පරිච්ඡේදය සරල පසුබෑම

විචල්‍ය දෙකක් සම්බන්ධ වන්නේ නම්, සහසම්බන්ධතා සංගුණකයේ අගය 0.5 ට වඩා වැඩි නම්, එක් විචල්‍යයක නොදන්නා අගය අනෙක් විචල්‍යයේ දන්නා අගයෙන් (යම් නිරවද්‍යතාවයකින්) පුරෝකථනය කළ හැකිය. රූපයේ දක්වා ඇති දත්ත මත පදනම්ව මිලෙහි පුරෝකථනය කළ අගයන් ලබා ගැනීම සඳහා. 5, ඔබට හැකි ක්‍රම කිහිපයකින් ඕනෑම එකක් භාවිතා කළ හැකිය, නමුත් ඔබ රූපයේ පෙන්වා ඇති එක භාවිතා නොකරනු ඇත. 5. තවමත්, ඔබ එය කියවිය යුතුය, මන්ද සහසම්බන්ධතාවය සහ පුරෝකථනය අතර ඇති සම්බන්ධය මෙය තරම් පැහැදිලිව පෙන්නුම් කළ නොහැකි වෙනත් ක්‍රමයකි. අත්තික්කා මත. 5, පරාසයේ B2:C12, නිවාස දහයක අහඹු සාම්පලයක් වන අතර එක් එක් නිවසෙහි ප්‍රදේශය (වර්ග අඩි වලින්) සහ එහි විකුණුම් මිල පිළිබඳ දත්ත සපයයි.

සහල්. 5. විකුණුම් මිල අනාවැකි සරල රේඛාවක් සාදයි

මාධ්‍යයන්, සම්මත අපගමනය සහ සහසම්බන්ධතා සංගුණකය සොයන්න (පරාසය A14:C18). ප්‍රදේශය z-ලකුණු ගණනය කරන්න (E2:E12). උදාහරණයක් ලෙස, සෛල E3 හි සූත්‍රය අඩංගු වේ: =(B3-$B$14)/$B$15. පුරෝකථන මිල z-ලකුණු ගණනය කරන්න (F2:F12). උදාහරණයක් ලෙස, කොටුව F3 හි සූත්‍රය අඩංගු වේ: =E3*$B$18. z-scores ඩොලර් මිලකට පරිවර්තනය කරන්න (H2:H12). සෛල HZ හි, සූත්‍රය වන්නේ: =F3*$C$15+$C$14.

පුරෝකථනය කළ අගය සෑම විටම මධ්‍යන්‍යය දෙසට මාරු වීමට නැඹුරු වන බව සලකන්න, එය 0 වේ. සහසම්බන්ධතා සංගුණකය ශුන්‍යයට සමීප වන තරමට, පුරෝකථනය කළ z අගය බිංදුවට සමීප වේ. අපගේ උදාහරණයේ දී, ප්රදේශය සහ විකුණුම් මිල අතර සහසම්බන්ධතා සංගුණකය 0.67 වන අතර, අනාවැකි මිල 1.0*0.67, i.e. 0.67. මෙය සම්මත අපගමනයෙන් තුනෙන් දෙකකට සමාන සාමාන්‍ය අගයට වඩා වැඩි අගයකට අනුරූප වේ. සහසම්බන්ධතා සංගුණකය 0.5 ට සමාන නම්, අනාවැකි මිල 1.0 * 0.5 වනු ඇත, i.e. 0.5 මෙය සම්මත අපගමනයෙන් අඩකට පමණක් සමාන සාමාන්‍ය අගයට වඩා වැඩි අගයකට අනුරූප වේ. සහසම්බන්ධතා සංගුණකයේ අගය පරමාදර්ශයෙන් වෙනස් වන සෑම විටම, i.e. -1.0 ට වැඩි සහ 1.0 ට අඩු නම්, අනාවැකි විචල්‍යයේ ඇස්තමේන්තුව එහි මධ්‍යන්‍ය අගයට වඩා ආසන්න විය යුතුය. මෙම සංසිද්ධිය මධ්‍යන්‍යයට ප්‍රතිගාමී වීම හෝ සරලව ප්‍රතිගාමී වීම ලෙස හැඳින්වේ.

ප්‍රතිගාමී රේඛා සමීකරණයේ සංගුණක තීරණය කිරීම සඳහා Excel හි කාර්යයන් කිහිපයක් ඇත (එක්සෙල් හි එය ප්‍රවණතා රේඛාවක් ලෙස හැඳින්වේ) y=kx + බී. තීරණය කිරීම සඳහා කේකාර්යය ඉටු කරයි

=SLOPE(දන්නා_y-අගය; දන්නා_x-අගය)

මෙතන හිදීඅනාවැකි විචල්‍යය වේ, සහ xස්වාධීන විචල්යයකි. ඔබ මෙම විචල්‍ය අනුපිළිවෙල දැඩි ලෙස අනුගමනය කළ යුතුය. ප්‍රතිගාමී රේඛාවේ බෑවුම, සහසම්බන්ධතා සංගුණකය, විචල්‍යවල සම්මත අපගමනය සහ සහ විචල්‍යය සමීපව සම්බන්ධ වේ (රූපය 6). INTERCEPT() ශ්‍රිතය සිරස් අක්ෂයේ ප්‍රතිගාමී රේඛාවෙන් කපා දැමූ අගය ලබා දෙයි:

= INTERCUT(දන්නා_y-අගය; දන්නා_x-අගය)

සහල්. 6. සම්මත අපගමනය අතර අනුපාතය සහසම්බන්ධතා සංගුණකය සහ ප්‍රතිගාමී රේඛාවේ බෑවුම බවට පරිවර්තනය කරයි.

SLOPE() සහ INTERCEPT() ශ්‍රිතයට තර්ක ලෙස සපයා ඇති x සහ y අගයන් සංඛ්‍යාව සමාන විය යුතු බව සලකන්න.

ප්‍රතිගාමී විශ්ලේෂණය තවත් එකක් භාවිතා කරයි වැදගත් දර්ශකය– R 2 (R-square), හෝ නිර්ණය කිරීමේ සංගුණකය. අතර සම්බන්ධතාවය මගින් සමස්ත දත්ත විචල්‍යතාවයට කුමන දායකත්වයක් ලබා දෙන්නේද යන්න එය තීරණය කරයි xහා හිදී. Excel සඳහා QVPIRSON() ශ්‍රිතය ඇත, එය COREL() ශ්‍රිතයට සමාන තර්කයන් ගනී.

ඒවා අතර ශුන්‍ය නොවන සහසම්බන්ධතා සංගුණකයක් සහිත විචල්‍ය දෙකක් විචලනය පැහැදිලි කිරීමට හෝ විචලනය පැහැදිලි කිරීමට කියනු ලැබේ. සාමාන්‍යයෙන්, පැහැදිලි කරන ලද විචලනය ප්‍රතිශතයක් ලෙස ප්‍රකාශ වේ. ඒ නිසා ආර් 2 = 0.81 යනු විචල්‍ය දෙකේ විචල්‍යතාවයෙන් (විසුරුම) 81% පැහැදිලි කර ඇති බවයි. ඉතිරි 19% අහඹු උච්චාවචනයන් නිසාය.

Excel හට ගණනය කිරීම් සරල කරන TREND කාර්යයක් ඇත. TREND() කාර්යය:

  • ඔබ සපයන දන්නා අගයන් ගනී xසහ දන්නා අගයන් හිදී;
  • ප්රතිගාමී රේඛාවේ බෑවුම සහ නියත (කොටස) ගණනය කරයි;
  • අනාවැකි අගයන් ලබා දෙයි හිදී, වෙත ප්‍රතිගාමී සමීකරණය යෙදීමේ පදනම මත තීරණය වේ දන්නා අගයන් x(රූපය 7).

TREND() ශ්‍රිතය යනු අරා ශ්‍රිතයකි (ඔබ මීට පෙර එවැනි ශ්‍රිත හමු වී නොමැති නම්, මම එය නිර්දේශ කරමි).

සහල්. 7. TREND() ශ්‍රිතය භාවිතයෙන් SLOPE() සහ INTERCEPT() ශ්‍රිත යුගලයක් භාවිතා කිරීමට සාපේක්ෂව ගණනය කිරීම් වේගවත් කිරීමට සහ සරල කිරීමට ඔබට ඉඩ සලසයි.

G3:G12 සෛල තුළ TREND() ශ්‍රිතය අරා සූත්‍රයක් ලෙස ඇතුළු කිරීමට, G3:G12 පරාසය තෝරන්න, TREND සූත්‍රය ඇතුළු කරන්න (SZ:S12;VZ:B12), යතුරු ඔබා අල්ලාගෙන සිටින්න. පසුව පමණක් යතුර ඔබන්න . සූත්‍රය කැරලි වරහන් වලින් කොටා ඇති බව සලකන්න: (සහ ). Excel ඒ බව ඔබට පවසන්නේ මේ ආකාරයටයි ලබා දුන් සූත්රයඅරාව සූත්‍රයක් ලෙස ගෙන ඇත. වරහන් ඔබම ඇතුළු නොකරන්න: ඔබ ඒවා සූත්‍රයක කොටසක් ලෙස ඔබම ඇතුළත් කිරීමට උත්සාහ කරන්නේ නම්, Excel ඔබේ ආදානය සාමාන්‍ය පෙළ පෙළක් ලෙස සලකයි.

TREND() ශ්‍රිතයට තවත් තර්ක දෙකක් ඇත: නව_අගය_xහා const. පළමුවැන්න ඔබට අනාගතය සඳහා පුරෝකථනයක් ගොඩනගා ගැනීමට ඉඩ සලසයි, දෙවැන්න ප්‍රතිගාමී රේඛාවට මූලාරම්භය හරහා යාමට බල කළ හැකිය (සත්‍ය අගය ගණනය කළ නියතය, ව්‍යාජ අගය - නියත = 0 භාවිතා කිරීමට Excel ට කියයි). එක්සෙල් මඟින් ප්‍රස්ථාරයක් මත ප්‍රතිගාමී රේඛාවක් ඇඳීමට ඉඩ සලසයි, එවිට එය සම්භවය හරහා ගමන් කරයි. විසිරුම් කුමන්ත්‍රණයක් සැලසුම් කිරීමෙන් ආරම්භ කරන්න, ඉන්පසු දත්ත ශ්‍රේණි සලකුණු වලින් එකක් මත දකුණු-ක්ලික් කරන්න. විවෘතව ඇති තැන තෝරන්න සන්දර්භය මෙනුවඡේදය ප්‍රවණතා රේඛාව එක් කරන්න; විකල්පයක් තෝරන්න රේඛීය; අවශ්ය නම්, පැනලය පහළට අනුචලනය කරන්න, කොටුව සලකුණු කරන්න මංසන්ධියක් සකසන්න; එහි ආශ්‍රිත පෙළ කොටුව 0.0 ලෙස සකසා ඇති බවට වග බලා ගන්න.

ඔබට විචල්‍ය තුනක් තිබේ නම් සහ ඔබට ඒවායින් දෙකක් අතර සහසම්බන්ධය තීරණය කිරීමට අවශ්‍ය නම්, තුන්වන එකේ බලපෑම හැර, ඔබට භාවිතා කළ හැක අර්ධ සහසම්බන්ධය. විද්‍යාලය සම්පූර්ණ කර ඇති නගරවාසීන්ගේ ප්‍රතිශතය සහ නගර පුස්තකාලවල ඇති පොත් සංඛ්‍යාව අතර සම්බන්ධය ගැන ඔබ උනන්දු යැයි සිතමු. ඔබ නගර 50 ක් සඳහා දත්ත එකතු කර ඇත, නමුත් ... ගැටළුව වන්නේ මෙම පරාමිතීන් දෙකම යම් නගරයක වැසියන්ගේ යහපැවැත්ම මත රඳා පවතී. ඇත්ත වශයෙන්ම, පදිංචිකරුවන්ගේ යහපැවැත්මේ හරියටම සමාන මට්ටමේ සංලක්ෂිත වෙනත් නගර 50 ක් සොයා ගැනීම ඉතා අපහසුය.

අයදුම් කිරීම සංඛ්යාන ක්රමපුස්තකාල සහය සහ විද්‍යාල අධ්‍යාපනය යන දෙකටම සුභසාධනයේ බලපෑම ඉවත් කිරීම සඳහා, ඔබ උනන්දු වන විචල්‍යයන්, එනම් පොත් සංඛ්‍යාව සහ උපාධිධාරීන් සංඛ්‍යාව අතර සම්බන්ධතාවය වඩා හොඳින් ගණනය කළ හැකිය. විචල්‍ය දෙකක් අතර මෙම කොන්දේසිගත සහසම්බන්ධය, අනෙකුත් විචල්‍යවල අගයන් ස්ථාවර වූ විට, අර්ධ සහසම්බන්ධය ලෙස හැඳින්වේ. එය ගණනය කිරීම සඳහා එක් ක්රමයක් වන්නේ සමීකරණය භාවිතා කිරීමයි:

කොහෙද ආර්CB . ඩබ්ලිව්- ධනය (ධනය) යන විචල්‍යයේ බැහැර කළ බලපෑම (ස්ථාවර අගය) සහිත විද්‍යාලය (විද්‍යාලය) සහ පොත් (පොත්) අතර සහසම්බන්ධතා සංගුණකය; ආර්CB- විචල්‍ය විද්‍යාලය සහ පොත් අතර සහසම්බන්ධතා සංගුණකය; ආර්සී.ඩබ්ලිව්- විචල්‍ය අතර සහසම්බන්ධතා සංගුණකය විද්‍යාලය සහ සුබසාධනය; ආර්b.w.- පොත් සහ සුබසාධන විචල්‍ය අතර සහසම්බන්ධතා සංගුණකය.

අනෙක් අතට, අවශේෂ විශ්ලේෂණය මත පදනම්ව අර්ධ සහසම්බන්ධය ගණනය කළ හැක, i.e. පුරෝකථනය කළ අගයන් සහ ඒවාට සම්බන්ධ සත්‍ය නිරීක්ෂණ අතර වෙනස්කම් (ක්‍රම දෙකම රූප සටහන 8 හි පෙන්වා ඇත).

සහල්. 8. අර්ධ සහසම්බන්ධය අවශේෂ සහසම්බන්ධය ලෙස

සහසම්බන්ධතා සංගුණක (B16: E19) අනුකෘතිය ගණනය කිරීම සරල කිරීමට, Excel විශ්ලේෂණ පැකේජය (මෙනුව) භාවිතා කරන්න දත්ත –> විශ්ලේෂණය –> දත්ත විශ්ලේෂණය) පෙරනිමියෙන්, මෙම පැකේජය Excel හි ක්රියාකාරී නොවේ. එය ස්ථාපනය කිරීමට, මෙනුව හරහා යන්න ගොනුව –> විකල්ප –> ඇඩෝන. විවෘත වන කවුළුවේ පතුලේ විකල්පවිශිෂ්ටයික්ෂේත්රය සොයා ගන්න පාලනය කරන්න, තෝරන්න ඇඩෝනවිශිෂ්ටයි, ක්ලික් කරන්න යන්න. ඇඩෝනය අසල ඇති කොටුව සලකුණු කරන්න විශ්ලේෂණ පැකේජය. A ක්ලික් කරන්න දත්ත විශ්ලේෂණය, විකල්පයක් තෝරන්න සහසම්බන්ධය. ආදාන පරතරය ලෙස $B$2:$D$13 සඳහන් කරන්න, කොටුව සලකුණු කරන්න පළමු පේළියේ ලේබල්, නිමැවුම් පරතරය ලෙස $B$16:$E$19 සඳහන් කරන්න.

තවත් අවස්ථාවක් වන්නේ අර්ධ අර්ධ සහසම්බන්ධයක් නිර්වචනය කිරීමයි. උදාහරණයක් ලෙස, ඔබ බර මත උස හා වයස බලපෑම පර්යේෂණ. එබැවින් ඔබට පුරෝකථන විචල්‍ය දෙකක් ඇත, උස සහ වයස, සහ එක් අනාවැකි විචල්‍යයක්, බර. ඔබට එක් අනාවැකි විචල්‍යයක බලපෑම තවත් එකක් මත බැහැර කිරීමට අවශ්‍ය නමුත් අනාවැකි විචල්‍යය මත නොවේ:

එහිදී H - උස (උස), W - බර (බර), A - වයස (වයස); අර්ධ-පාර්ශ්වික සහසම්බන්ධතා සංගුණක දර්ශකය මඟින් කුමන විචල්‍ය ඉවත් කරන්නේද සහ කුමන විචල්‍යයෙන්ද යන්න දැක්වීමට වරහන් භාවිතා කරයි. මෙම අවස්ථාවෙහිදී, W(H.A) යන අංකනය පෙන්නුම් කරන්නේ වයස් විචල්‍යයේ බලපෑම උස විචල්‍යයෙන් ඉවත් කර ඇති නමුත් බර විචල්‍යයෙන් නොවන බවයි.

සාකච්ඡාවට භාජනය වන කාරණය සැලකිය යුතු වැදගත්කමක් නැති බව කෙනෙකුට හැඟීමක් ඇති විය හැකිය. සියල්ලට පසු, වඩාත්ම වැදගත් දෙය වන්නේ එය කෙතරම් නිවැරදිව ක්රියා කරයිද යන්නයි සාමාන්ය සමීකරණයප්‍රතිගමනය, සම්පූර්ණ පැහැදිලි කළ විචල්‍යයට තනි විචල්‍යයන්ගේ සාපේක්ෂ දායකත්වයේ ගැටලුව ද්විතියික බව පෙනේ. කෙසේ වෙතත්, මෙය එසේ නොවේ. බහු ප්‍රතිගාමී සමීකරණයේ කිසියම් විචල්‍යයක් භාවිතා කරන්නේද නැද්ද යන්න ගැන ඔබ සිතන්නට පටන් ගත් වහාම, ගැටළුව වැදගත් වේ. විශ්ලේෂණය සඳහා ආකෘතිය තෝරාගැනීමේ නිවැරදි බව තක්සේරු කිරීමට එය බලපෑ හැකිය.

පරිච්ඡේදය 4. LINEST() කාර්යය

LINEST() ශ්‍රිතය ප්‍රතිගාමී විශ්ලේෂණ සංඛ්‍යාලේඛන 10ක් ලබා දෙයි. LINEST() ශ්‍රිතය අරාව ශ්‍රිතයකි. එය ඇතුළු කිරීමට, පේළි පහක් සහ තීරු දෙකක් අඩංගු පරාසයක් තෝරන්න, සූත්රය ටයිප් කර ඔබන්න (රූපය 9):

LINEST(B2:B21,A2:A21,TRUE, TRUE)

සහල්. 9. LINEST() ශ්‍රිතය: a) D2:E6 පරාසය තෝරන්න, b) සූත්‍ර තීරුවේ පෙන්වා ඇති පරිදි සූත්‍රය ඇතුළු කරන්න, c) ක්ලික් කරන්න

LINEST() ශ්‍රිතය නැවත ලබා දෙයි:

  • ප්රතිගාමී සංගුණකය (හෝ බෑවුම, සෛල D2);
  • කොටස (හෝ නියත, සෛල E3);
  • සම්මත දෝෂප්රතිගාමී සංගුණකය සහ නියතයන් (පරාසය D3: E3);
  • ප්රතිගමනය සඳහා නිර්ණය කිරීමේ සංගුණකය R 2 (සෛල D4);
  • ඇස්තමේන්තු වල සම්මත දෝෂය (සෛල E4);
  • සම්පූර්ණ පසුබෑම සඳහා F-පරීක්ෂණය (සෛල D5);
  • වර්ගවල අවශේෂ එකතුව සඳහා නිදහස් අංශක ගණන (සෛල E5);
  • වර්ගවල ප්‍රතිගාමී එකතුව (සෛල D6);
  • වර්ගවල අවශේෂ එකතුව (සෛල E6).

මෙම එක් එක් සංඛ්‍යාලේඛන සහ ඒවායේ අන්තර්ක්‍රියා දෙස බලමු.

සම්මත දෝෂයක්අපගේ නඩුවේදී, මෙය නියැදි දෝෂ සඳහා ගණනය කරන ලද සම්මත අපගමනය වේ. එනම්, මෙය සාමාන්‍ය ජනගහනයට එක් සංඛ්‍යාලේඛන ඇති අතර නියැදියට තවත් සංඛ්‍යාලේඛන ඇති තත්වයකි. ප්‍රතිගාමී සංගුණකය සම්මත දෝෂයෙන් බෙදීමෙන් ඔබට 2.092/0.818 = 2.559 අගයක් ලැබේ. වෙනත් වචන වලින් කිවහොත්, 2.092 හි ප්‍රතිගාමී සංගුණකය යනු ශුන්‍යයට වඩා සම්මත දෝෂ දෙකහමාරක දුරකි.

ප්‍රතිගාමී සංගුණකය ශුන්‍ය නම්, අනාවැකි විචල්‍යයේ හොඳම ඇස්තමේන්තුව එහි මධ්‍යන්‍යය වේ. සම්මත දෝෂ දෙකහමාරක් තරමක් විශාල සංඛ්යාවක් වන අතර, ජනගහනය සඳහා ප්රතිගාමී සංගුණකය ශුන්ය නොවන අගයක් ඇති බව ඔබට ආරක්ෂිතව උපකල්පනය කළ හැකිය.

ලබා ගැනීමේ සම්භාවිතාව ඔබට තීරණය කළ හැකිය නියැදි අනුපාතයප්‍රතිගමනය 2.092 ශ්‍රිතය භාවිතා කරමින් එහි සත්‍ය ජනගහන අගය 0.0 ​​නම්

STUDENT.DIST.PH (t-test = 2.559; නිදහසේ අංශක ගණන = 18)

හිදී මුළු ප්රමාණයනිදහසේ අංශක = n – k – 1, මෙහි n යනු නිරීක්ෂණ ගණන වන අතර k යනු අනාවැකි විචල්‍ය ගණනයි.

මෙම සූත්‍රය 0.00987 හෝ 1% දක්වා වටකුරු අගයක් ලබා දෙයි. එය අපට පවසන්නේ මෙයයි: ජනගහනය සඳහා ප්‍රතිගාමී සංගුණකය 0% නම්, ප්‍රතිගාමී සංගුණකයේ ගණනය කළ අගය 2.092 වන පුද්ගලයින් 20 දෙනෙකුගේ නියැදියක් ලබා ගැනීමේ සම්භාවිතාව සාමාන්‍ය 1% කි.

F-test (Figure 9 හි සෛල D5) සරල යුගල ප්‍රතිගාමී සංගුණකය සම්බන්ධයෙන් t-test ලෙස සම්පූර්ණ ප්‍රතිගමනයකට අදාළව එකම කාර්යය ඉටු කරයි. F-test භාවිතා කරනුයේ ප්‍රතිගමනය සඳහා R 2 නිර්ණය කිරීමේ සංගුණකය ජනගහනයෙන් 0.0 අගයක් ඇති බවට වන උපකල්පනය ප්‍රතික්ෂේප කිරීමට ප්‍රමාණවත්ද යන්න පරීක්ෂා කිරීමටය, එය අනාවැකි සහ පුරෝකථන විචල්‍යය මගින් පැහැදිලි කරන ලද විචල්‍යතාවයක් නොමැති බව පෙන්නුම් කරයි. . එක් අනාවැකි විචල්‍යයක් පමණක් ඇති විට, F-පරීක්‍ෂණය හරියටම t-පරීක්‍ෂණයේ වර්ගයට සමාන වේ.

මෙතෙක් අපි සලකා බැලුවේ interval variables ය. ඔබට බහු අගයන් ගත හැකි විචල්‍ය තිබේ නම්, එනම් සරල නම්, උදාහරණයක් ලෙස, මිනිසා සහ ස්ත්‍රිය හෝ උරගයන්, උභයජීවී සහ මාළු, ඒවා සංඛ්‍යාත්මක කේතයක් ලෙස නියෝජනය කරයි. එවැනි විචල්යයන් නාමික ලෙස හැඳින්වේ.

R2 සංඛ්යාලේඛනපැහැදිලි කළ විචල්‍යතාවයේ අනුපාතය ප්‍රමාණ කරයි.

ඇස්තමේන්තුවේ සම්මත දෝෂය.අත්තික්කා මත. උස විචල්‍යය සමඟ ඇති සම්බන්ධතාවයේ පදනම මත ලබාගත් බර විචල්‍යයේ පුරෝකථනය කළ අගයන් වගුව 4.9 පෙන්වයි. E2:E21 පරාසයේ බර විචල්‍යයේ අවශේෂ අගයන් අඩංගු වේ. වඩාත් නිවැරදිව, මෙම අවශේෂ දෝෂ ලෙස හැඳින්වේ - එබැවින් ඇස්තමේන්තුවේ සම්මත දෝෂය යන යෙදුම පහත දැක්වේ.

සහල්. 10. R 2 සහ ඇස්තමේන්තුවේ සම්මත දෝෂය යන දෙකම ප්‍රතිගමනය භාවිතයෙන් ලබාගත් අනාවැකිවල නිරවද්‍යතාවය ප්‍රකාශ කරයි.

ඇස්තමේන්තුවේ සම්මත දෝෂය කුඩා වන තරමට ප්‍රතිගාමී සමීකරණය වඩාත් නිවැරදි වන අතර සත්‍ය නිරීක්‍ෂණයට ගැළපෙන පරිදි සමීකරණයෙන් ඕනෑම පුරෝකථනයක් ඔබ අපේක්ෂා කරයි. ඇස්තමේන්තුවේ සම්මත දෝෂය මෙම අපේක්ෂාවන් ගණනය කිරීමට මාර්ගයක් සපයයි. නිශ්චිත උසක් ඇති පුද්ගලයින්ගෙන් 95% ක බර පරාසයක පවතී:

(උස * 2.092 - 3.591) ± 2.092 * 21.118

F-සංඛ්‍යානඅන්තර් සමූහ විචල්‍යයට අන්තර් සමූහ විචලනයට අනුපාතය වේ. 20 වැනි සියවසේ ආරම්භයේ දී විචල්‍ය විශ්ලේෂණය (ANOVA, විචලනය පිළිබඳ විශ්ලේෂණය) වර්ධනය කළ සර්ට ගෞරවයක් වශයෙන් මෙම නම හඳුන්වා දුන්නේ සංඛ්‍යාලේඛනඥ ජෝර්ජ් ස්නෙඩෙකෝර් විසිනි.

නිර්ණය කිරීමේ සංගුණකය R 2 ප්‍රතිගමනය හා සම්බන්ධ මුළු වර්ග එකතුවේ අනුපාතය ප්‍රකාශ කරයි. අගය (1 - R 2) අවශේෂ - පුරෝකථන දෝෂ හා සම්බන්ධ සමස්ථ වර්ග එකතුවේ අනුපාතය ප්‍රකාශ කරයි. F-පරීක්ෂණය LINEST ශ්‍රිතය භාවිතයෙන් ලබා ගත හැක (රූපය 11 හි සෛල F5), වර්ග එකතුව (පරාසය G10:J11), විචල්‍ය භාග භාවිතා කරමින් (පරාසය G14:J15). අමුණා ඇති Excel ගොනුවේ සූත්‍ර අධ්‍යයනය කළ හැක.

සහල්. 11. F-නිර්ණායකය ගණනය කිරීම

නාමික විචල්යයන් භාවිතා කරන විට, ව්යාජ කේතීකරණය භාවිතා කරනු ලැබේ (රූපය 12). අගයන් සංකේතනය කිරීම සඳහා, 0 සහ 1 අගයන් භාවිතා කිරීම පහසුය. F සම්භාවිතාව ගණනය කරනු ලබන්නේ ශ්‍රිතය භාවිතා කරමිනි:

F.DIST.PH(K2;I2;I3)

මෙහිදී, F.DIST.RT() ශ්‍රිතය I2 සහ I3 සෛලවල ලබා දී ඇති නිදහසේ අංශක සහිත දත්ත කට්ටල දෙකක් සඳහා මධ්‍යම F-බෙදාහැරීමෙන් (පය. 13) F-පරීක්ෂණයක් ලබා ගැනීමේ සම්භාවිතාව ලබා දෙයි, එහි අගය යනු සෛල K2 හි දී ඇති අගයට සමාන වේ.

සහල්. 12. ව්යාජ විචල්යයන් භාවිතා කරමින් ප්රතිගාමී විශ්ලේෂණය

සහල්. 13. λ = 0 සඳහා මධ්‍යම F-බෙදාහැරීම

5 වන පරිච්ඡේදය බහු ප්‍රතිගාමීත්වය

ඔබ එක් පුරෝකථක විචල්‍යයක් සමඟ සරල යුගල ප්‍රතිගාමී ප්‍රතිගාමීත්වයක සිට බහු ප්‍රතිගාමීත්වයකට යන විට, ඔබ අනාවැකි විචල්‍ය එකක් හෝ කිහිපයක් එක් කරයි. පුරෝකථක විචල්‍ය අගයන් පුරෝකථනය කරන්නන් දෙදෙනෙකු සඳහා A සහ ​​B තීරු හෝ අනාවැකිකරුවන් තිදෙනෙකු සඳහා A, B සහ C වැනි යාබද තීරුවල ගබඩා කරන්න. LINEST() ශ්‍රිතය ඇතුළත් සූත්‍රයක් ඇතුළු කිරීමට පෙර, පේළි පහක් සහ පුරෝකථන විචල්‍ය ඇති තරම් තීරු, නියතය සඳහා තවත් එකක් තෝරන්න. පුරෝකථන විචල්‍ය දෙකක් සහිත ප්‍රතිගාමී අවස්ථාවක, පහත ව්‍යුහය භාවිතා කළ හැක:

LINEST(A2: A41; B2: C41;; සත්‍ය)

ඒ හා සමානව, විචල්‍ය තුනක් සම්බන්ධයෙන්:

LINEST(A2:A61;B2:D61;;ඇත්ත)

LDL මට්ටම් මත වයස සහ ආහාර වේලෙහි ඇති විය හැකි බලපෑම අධ්‍යයනය කිරීමට ඔබට අවශ්‍ය යැයි සිතමු, අඩු ඝනත්ව ලිපොප්‍රෝටීන් ඇටරෝට්‍රොම්බොසිස් ඇති කරන ධමනි ස්‍රාවය වන ඵලක සෑදීමට වගකිව යුතු යැයි සිතමු (රූපය 14).

සහල්. 14. බහු ප්‍රතිගාමී වීම

බහු ප්‍රතිගාමීත්වයේ R 2 (F13 කොටුවේ පෙන්වා ඇත) ඕනෑම සරල ප්‍රතිගාමීත්වයක R 2 ට වඩා වැඩිය (E4, H4). බහු ප්‍රතිගාමීත්වය එකවර බහු අනාවැකි විචල්‍ය භාවිතා කරයි. මෙම අවස්ථාවේ දී, R 2 සෑම විටම පාහේ වැඩි වේ.

එක් පුරෝකථන විචල්‍යයක් සමඟ ඕනෑම සරල රේඛීය ප්‍රතිගාමී සමීකරණයක් සඳහා, අනාවැකි අගයන් සහ අනාවැකි විචල්‍ය අගයන් අතර සෑම විටම පරිපූර්ණ සහසම්බන්ධයක් පවතිනු ඇත, මන්ද එවැනි සමීකරණයකදී අනාවැකි අගයන් එක් නියතයකින් ගුණ කරන අතර තවත් නියතයක් එකතු වේ. එක් එක් නිෂ්පාදනයට. මෙම බලපෑම බහු ප්‍රතිගාමී වීමකදී සංරක්ෂණය නොවේ.

බහු ප්‍රතිගාමීත්වය සඳහා LINEST() මගින් ආපසු ලබා දුන් ප්‍රතිඵල සංදර්ශනය (රූපය 15). ප්‍රතිගාමී සංගුණක LINEST() විසින් ලබා දුන් ප්‍රතිඵලවල කොටසක් ලෙස පෙන්වනු ලැබේ. විචල්‍යවල ප්‍රතිලෝම අනුපිළිවෙලින්(G-H-I C-B-A ට අනුරූප වේ).

සහල්. 15. සංගුණක සහ ඒවායේ සම්මත දෝෂ වැඩ පත්‍රිකාවේ ප්‍රතිලෝම අනුපිළිවෙලින් ප්‍රදර්ශනය කෙරේ.

තනි පුරෝකථන විචල්‍යයක් සමඟ ප්‍රතිගාමී විශ්ලේෂණයේදී භාවිතා කරන මූලධර්ම සහ ක්‍රියා පටිපාටි බහු අනාවැකි විචල්‍යයන් සඳහා පහසුවෙන් අනුගත වේ. මෙම අනුවර්තනයේ බොහෝ දේ රඳා පවතින්නේ අනාවැකි විචල්‍යයන් එකිනෙකා කෙරෙහි ඇති බලපෑම ඉවත් කිරීම මත බව පෙනී යයි. දෙවැන්න පුද්ගලික සහ අර්ධ පුද්ගලික සහසම්බන්ධතා සමඟ සම්බන්ධ වේ (රූපය 16).

සහල්. 16. අවශේෂවල යුගල වශයෙන් ප්‍රතිගාමී වීම හරහා බහු ප්‍රතිගාමීත්වය ප්‍රකාශ කළ හැක (Excel ගොනුවේ ඇති සූත්‍ර බලන්න)

Excel හි, t- සහ F-බෙදාහැරීම් පිළිබඳ තොරතුරු සපයන කාර්යයන් ඇත. STUDENT.DIST() සහ F.DIST() වැනි DIST කොටසක් ඇතුළත් වන ශ්‍රිත, තර්කයක් ලෙස t- හෝ F-පරීක්ෂණයක් ගෙන නිරීක්‍ෂණයක සම්භාවිතාව ලබා දෙයි නිශ්චිත අගය. STUDENT.INV() සහ F.INV() වැනි OBR කොටසක් ඇතුළත් ශ්‍රිතයන්, සම්භාවිතා අගයක් තර්කයක් ලෙස ගෙන නිශ්චිත සම්භාවිතාවට අනුරූප වන නිර්ණායක අගයක් ලබා දෙයි.

අපි එහි වලිග කලාපවල දාර කපා හරින t-බෙදාහැරීමේ තීරණාත්මක අගයන් සොයන බැවින්, අපි මෙම සම්භාවිතාවට අනුරූප අගයක් ලබා දෙන STUDENT.INV() ශ්‍රිතවලින් එකකට තර්කයක් ලෙස 5% සමත් වෙමු. (රූපය 17, 18).

සහල්. 17. ද්වි-වලිග ටී-ටෙස්ට්

සහල්. 18. එක්-වලිග ටී-පරීක්ෂණය

තනි වලිග සහිත ඇල්ෆා කලාපයක් සම්බන්ධයෙන් තීරණ ගැනීමේ රීතියක් ස්ථාපිත කිරීමෙන්, ඔබ පරීක්ෂණයේ සංඛ්‍යාන බලය වැඩි කරයි. ඔබ ඔබේ අත්හදා බැලීම ආරම්භ කරන විට, ධනාත්මක (හෝ සෘණ) ප්‍රතිගාමී සංගුණකයක් අපේක්ෂා කිරීමට ඔබට සෑම හේතුවක්ම ඇති බව ඔබට විශ්වාස නම්, ඔබ එක්-වලිග පරීක්ෂණයක් කළ යුතුය. මෙම අවස්ථාවෙහිදී, ජනගහනයේ ශුන්‍ය ප්‍රතිගාමී සංගුණකය පිළිබඳ උපකල්පනය ප්‍රතික්ෂේප කරමින් ඔබ නිවැරදි තීරණයක් ගැනීමේ සම්භාවිතාව වැඩි වනු ඇත.

සංඛ්යාලේඛනඥයන් මෙම යෙදුම භාවිතා කිරීමට කැමැත්තක් දක්වයි අධ්යක්ෂණය කළ පරීක්ෂණයපදය වෙනුවට තනි වලිග පරීක්ෂණයසහ වාරය යොමු නොකළ පරීක්ෂණයපදය වෙනුවට ද්වි-වලිග පරීක්ෂණය. දිශානුගත සහ දිශානුගත නොවන යන පද වඩාත් සුදුසු වන්නේ ඒවා බෙදාහැරීමේ වලිගවල ස්වභාවයට වඩා උපකල්පිත වර්ගය අවධාරණය කරන බැවිනි.

ආකෘති සංසන්දනය කිරීම මත පදනම්ව අනාවැකිකරුවන්ගේ බලපෑම තක්සේරු කිරීමේ ප්රවේශයක්.අත්තික්කා මත. 19 ප්‍රතිගාමී සමීකරණයට ඩයට් විචල්‍යයේ දායකත්වය පරීක්ෂා කරන ප්‍රතිගාමී විශ්ලේෂණයක ප්‍රතිඵල පෙන්වයි.

සහල්. 19. ඒවායේ ප්රතිඵලවල වෙනස්කම් පරීක්ෂා කිරීම මගින් ආකෘති දෙකක් සංසන්දනය කිරීම

LINEST() (පරාසය H2:K6) හි ප්‍රතිඵල මා හඳුන්වන දෙයට සම්බන්ධ වේ සම්පූර්ණ ආකෘතිය, එය ආහාර, වයස සහ HDL මත LDL විචල්‍යය ප්‍රතික්‍ෂේප කරයි. H9:J13 පරාසය තුළ, අනාවැකි විචල්‍ය ඩයට් සැලකිල්ලට නොගෙන ගණනය කිරීම් ඉදිරිපත් කෙරේ. මම එය සීමිත ආකෘතියක් ලෙස හඳුන්වමි. සම්පූර්ණ ආකෘතියේ, LDL මත යැපෙන විචල්‍යයේ විචල්‍යතාවයෙන් 49.2% අනාවැකි විචල්‍යයන් මගින් පැහැදිලි කෙරේ. සීමිත මාදිලියේ, වයස සහ HDL මගින් පැහැදිලි කර ඇත්තේ LDL වලින් 30.8% ක් පමණි. ඩයට් විචල්‍යය ආකෘතියෙන් බැහැර කිරීම හේතුවෙන් R 2 හි පාඩුව 0.183 කි. G15:L17 පරාසය තුළ, 0.0288 සම්භාවිතාවක් සමඟ පමණක් ඩයට් විචල්‍යයේ බලපෑම අහඹු බව පෙන්නුම් කරන ගණනය කිරීම් සිදු කරන ලදී. ඉතිරි 97.1% තුළ, ආහාර LDL මත බලපෑමක් ඇති කරයි.

6 වන පරිච්ඡේදය. ප්‍රතිගාමී විශ්ලේෂණය සම්බන්ධ උපකල්පන සහ අනතුරු ඇඟවීම්

"උපකල්පනය" යන පදය දැඩි ලෙස නිර්වචනය කර නොමැති අතර, එය භාවිතා කරන ආකාරය අනුව උපකල්පනය සපුරා නොමැති නම්, සමස්ත විශ්ලේෂණයේ ප්‍රතිඵල අවම වශයෙන් ප්‍රශ්නකාරී හෝ වලංගු නොවන බව යෝජනා කරයි. ඇත්ත වශයෙන්ම, මෙය එසේ නොවේ, උපකල්පනය උල්ලංඝනය කිරීම මූලික වශයෙන් පින්තූරය වෙනස් කරන අවස්ථා තිබේ. ප්‍රධාන උපකල්පන නම්: a) Y විචල්‍යයේ අවශේෂ සාමාන්‍යයෙන් ප්‍රතිගාමී රේඛාව ඔස්සේ X හි ඕනෑම ස්ථානයක බෙදා හරිනු ලැබේ; b) Y අගයන් X අගයන් මත රේඛීයව රඳා පවතී; ඇ) අවශේෂවල විචලනය එක් එක් ලක්ෂයේ X හි ආසන්න වශයෙන් සමාන වේ; ඈ) අවශේෂ අතර සම්බන්ධයක් නොමැත.

උපකල්පන සැලකිය යුතු කාර්යභාරයක් ඉටු නොකරන්නේ නම්, උපකල්පනය උල්ලංඝනය කිරීම සම්බන්ධයෙන් විශ්ලේෂණයේ ශක්තිමත් බව ගැන සංඛ්යාලේඛනඥයින් කතා කරයි. විශේෂයෙන්, ඔබ කණ්ඩායම් මාධ්‍යයන් අතර වෙනස්කම් පරීක්ෂා කිරීමට ප්‍රතිගාමීත්වය භාවිතා කරන විට, Y අගයන් - සහ එම නිසා අවශේෂ - සාමාන්‍යයෙන් බෙදා හරිනු ලැබේ යන උපකල්පනය වැදගත් නොවේ: පරීක්ෂණ සාමාන්‍ය උපකල්පනය උල්ලංඝනය කිරීමට එරෙහිව ශක්තිමත් වේ. ප්‍රස්ථාර භාවිතයෙන් දත්ත විශ්ලේෂණය කිරීම වැදගත් වේ. උදාහරණයක් ලෙස, ඇඩෝනයට ඇතුළත් කර ඇත දත්ත විශ්ලේෂණයමෙවලම පසුබෑම.

දත්ත රේඛීය ප්‍රතිගාමී උපකල්පනවලට නොගැලපේ නම්, ඔබ සතුව වෙනත් රේඛීය නොවන ප්‍රවේශයන් තිබේ. ඔවුන්ගෙන් එක් කෙනෙක් ලොජිස්ටික් ප්රතිගාමී (රූපය 20). පුරෝකථන විචල්‍යයේ ඉහළ සහ පහළ සීමාවන් ආසන්නයේ, රේඛීය ප්‍රතිගාමීත්වය යථාර්ථවාදී නොවන අනාවැකි ඇති කරයි.

සහල්. 20. ලොජිස්ටික් පසුබෑම

අත්තික්කා මත. වාර්ෂික ආදායම සහ නිවසක් මිලදී ගැනීමේ සම්භාවිතාව අතර සම්බන්ධය විමර්ශනය කිරීම අරමුණු කරගත් දත්ත විශ්ලේෂණ ක්‍රම දෙකක ප්‍රතිඵල රූප සටහන 6.8 පෙන්වා දෙයි. නිසැකවම, වැඩිවන ආදායම සමඟ මිලදී ගැනීමක් සිදු කිරීමේ සම්භාවිතාව වැඩි වනු ඇත. රේඛීය ප්‍රතිගාමීත්වය භාවිතයෙන් නිවසක් මිලදී ගැනීමේ සම්භාවිතාව පුරෝකථනය කරන ප්‍රතිඵල සහ වෙනස් ප්‍රවේශයක් භාවිතයෙන් ඔබට ලබා ගත හැකි ප්‍රතිඵල අතර වෙනස්කම් හඳුනා ගැනීම ප්‍රස්ථාර පහසු කරයි.

සංඛ්‍යානමය භාෂාවෙන්, ශුන්‍ය කල්පිතය සත්‍ය වූ විට එය ප්‍රතික්ෂේප කිරීම Type I දෝෂයක් ලෙස හැඳින්වේ.

add-in එකේ දත්ත විශ්ලේෂණයඉදිරිපත් කළා පහසු මෙවලමක්සසම්භාවී සංඛ්‍යා උත්පාදනය කිරීම සඳහා, පරිශීලකයාට අවශ්‍ය බෙදා හැරීමේ හැඩය (උදාහරණයක් ලෙස, සාමාන්‍ය, ද්විපද, හෝ විෂ), මෙන්ම මධ්‍යන්‍ය සහ සම්මත අපගමනය නියම කිරීමට ඉඩ සලසයි.

STUDENT.DIST() පවුලේ කාර්යයන් අතර වෙනස්කම්. Excel 2010 සිට, තුනක් ඇත විවිධ ආකාරදී ඇති t-test අගයක වමට සහ/හෝ දකුණට බෙදා හැරීමේ අනුපාතය ආපසු ලබා දෙන ශ්‍රිතයක්. STUDENT.DIST() ශ්‍රිතය බෙදාහැරීමේ වක්‍රය යටතේ ඇති ප්‍රදේශයේ අනුපාතය ඔබ සඳහන් කරන t-test අගයේ වමට ලබා දෙයි. ඔබට නිරීක්ෂණ 36 ක් ඇතැයි සිතමු, එබැවින් විශ්ලේෂණය කිරීමේ නිදහසේ අංශක ගණන 34 ක් වන අතර t-test අගය 1.69 කි. මෙම අවස්ථාවේ දී, සූත්රය

STUDENT.DIST(+1.69;34; TRUE)

0.05 හෝ 5% ක අගයක් ලබා දෙයි (රූපය 21). STUDENT.DIST() වෙත තුන්වන තර්කය සත්‍ය හෝ අසත්‍ය විය හැක. සත්‍ය ලෙස සකසා ඇත්නම්, ශ්‍රිතය වක්‍රය යටතේ ඇති සමුච්චිත ප්‍රදේශය ලබා දී ඇති t-පරීක්‍ෂණයේ වම් පසට ලබා දෙයි, එය කොටසක් ලෙස ප්‍රකාශ වේ. එය අසත්‍ය නම්, ශ්‍රිතය t-පරීක්‍ෂණයට අනුරූප ලක්ෂ්‍යයේ වක්‍රයේ සාපේක්ෂ උස ලබා දෙයි. STUDENT.DIST() ශ්‍රිතයේ අනෙකුත් අනුවාද - STUDENT.DIST.PX() සහ STUDENT.DIST.2X() - t-test අගය සහ නිදහසේ අංශක ගණන පමණක් තර්ක ලෙස ගන්නා අතර තුන්වන තර්කයක් අවශ්‍ය නොවේ .

සහල්. 21. බෙදා හැරීමේ වම් වලිගයේ අඳුරු සෙවන සහිත ප්‍රදේශය විශාල වක්‍රය යටතේ වමට ඇති ප්‍රදේශයේ අනුපාතයට අනුරූප වේ. ධනාත්මක අගය t-පරීක්ෂණය

t-test හි දකුණු පස ඇති ප්රදේශය තීරණය කිරීම සඳහා, සූත්ර වලින් එකක් භාවිතා කරන්න:

1 - STUDENT.DIST (1, 69; 34; ඇත්ත)

STUDENT.DIST.PH(1.69;34)

වක්‍රය යටතේ ඇති මුළු ප්‍රදේශය 100% විය යුතුය, එබැවින් ශ්‍රිතය මඟින් ආපසු ලබා දෙන t-test අගයේ වමට ඇති ප්‍රදේශ භාගය 1 සිට අඩු කිරීමෙන් t-test අගයට දකුණට ඇති ප්‍රදේශ භාගය ලැබේ. STUDENT.DIST.RH() ශ්‍රිතය භාවිතයෙන් ඔබට උනන්දුවක් දක්වන ප්‍රදේශ කොටස සෘජුවම ලබා ගැනීම වඩාත් සුදුසු යැයි ඔබට පෙනී යා හැක, RH යන්නෙන් අදහස් වන්නේ බෙදාහැරීමේ දකුණු වලිගයයි (රූපය 22).

සහල්. 22. දිශානුගත පරීක්ෂණය සඳහා 5% ඇල්ෆා ප්රදේශය

STUDENT.DIST() හෝ STUDENT.DIST.PH() ශ්‍රිතයන් භාවිතා කිරීමෙන් ඔබ යොමු කර ඇති ක්‍රියාකාරී කල්පිතයක් තෝරාගෙන ඇති බව ගම්‍ය වේ. දිශානුගත ක්‍රියාකාරී කල්පිතය, ඇල්ෆා අගය 5% ට සැකසීම සමඟ ඒකාබද්ධව, ඔබ බෙදාහැරීම්වල දකුණු වලිගය තුළ 5% ක් තබන බව අදහස් වේ. ඔබට ශුන්‍ය කල්පිතය ප්‍රතික්ෂේප කිරීමට සිදු වන්නේ ඔබේ t-test අගය ලබා ගැනීමේ සම්භාවිතාව 5% හෝ ඊට අඩු නම් පමණි. දිශානුගත උපකල්පන සාමාන්‍යයෙන් වඩාත් සංවේදී සංඛ්‍යාන පරීක්ෂණ ඇති කරයි (මෙම වැඩි සංවේදීතාව වැඩි සංඛ්‍යාන බලය ලෙසද හැඳින්වේ).

යොමු නොකළ පරීක්ෂණයක් සමඟ, ඇල්ෆා අගය 5% මට්ටමේම පවතී, නමුත් බෙදා හැරීම වෙනස් වනු ඇත. ඔබ ප්‍රතිඵල දෙකකට ඉඩ දිය යුතු නිසා, ව්‍යාජ ධනයක සම්භාවිතාව බෙදා හැරීමේ වලිග දෙක අතර බෙදා හැරිය යුතුය. මෙම සම්භාවිතාව සමානව බෙදා හැරීම සඳහා සාමාන්යයෙන් පිළිගනු ලැබේ (රූපය 23).

ලබා ගත් t-test අගයම සහ පෙර උදාහරණයේ ඇති නිදහස් අංශක ගණනම භාවිතා කරමින්, සූත්‍රය භාවිතා කරන්න

STUDENT DIST.2X(1.69;34)

විශේෂ හේතුවක් නොමැතිව, STUDENT.DIST.2X() ශ්‍රිතය එහි පළමු තර්කය ලෙස සෘණ t-test අගයක් ලබා දුන්නේ නම් #NUM! දෝෂ කේතය ලබා දෙයි.

සාම්පල අඩංගු නම් වෙනස් අංකයදත්ත, පැකේජයේ ඇතුළත් විවිධ විචල්‍යයන් සහිත සාම්පල දෙකක ටී-පරීක්‍ෂණය භාවිතා කරන්න දත්ත විශ්ලේෂණය.

7 වන පරිච්ඡේදය කණ්ඩායම් මාධ්‍යයන් අතර වෙනස්කම් පරීක්ෂා කිරීමට ප්‍රතිගමනය භාවිතා කිරීම

කලින් අනාවැකි විචල්‍යයන් ලෙසින් හැඳින්වූ විචල්‍යයන් මෙම පරිච්ඡේදයේ ප්‍රතිඵල විචල්‍යයන් ලෙසින් හඳුන්වනු ලබන අතර අනාවැකි විචල්‍යයන් වෙනුවට සාධක විචල්‍යයන් යන යෙදුම භාවිත කෙරේ.

නාමික විචල්‍යයක් කේතනය කිරීමේ සරලම ප්‍රවේශය වේ ව්යාජ කේතීකරණය(රූපය 24).

සහල්. 24. ව්යාජ කේතීකරණය මත පදනම් වූ ප්රතිගාමී විශ්ලේෂණය

ඕනෑම ආකාරයක ව්යාජ කේතීකරණ භාවිතා කරන විට, පහත සඳහන් නීති අනුගමනය කළ යුතුය:

  • නව දත්ත සඳහා වෙන් කර ඇති තීරු ගණන අඩු කරන ලද සාධක මට්ටම් ගණනට සමාන විය යුතුය
  • සෑම දෛශිකයක්ම එක් සාධක මට්ටමක් නියෝජනය කරයි.
  • බොහෝ විට පාලන කණ්ඩායම වන එක් මට්ටමක විෂයයන් සියලු දෛශික මත 0 කේතය ලබා ගනී.

F2:H6 =LINEST(A2:A22;C2:D22;;TRUE) සෛල තුළ ඇති සූත්‍රය ආපසු එයි ප්‍රතිගාමී සංඛ්‍යාලේඛන. සංසන්දනය කිරීම සඳහා, රූපයේ. 24 මෙවලම මගින් ආපසු ලබා දෙන විචලනය පිළිබඳ සාම්ප්රදායික විශ්ලේෂණයේ ප්රතිඵල පෙන්වයි විචලනය එක්-මාර්ග විශ්ලේෂණයඋපරිව්යුහ දත්ත විශ්ලේෂණය.

බලපෑම් කේතීකරණය.යනුවෙන් හැඳින්වෙන තවත් ආකාරයේ කේතීකරණයක් තුළ බලපෑම් කේතනය,එක් එක් කාණ්ඩයේ මධ්‍යන්‍යය කණ්ඩායම් මාධ්‍යයන් සමඟ සංසන්දනය කෙරේ. සියලුම කේත දෛශිකවල එකම කේතය ලැබෙන කණ්ඩායමක් සඳහා කේතය ලෙස 0 වෙනුවට -1 භාවිතා කිරීම නිසා බලපෑම් කේතීකරණයේ මෙම අංගය සිදු වේ (රූපය 25).

සහල්. 25. බලපෑම් කේතීකරණය

ව්‍යාජ කේතනය භාවිතා කරන විට, LINEST() මගින් ආපසු ලබා දෙන නියතයේ අගය යනු සියලුම දෛශිකවල (සාමාන්‍යයෙන් පාලන කණ්ඩායම) පවරන ලද ශුන්‍ය කේත සමූහයේ මධ්‍යන්‍යය වේ. බලපෑම් කේතීකරණයේදී, නියතය සමස්ත සාමාන්‍යයට (සෛල J2) සමාන වේ.

සාමාන්ය රේඛීය ආකෘතිය - ප්රයෝජනවත් ක්රමයක්ප්රතිඵලය වන විචල්යයේ අගයෙහි සංරචක සංකල්පගත කිරීම:

Y ij = μ + α j + ε ij

මෙම සූත්‍රයේ ලතින් අකුරු වෙනුවට ග්‍රීක අකුරු භාවිතා කිරීම මගින් එය සාම්පල ලබා ගන්නා ජනගහනයට යොමු වන බව අවධාරණය කරයි, නමුත් එය ප්‍රකාශිත ජනගහනයෙන් ලබාගත් සාම්පල වෙත යොමු වන බව දැක්වීමට එය නැවත ලිවිය හැකිය:

Y ij = Y̅ + a j + e ij

අදහස නම්, එක් එක් නිරීක්ෂණ Y ij පහත සඳහන් සංරචක තුනේ එකතුව ලෙස දැකිය හැකිය: සමස්ත මධ්‍යන්‍යය, μ; සැකසුම් බලපෑම j, සහ j; අගය e ij , එය සමස්ත මධ්‍යන්‍යයේ ඒකාබද්ධ අගයෙන් Y ij තනි ලකුණු වල අපගමනය නියෝජනය කරයි. j-th බලපෑමසැකසීම (රූපය 26). ප්‍රතිගාමී සමීකරණයේ ඉලක්කය වන්නේ අවශේෂවල වර්ගවල එකතුව අවම කිරීමයි.

සහල්. 26. සාමාන්‍ය රේඛීය ආකෘතියක සංරචක බවට වියෝජනය කරන ලද නිරීක්ෂණ

සාධක විශ්ලේෂණය.ප්රතිඵලය වන විචල්යය සහ එකවර සාධක දෙකක් හෝ වැඩි ගණනක් අතර සම්බන්ධය විමර්ශනය කරන්නේ නම්, මෙම අවස්ථාවේ දී එක් සාධකයක් විශ්ලේෂණය භාවිතා කිරීම ගැන කතා කරයි. විචලනය පිළිබඳ එක්-මාර්ග විශ්ලේෂණයකට සාධක එකක් හෝ කිහිපයක් එකතු කිරීම සංඛ්‍යානමය බලය වැඩි කළ හැක. එක්-මාර්ග ANOVA හි, සාධකයකට ආරෝපණය කළ නොහැකි ප්‍රතිඵල විචල්‍යයේ විචලනය අවශේෂ මධ්‍යන්‍ය චතුරස්‍රයට ඇතුළත් වේ. නමුත් මෙම විචලනය වෙනත් සාධකයකට සම්බන්ධ වීම විය හැකිය. එවිට මෙම විචලනය මධ්‍යන්‍ය වර්ග දෝෂයෙන් ඉවත් කළ හැකි අතර, එහි අඩුවීම F-පරීක්‍ෂණයේ අගයන් වැඩි වීමට හේතු වන අතර එම නිසා පරීක්ෂණයේ සංඛ්‍යාන බලය වැඩි වේ. උපරි ව්යුහය දත්ත විශ්ලේෂණයඑකවර සාධක දෙකක් සැකසීම සපයන මෙවලමක් ඇතුළත් වේ (රූපය 27).

සහල්. 27. පුනරාවර්තන විශ්ලේෂණ පැකේජය සමඟ විචලනය පිළිබඳ මෙවලම් ද්වි-මාර්ග විශ්ලේෂණය

මෙම රූපයේ භාවිතා කර ඇති විචල්‍ය මෙවලම විශ්ලේෂණය ප්‍රයෝජනවත් වන්නේ එය ප්‍රතිඵලයක් ලෙස ලැබෙන විචල්‍යයේ මධ්‍යන්‍ය සහ විචලනය මෙන්ම සැලසුමට ඇතුළත් එක් එක් කණ්ඩායම සඳහා ප්‍රති අගය ලබා දෙන බැවිනි. වගුව විචලනය විශ්ලේෂණය ANOVA මෙවලමෙහි එක්-මාර්ග අනුවාදයේ ප්‍රතිදානයේ නොමැති පරාමිති දෙකක් පෙන්වයි. විචල්‍ය ප්‍රභවයන් කෙරෙහි අවධානය යොමු කරන්න නියැදියහා තීරුපේළි 27 සහ 28. විචලනයේ මූලාශ්රය තීරුස්ත්රී පුරුෂ භාවය ගැන සඳහන් කරයි. විවිධත්වයේ මූලාශ්රය නියැදියවිවිධ පේළිවල අගයන් ඇති ඕනෑම විචල්‍යයකට යොමු වේ. අත්තික්කා මත. 27, CourseLech1 කාණ්ඩයේ අගයන් 2-6 පේළිවලද, CourseLech2 කාණ්ඩය 7-11 පේළිවලද, CourseLech3 කාණ්ඩයේ 12-16 පේළිවලද ඇත.

ප්‍රධාන කරුණ නම් ස්ත්‍රී පුරුෂ භාවය (කොටු E28 තුළ ලේබල් කර ඇති තීරු) සහ ප්‍රතිකාර (E27 කොටුවේ නියැදිය ලෙස ලේබල් කර ඇත) යන දෙකම ANOVA වගුවේ විචලන ප්‍රභවයන් ලෙස ඇතුළත් කර තිබීමයි. පිරිමින් සඳහා සාමාන්‍ය අගයන් කාන්තාවන්ගේ සාමාන්‍යයට වඩා වෙනස් වන අතර මෙය විවිධ ප්‍රභවයක් නිර්මාණය කරයි. ප්‍රතිකාර තුන සඳහා සාමාන්‍යයන් ද වෙනස් වේ - මෙන්න තවත් විචල්‍ය ප්‍රභවයක්. තුන්වන මූලාශ්‍රයක් ද ඇත, අන්තර්ක්‍රියා, එය ස්ත්‍රී පුරුෂ භාවය සහ ප්‍රතිකාර විචල්‍යවල ඒකාබද්ධ බලපෑමට යොමු කරයි.

8 වන පරිච්ඡේදය

Covariance විශ්ලේෂණය, හෝ ANCOVA (Covariation විශ්ලේෂණය), පක්ෂග්‍රාහීත්වය අඩු කරන අතර සංඛ්‍යාන බලය වැඩි කරයි. විශ්වසනීයත්වය තක්සේරු කිරීමට එක් ක්රමයක් බව මම ඔබට මතක් කරමි ප්‍රතිගාමී සමීකරණය F-පරීක්ෂණ වේ:

F = MS Regression/MS Residual

මෙහි MS (මධ්‍යන්‍ය චතුරශ්‍රය) මධ්‍ය චතුරස්‍රය වන අතර, ප්‍රතිගාමී සහ අවශේෂ දර්ශක පිළිවෙලින් ප්‍රතිගාමී සහ අවශේෂ සංරචක දක්වයි. MS Residual ගණනය කරනු ලබන්නේ සූත්‍රය භාවිතා කරමිනි:

MS Residual = SS Residual / df Residual

මෙහි SS (චතුරස්‍ර එකතුව) යනු වර්ගවල එකතුව වන අතර df යනු නිදහසේ අංශක ගණනයි. ඔබ ප්‍රතිගාමී සමීකරණයකට සහවිචල්‍ය එකතු කරන විට, මුළු වර්ග එකතුවෙන් යම් ප්‍රතිශතයක් SS ResiduaI හි ඇතුළත් නොවේ, නමුත් SS ප්‍රතිගමනය තුළ ඇතුළත් වේ. මෙය SS Residual l හි අඩුවීමක් ඇති කරයි, එබැවින් MS Residual . MS Residual කුඩා වන තරමට F-පරීක්‍ෂණය විශාල වන අතර මාධ්‍යයන් අතර වෙනසක් නැත යන ශුන්‍ය කල්පිතය ඔබ ප්‍රතික්ෂේප කිරීමට වැඩි ඉඩක් ඇත. ප්රතිඵලයක් වශයෙන්, ඔබ ප්රතිඵලය වන විචල්යයේ අස්ථාවරත්වය නැවත බෙදා හරිනු ඇත. ANOVA හි, සහජීවනය සැලකිල්ලට නොගත් විට, විචල්‍යතාවය දෝෂයකට යයි. නමුත් ANCOVA හි, දෝෂයට කලින් ආරෝපණය කරන ලද විචල්‍යතාවයේ කොටස covariate වෙත පවරා ඇති අතර එය SS Regression හි කොටසක් බවට පත්වේ.

එකම දත්ත කට්ටලය පළමුව ANOVA සහ පසුව ANCOVA සමඟ විශ්ලේෂණය කරන උදාහරණයක් සලකා බලන්න (රූපය 28).

සහල්. 28. ANOVA විශ්ලේෂණය පෙන්නුම් කරන්නේ ප්‍රතිගාමී සමීකරණය භාවිතයෙන් ලබාගත් ප්‍රතිඵල විශ්වාස කළ නොහැකි බවයි.

අධ්යයනය සාපේක්ෂ බලපෑම් සංසන්දනය කරයි ව්යායාම, මාංශ පේශි ශක්තිය වර්ධනය කිරීම සහ සංජානන අභ්යාස (හරස්පද ප්රහේලිකා විසඳීම), මොළයේ ක්රියාකාරිත්වය සක්රිය කිරීම. විෂයයන් අහඹු ලෙස කණ්ඩායම් දෙකකට පවරා ඇති අතර එමඟින් අත්හදා බැලීමේ ආරම්භයේ දී කණ්ඩායම් දෙකම එකම තත්ත්වයක සිටියහ. මාස තුනකට පසු, විෂයයන්හි සංජානන ලක්ෂණ මනිනු ලැබේ. මෙම මිනුම්වල ප්රතිඵල B තීරුවේ දැක්වේ.

A2:C21 පරාසයේ ප්‍රයෝග කේතීකරණය භාවිතයෙන් විශ්ලේෂණය සිදු කිරීම සඳහා LINEST() ශ්‍රිතයට ලබා දුන් මූලික දත්ත අඩංගු වේ. LINEST() ශ්‍රිතයේ ප්‍රතිඵල E2:F6 පරාසයේ පෙන්වා ඇත, එහිදී සෛල E2 බලපෑම් දෛශිකය හා සම්බන්ධ ප්‍රතිගාමී සංගුණකය පෙන්වයි. Cell E8 හි t-test = 0.93 අඩංගු වන අතර, Cell E9 මෙම t-test හි විශ්වසනීයත්වය පරීක්ෂා කරයි. සෛල E9 හි අගය පෙන්නුම් කරන්නේ මෙම අත්හදා බැලීමේදී නිරීක්ෂණය කරන ලද කණ්ඩායම් මාධ්‍යයන් අතර වෙනස හමුවීමේ සම්භාවිතාව 36% ක් වන අතර කණ්ඩායම් මාධ්‍යයන් ජනගහනයේ සමාන නම්. මෙම ප්‍රතිඵලය සංඛ්‍යානමය වශයෙන් වැදගත් යැයි සලකන්නේ ස්වල්ප දෙනෙක් පමණි.

අත්තික්කා මත. රූප සටහන 29 පෙන්නුම් කරන්නේ විශ්ලේෂණයට covariate එකතු කළ විට සිදු වන දෙයයි. මෙම අවස්ථාවේදී, මම දත්ත කට්ටලයට එක් එක් විෂයයේ වයස එකතු කළෙමි. covariate භාවිතා කරන ප්‍රතිගාමී සමීකරණය සඳහා R 2 නිර්ණය කිරීමේ සංගුණකය 0.80 (සෛල F4) වේ. Covariate භාවිතා නොකර ලබාගත් ANOVA ප්‍රතිඵල මා ප්‍රතිනිෂ්පාදනය කළ F15:G19 පරාසයේ R 2 අගය 0.05 (සෛල F17) පමණි. එබැවින්, covariate ඇතුළත් ප්‍රතිගාමී සමීකරණයක් මගින් Impact vector එක පමණක් භාවිතා කරනවාට වඩා ඉතා නිවැරදිව සංජානන ලකුණු විචල්‍යයේ අගයන් පුරෝකථනය කරයි. ANCOVA සඳහා, F5 කොටුවේ පෙන්වන F-test අගය අහඹු ලෙස ලබා ගැනීමේ සම්භාවිතාව 0.01% ට වඩා අඩුය.

සහල්. 29. ANCOVA සම්පූර්ණයෙන්ම වෙනස් පින්තූරයක් ගෙන එයි

හිදී විශිෂ්ටයිඊටත් වඩා වේගවත් සහ ඇත පහසු මාර්ගයරේඛීය ප්‍රතිගාමී ප්‍රස්ථාරයක් සාදන්න (සහ ප්‍රධාන වර්ග පවා එසේ නොවේ රේඛීය පසුබෑම්, ඒ ගැන පහත බලන්න). මෙය මේ ආකාරයට කළ හැකිය:

1) දත්ත සහිත තීරු තෝරන්න xහා වයි(ඔවුන් එම අනුපිළිවෙලෙහි තිබිය යුතුය!);

2) අමතන්න ප්‍රස්ථාර විශාරදයාසහ කණ්ඩායමක් තෝරන්න වර්ගයතිත් සහිතසහ වහාම ඔබන්න සූදානම්;

3) රූප සටහන තේරීමෙන් තොරව, දිස්වන ප්‍රධාන මෙනු අයිතමය තෝරන්න රූප සටහන, එහිදී ඔබ අයිතමය තෝරාගත යුතුය ප්‍රවණතා රේඛාව එක් කරන්න;

4) දිස්වන සංවාදයේ ප්රවණතා රේඛාවටැබ් වර්ගයතෝරා රේඛීය;

5) ටැබ් විකල්පස්විචය සක්රිය කළ හැක ප්‍රස්ථාරයේ සමීකරණය පෙන්වන්න, සංගුණක (4.5) ගණනය කරනු ලබන රේඛීය ප්‍රතිගාමී සමීකරණය (4.4) බැලීමට ඔබට ඉඩ සලසයි.

6) එකම ටැබය තුළ, ඔබට ස්විචය සක්රිය කළ හැකිය ආසන්න විශ්වාසයේ අගය රූප සටහන මත තබන්න (R^2). මෙම අගය සහසම්බන්ධතා සංගුණකයේ වර්ග (4.3) වන අතර එය ගණනය කරන ලද සමීකරණය පර්යේෂණාත්මක යැපීම කෙතරම් හොඳින් විස්තර කරයිද යන්න පෙන්වයි. අ ආර් 2 සමගියට සමීප වේ, එවිට න්‍යායික ප්‍රතිගාමී සමීකරණය පර්යේෂණාත්මක යැපීම හොඳින් විස්තර කරයි (න්‍යාය අත්හදා බැලීම් සමඟ හොඳින් එකඟ වේ), සහ නම් ආර් 2 ශුන්‍යයට ආසන්නයි, එවිට මෙම සමීකරණය පර්යේෂණාත්මක යැපීම විස්තර කිරීම සඳහා සුදුසු නොවේ (න්‍යාය අත්හදා බැලීම් සමඟ එකඟ නොවේ).

විස්තර කරන ලද ක්රියාවන් සිදු කිරීමේ ප්රතිඵලයක් වශයෙන්, ඔබට ප්රතිගාමී ප්රස්ථාරයක් සහ එහි සමීකරණය සහිත රූප සටහනක් ලැබෙනු ඇත.

§4.3. රේඛීය නොවන ප්‍රතිගාමී ප්‍රධාන වර්ග

පරාවලයික සහ බහුපද ප්‍රතිගාමීත්වය.

පරාවලයිකවටිනාකම මත යැපීම වයිවටිනාකමින් xයැපීම ලෙස හැඳින්වේ චතුරස්රාකාර ශ්රිතය(2වන අනුපිළිවෙල පැරබෝලා):

මෙම සමීකරණය ලෙස හැඳින්වේ පරාවලයික ප්‍රතිගාමීත්වය Yමත x. විකල්ප , බී, සමඟකියලා පරාවලීය ප්‍රතිගාමී සංගුණක. පරාවලයික ප්‍රතිගාමී සංගුණක ගණනය කිරීම සැමවිටම අපහසු වේ, එබැවින් ගණනය කිරීම් සඳහා පරිගණකයක් භාවිතා කිරීම රෙකමදාරු කරනු ලැබේ.

පරාවලීය ප්‍රතිගාමීත්වයේ සමීකරණය (4.8) යනු බහුපද නම් වඩාත් සාමාන්‍ය ප්‍රතිගාමීත්වයක විශේෂ අවස්ථාවකි. බහුපදවටිනාකම මත යැපීම වයිවටිනාකමින් xබහුපදයෙන් ප්‍රකාශිත යැපීම ලෙස හැඳින්වේ n-වන නියෝගය:

කෝ අංක a i (මම=0,1,…, n) ලෙස හැඳින්වේ බහුපද ප්‍රතිගාමී සංගුණක.

බලය පසුබෑම.

බලයවටිනාකම මත යැපීම වයිවටිනාකමින් xපෝරමයේ යැපීම ලෙස හැඳින්වේ:

මෙම සමීකරණය ලෙස හැඳින්වේ බල ප්‍රතිගාමී සමීකරණය Yමත x. විකල්ප හා බීකියලා බලශක්ති ප්රතිගාමී සංගුණක.

ln=ln +බී ln x. (4.11)

මෙම සමීකරණය ලඝුගණක ඛණ්ඩාංක අක්ෂ සමඟ තලයේ සරල රේඛාවක් විස්තර කරයි. xසහ ln. එබැවින්, බල ප්‍රතිගාමීත්වයේ අදාළත්වය සඳහා වන නිර්ණායකය වන්නේ ආනුභවික දත්තවල ලඝුගණක ලක්ෂ්‍යයන් අවශ්‍ය වීමයි. x iසහ ln මමසෘජු රේඛාවට ආසන්නතම (4.11) විය.

ඝාතීය ප්‍රතිගාමීත්වය.

ආදර්ශමත්(හෝ ඝාතීය) ප්රමාණය මත යැපීම වයිවටිනාකමින් xපෝරමයේ යැපීම ලෙස හැඳින්වේ:

(හෝ ). (4.12)

මෙම සමීකරණය ලෙස හැඳින්වේ ඝාතීය සමීකරණය(හෝ ඝාතීය) ප්‍රතිගමනය Yමත x. විකල්ප (හෝ කේ) හා බීකියලා ඝාතීය(හෝ ඝාතීය) පසුබෑම.

අපි බල ප්‍රතිගාමී සමීකරණයේ දෙපැත්තේම ලඝුගණකය ගත්තොත් අපට ලැබෙන්නේ සමීකරණයයි.

ln = x ln +ln බී(හෝ ln = k x+ln බී). (4.13)

මෙම සමීකරණය විස්තර කරයි රේඛීය යැපීමඑක් අගයක ලඝුගණකය තවත් අගයකින් x. එබැවින්, බල ප්‍රතිගාමීත්වයේ අදාළත්වය සඳහා වන නිර්ණායකය වන්නේ ආනුභවික දත්ත එකම විශාලත්වයකින් පෙන්වා දීමේ අවශ්‍යතාවයයි. x iසහ වෙනත් අගයක ලඝුගණක ln මමසෘජු රේඛාවට ආසන්නතම (4.13) විය.

ලඝුගණක පසුබෑම.

ලඝුගණකවටිනාකම මත යැපීම වයිවටිනාකමින් xපෝරමයේ යැපීම ලෙස හැඳින්වේ:

=+බී ln x. (4.14)

මෙම සමීකරණය ලෙස හැඳින්වේ ලඝුගණක ප්‍රතිගමනය Yමත x. විකල්ප හා බීකියලා ලඝුගණක ප්‍රතිගාමී සංගුණක.

අධිබල ප්‍රතිගාමීත්වය.

හයිපර්බෝලික්වටිනාකම මත යැපීම වයිවටිනාකමින් xපෝරමයේ යැපීම ලෙස හැඳින්වේ:

මෙම සමීකරණය ලෙස හැඳින්වේ හයිපර්බෝලික් ප්‍රතිගාමී සමීකරණය Yමත x. විකල්ප හා බීකියලා අධිබල ප්‍රතිගාමී සංගුණකසහ අවම වර්ග ක්රමය මගින් තීරණය කරනු ලැබේ. මෙම ක්‍රමය භාවිතා කිරීම සූත්‍ර වලට යොමු කරයි:

සූත්‍රවල (4.16-4.17), සාරාංශය දර්ශකය හරහා සිදු කෙරේ මමඑක සිට නිරීක්ෂණ ගණන දක්වා n.

අවාසනාවන්ත ලෙස, තුළ විශිෂ්ටයිඅධිබල ප්‍රතිගාමීත්වයේ සංගුණක ගණනය කරන ශ්‍රිතයක් නොමැත. මනින ලද අගයන් ප්‍රතිලෝම සමානුපාතිකත්වයට සම්බන්ධ බව නිශ්චිතවම නොදන්නා අවස්ථාවන්හිදී, අධිබල ප්‍රතිගාමී සමීකරණය වෙනුවට බල ප්‍රතිගාමී සමීකරණයක් සෙවීම නිර්දේශ කෙරේ. විශිෂ්ටයිඑය සොයා ගැනීමට ක්රියා පටිපාටියක් තිබේ. මනින ලද අගයන් අතර හයිපර්බෝලික් යැපීම උපකල්පනය කරන්නේ නම්, එහි ප්‍රතිගාමී සංගුණකය සහායක ගණනය කිරීමේ වගු සහ සූත්‍ර (4.16-4.17) භාවිතා කරමින් සමාකරණ මෙහෙයුම් භාවිතයෙන් ගණනය කිරීමට සිදුවේ.

MS Excel පැකේජය රේඛීය ප්‍රතිගාමී සමීකරණයක් තැනීමේදී බොහෝ කාර්යයන් ඉතා ඉක්මනින් කිරීමට ඔබට ඉඩ සලසයි. ප්රතිඵල අර්ථ නිරූපණය කරන්නේ කෙසේද යන්න තේරුම් ගැනීම වැදගත්ය. ප්‍රතිගාමී ආකෘතියක් තැනීමට, මෙවලම්\දත්ත විශ්ලේෂණය\ ප්‍රතිගමනය තෝරන්න (Excel 2007 හි, මෙම ප්‍රකාරය දත්ත/දත්ත විශ්ලේෂණ/ප්‍රතිගමන අංශයේ පිහිටා ඇත). ඉන්පසු ලබාගත් ප්රතිඵල විශ්ලේෂණය සඳහා බ්ලොක් එකකට පිටපත් කරන්න.

මූලික දත්ත:

විශ්ලේෂණ ප්රතිඵල

වාර්තාවට ඇතුළත් කරන්න
ප්රතිගාමී සමීකරණයේ පරාමිතීන් ගණනය කිරීම
න්යායික ද්රව්ය
සම්මත පරිමාණයෙන් ප්‍රතිගාමී සමීකරණය
බහු සහසම්බන්ධතා සංගුණකය (බහු සහසම්බන්ධතා දර්ශකය)
ප්රත්යාස්ථතාවයේ අර්ධ සංගුණක
ඵලදායී ලක්ෂණය මත විශ්ලේෂණය කරන ලද සාධකවල බලපෑම පිළිබඳ සංසන්දනාත්මක තක්සේරුව (d - වෙනම නිර්ණය කිරීමේ සංගුණක)

ඉදිකරන ලද ප්‍රතිගාමී සමීකරණයේ ගුණාත්මකභාවය පරීක්ෂා කිරීම
ප්‍රතිගාමී සංගුණකවල වැදගත්කම b i (t-සංඛ්‍යාලේඛන. ශිෂ්‍යයාගේ t-පරීක්‍ෂණය)
සමස්ථයක් ලෙස සමීකරණයේ වැදගත්කම (F-සංඛ්‍යාලේඛන. ෆිෂර්ගේ නිර්ණායකය). නිර්ණය කිරීමේ සංගුණකය
අර්ධ F-නිර්ණායක

වැදගත්කම මට්ටම 0.005 0.01 0.025 0.05 0.1 0.25 0.4

28 ඔක්

සුභ සන්ධ්‍යාවක්, හිතවත් බ්ලොග් පාඨකයින්! අද අපි කතා කරන්නේ රේඛීය නොවන ප්‍රතිගාමීත්වය ගැනයි. රේඛීය ප්‍රතිගාමීත්වයේ විසඳුම LINK හි බැලිය හැක.

මෙම ක්රමයඑය ප්‍රධාන වශයෙන් ආර්ථික ආකෘති නිර්මාණය සහ පුරෝකථනය කිරීමේදී භාවිතා වේ. එහි අරමුණ වන්නේ දර්ශක දෙකක් අතර සම්බන්ධතාවය නිරීක්ෂණය කිරීම සහ හඳුනා ගැනීමයි.

රේඛීය නොවන ප්‍රතිගාමී ප්‍රධාන වර්ග වන්නේ:

  • බහුපද (චතුරස්‍ර, ඝන);
  • අධිබලැති;
  • බලය;
  • නිරූපණය;
  • ලඝුගණක.

විවිධ සංයෝජන ද භාවිතා කළ හැකිය. උදාහරණයක් ලෙස, බැංකුකරණය, රක්ෂණය, ජනවිකාස අධ්‍යයනයන්හි කාල ශ්‍රේණි විශ්ලේෂණ සඳහා, ලඝුගණක ප්‍රතිගමන වර්ගයක් වන Gompzer curve භාවිතා වේ.

රේඛීය නොවන ප්‍රතිගාමී භාවිතා කරමින් පුරෝකථනය කිරීමේදී, ප්‍රධාන දෙය වන්නේ සහසම්බන්ධතා සංගුණකය සොයා ගැනීමයි, එමඟින් පරාමිති දෙකක් අතර සමීප සම්බන්ධතාවයක් තිබේද නැද්ද යන්න අපට පෙන්වනු ඇත. රීතියක් ලෙස, සහසම්බන්ධතා සංගුණකය 1 ට ආසන්න නම්, සම්බන්ධතාවයක් ඇති අතර, අනාවැකිය තරමක් නිවැරදි වනු ඇත. තව එකක් වැදගත් අංගයක්රේඛීය නොවන ප්‍රතිග්‍රහනය මධ්‍යන්‍යය වේ සාපේක්ෂ දෝෂයක් (නමුත් ) එය පරතරය තුළ නම්<8…10%, значит модель достаточно точна.

මේ මත, සමහර විට, අපි න්යායික අවහිර කිරීම අවසන් කර ප්රායෝගික ගණනය කිරීම් වෙත යන්නෙමු.

අපට වසර 15 ක කාලයක් සඳහා මෝටර් රථ විකුණුම් වගුවක් තිබේ (එය X ලෙස දක්වමු), මිනුම් පියවර ගණන තර්කය n වනු ඇත, මෙම කාල පරිච්ඡේද සඳහා අපට ආදායමක් ද ඇත (එය Y ලෙස දක්වමු), අපි පුරෝකථනය කළ යුතුය. අනාගතයේදී ලැබෙන ආදායම කුමක්ද. අපි පහත වගුව ගොඩනඟමු:

අධ්‍යයනය සඳහා, අපි සමීකරණය විසඳිය යුතුයි (Y හි යැපීම X මත): y=ax 2 +bx+c+e. මෙය යුගල චතුරස්‍ර ප්‍රතිගමනයකි. මෙම අවස්ථාවෙහිදී, නොදන්නා තර්ක සොයා ගැනීමට අපි අවම වශයෙන් වර්ග ක්‍රමය යොදන්නෙමු - a, b, c. එය පෝරමයේ වීජීය සමීකරණ පද්ධතියකට තුඩු දෙනු ඇත:

මෙම පද්ධතිය විසඳීම සඳහා, අපි උදාහරණයක් ලෙස, Cramer ක්රමය භාවිතා කරමු. පද්ධතියට ඇතුළත් කර ඇති එකතු කිරීම් නොදන්නා අයගේ සංගුණක බව අපට පෙනේ. ඒවා ගණනය කිරීම සඳහා, අපි වගුවට තීරු කිහිපයක් එකතු කරමු (D, E, F, G, H) සහ ගණනය කිරීම් වල තේරුම අනුව ඒවා අත්සන් කරන්න - D තීරුවේ අපි වර්ග x, E හි ඝනකයක්, F හි 4 වන බලය, G හි අපි x සහ y දර්ශක ගුණ කරමු, H හි අපි x වර්ග කර y සමඟ ගුණ කරමු.

එය සමීකරණය විසඳීම සඳහා අවශ්‍ය ඒවා පුරවා ඇති පෝරමයේ වගුවක් බවට පත් කරනු ඇත.

අපි matrix එකක් හදමු සමීකරණවල වම් පස ඇති නොදන්නා අය සඳහා සංගුණක වලින් සමන්විත පද්ධතියකි. එය A22 කොටුවට දමා එයට කතා කරමු " A=". ප්‍රතිගාමීත්වය විසඳීමට අප තෝරාගෙන ඇති සමීකරණ පද්ධතිය අපි අනුගමනය කරමු.

එනම්, සෛලය B21 හි අපි X දර්ශකය සිව්වන බලයට ඔසවා තැබූ තීරුවේ එකතුව තැබිය යුතුය - F17. අපි හුදෙක් සෛලය වෙත යොමු කරමු - "=F17". මීලඟට, අපට අවශ්‍ය වන්නේ X කියුබ් කර ඇති තීරුවේ එකතුව - E17, එවිට අපි පද්ධතියට අනුව දැඩි ලෙස යමු. මේ අනුව, අපි සම්පූර්ණ අනුකෘතිය පිරවීමට අවශ්ය වනු ඇත.

ක්‍රාමර්ගේ ඇල්ගොරිතමයට අනුකූලව, අපි A ට සමාන අනුකෘතියක් A1 එකතු කරන්නෙමු, එහි පළමු තීරුවේ මූලද්‍රව්‍ය වෙනුවට පද්ධතියේ සමීකරණවල දකුණු කොටස්වල මූලද්‍රව්‍ය තැබිය යුතුය. එනම්, X තීරුවේ එකතුව වර්ග වාර Y, XY තීරුවේ එකතුව සහ Y තීරුවේ එකතුව.

අපට තවත් න්‍යාස දෙකක් අවශ්‍ය වනු ඇත - අපි ඒවා A2 සහ A3 ලෙස හඳුන්වමු, එහි දෙවන සහ තෙවන තීරු සමීකරණවල දකුණු පස සංගුණක වලින් සමන්විත වේ. පින්තූරය මේ වගේ වනු ඇත.

තෝරාගත් ඇල්ගොරිතම අනුගමනය කරමින්, ලබාගත් න්‍යාසවල නිර්ණායකවල (නිර්ණක, ඩී) අගයන් ගණනය කිරීමට අපට අවශ්‍ය වනු ඇත. අපි MOPRED සූත්‍රය භාවිතා කරමු. ප්රතිඵල සෛල J21:K24 තුළ තැන්පත් කරනු ලැබේ.

අපි සූත්‍රය අනුව අනුරූප නිර්ණායකවලට විරුද්ධ සෛලවල ක්‍රේමර් අනුව සමීකරණයේ සංගුණක ගණනය කරන්නෙමු: (කොටුව M22 තුළ) - "=K22/K21"; බී(කොටුව M23 තුළ) - "=K23/K21"; සමඟ(කොටුව M24 තුළ) - "=K24 / K21".

අපට අවශ්‍ය යුගල චතුරස්‍ර ප්‍රතිගාමී සමීකරණය ලැබේ:

y=-0.074x2 +2.151x+6.523

සහසම්බන්ධතා දර්ශකය මගින් රේඛීය සම්බන්ධතාවයේ තද බව අපි තක්සේරු කරමු.

ගණනය කිරීමට, වගුවට අමතර J තීරුවක් එක් කරන්න (අපි එය y* ලෙස හඳුන්වමු). ගණනය කිරීම පහත පරිදි වේ (අපට ලැබුණු ප්‍රතිගාමී සමීකරණයට අනුව) - "=$m$22*B2*B2+$M$23*B2+$M$24".අපි ඒක J2 කොටුවට දාමු. ඉතිරිව ඇත්තේ ස්වයංක්‍රීය පිරවුම් සලකුණ J16 කොටුවට ඇදගෙන යාමයි.

එකතුව (Y-Y සාමාන්‍යය) 2 ගණනය කිරීම සඳහා, අදාළ සූත්‍ර සමඟ වගුවට K සහ L තීරු එකතු කරන්න. අපි AVERAGE ශ්‍රිතය භාවිතයෙන් Y තීරුව සඳහා සාමාන්‍යය ගණනය කරමු.

සෛල K25 හි අපි සහසම්බන්ධතා දර්ශකය ගණනය කිරීම සඳහා සූත්රය තබමු - "=ROOT(1-(K17/L17))".

0.959 අගය 1 ට ඉතා ආසන්න බව අපට පෙනේ, එනම් විකුණුම් සහ වසර අතර සමීප රේඛීය නොවන සම්බන්ධතාවයක් පවතී.

ලබාගත් චතුරස්රාකාර ප්රතිගාමී සමීකරණය (නිර්ණය කිරීමේ දර්ශකය) සවිකිරීමේ ගුණාත්මකභාවය ඇගයීමට ඉතිරිව ඇත. එය සහසම්බන්ධතා දර්ශකයේ වර්ග සූත්රය මගින් ගණනය කරනු ලැබේ. එනම්, සෛල K26 හි සූත්රය ඉතා සරල වනු ඇත - "=K25*K25".

0.920 හි සංගුණකය 1 ට ආසන්න වන අතර එය උසස් තත්ත්වයේ ගැලපීමක් පෙන්නුම් කරයි.

අවසාන පියවර වන්නේ සාපේක්ෂ දෝෂය ගණනය කිරීමයි. අපි තීරුවක් එකතු කර එහි සූත්‍රය ඇතුළත් කරමු: “=ABS((C2-J2)/C2), ABS — මොඩියුලය, නිරපේක්ෂ අගය. අපි සලකුණු කාරකය පහළට ඇද දමමු සහ සෛල M18 හි අපි සාමාන්‍ය අගය (AVERAGE) පෙන්වමු, සෛල වලට ප්‍රතිශත ආකෘතිය පවරන්න. ලබාගත් ප්රතිඵලය - 7.79% පිළිගත හැකි දෝෂ අගයන් තුළ වේ<8…10%. Значит вычисления достаточно точны.

අවශ්ය නම්, ලබාගත් අගයන් මත පදනම්ව අපට ප්රස්ථාරයක් ගොඩනගා ගත හැකිය.

උදාහරණ ගොනුවක් අමුණා ඇත - LINK!

ප්රවර්ග:// 2017 ඔක්තෝබර් 28 දිනැති
සමාන ලිපි

2022 parki48.ru. අපි රාමු නිවසක් ගොඩනඟමු. භූමි අලංකරණය. ඉදිකිරීම. පදනම.