Korrelaasje Dichtynterers foar it Multifaktor-Korrelaasje-Regressionske model




De fergeliking fan de relaasje tusken de studearre yndikatoaren foar meardere korrelaasje wurdt bepaald op basis fan ferskate koeffizienten. Om 'e regression-lykweardigens te annulearjen (genôch) echte simeleare sosjaal-ekonomyske prosessen of fenomenen, moatte de betingsten en easken fan meardere korrelaasje- en regression-analyse foldien wurde.

Korrelaasje - regression analyze : in analysearjend ekspresje fan de lykweardigens (rjochthâld, krulilinear) regression foar in multyfunksjonele korrelaasje-regressionmodel. Bestimming fan parameters en har ynterpretaasje.

De slotens fan 'e relaasje tusken har wurdt mjitten troch it ferhâlding fan' e faktorfeardigens nei de totale fariant fan it resultaat fan 'e resultaat, de yndeks fan bepalingen neamd. De yndeks fan determinaasje karakterisearret it oanpart fan fariaasje fan 'e resultaatlike trait ûnder ynfloed fan' e faktorigens yn 'e totale fariaze fan' e resultant trait. As der in korrelaasje tusken de buorden is, dan as it ferheget, d. It fergrutsjen fan de fergeliking fan 'e relaasje tusken produktive en faktyksynten, de yndeks fan determinaasje ferheget en fermindert as it swakket. Sa is de yndeks fan bepalingen karakterisearret de slotens fan 'e ferbining, de omfang fan' e korrelaasje oan 'e funksjonele.

De fjouwerkantwurde fan 'e yndieling fan bepalingen is de korrelaasjekeks of it teoretyske korrelaasjewet . De korrelaasjekeks, of it teoretyske korrelaasjebestân, karakterisearret de fergeliking fan 'e ferbining yn ien of oare foarm fan ôfhinging. Residuele fersprieding It is nedich om de bêste funksje te selektearjen dy't de measte útkomt (oanwêzich) de empiryske regressionline. De oanpassende funksje wurdt keazen troch it minimum fan 'e residuele dispersion s 2 OST = S (y t - ) 2 / n of .

In spesjale gefal fan ' e korrelaasjekeksje is de lineêre korrelaasjekoeffizient r , dy't brûkt wurdt om de fergeliking fan' e relaasje mei in lineêre ferhâlding te skatten. De korrelaasjekoeffizient nimt wearden fan -1 oant 1, en jildt net allinich ferpleatst, mar ek de rjochting fan 'e relaasje. It "+" teken jout in direkte relaasje tusken effektyf en faktorken, it "-" teken jout in ynverskige relaasje tusken harren. As r = 0, dan is der gjin ferbining tusken de tekens. De tichterby r is ta ienheid, de tûker is de ferbining tusken de beskôge funksjes.

Mei in lineêre foarm fan kommunikaasje is de parameter fan 'e lykweard fan in rjochte line in regressionskoeffizient a 1 en in korrelaasjekoeffizient r binne as neikommende ferbinings :

en 1 = rs y / s x . Yn it gefal fan in rjochte line-ferbining is de lineêre korrelaasjekoeffiziente identysk mei de korrelaasjekeks, se binne nûmereel lykas: .

De lineêre korrelaasjekoeffizient r wurdt brûkt om de ferhâlding fan 'e relaasje mei in lineêre ferhâlding te beskachten: de lykweardigens fan' e rigel = a 0 + a 1 x


border=0


Om de berekkeningen fan 'e lineêre korrelaasjekoeffizier te ferienfâldigjen, brûk de transformearre formule: .

De natuer fan 'e relaasje wurdt bepaald troch de wearde fan' e korrelaasjekoefficiënt :

r korrelaasjekoeffinisjale wearde kommunikative karakter
r = 0 oant op 0.3 praktysk ôfwêzich
0 <r <1 0,3 - 0.5 + rjocht swak
-1 <r <0 0.5 - 0.7 - reverse moderatyf
r = 1 0.7 - 1.0 1 - funksjonele sterk

De betsjutting fan 'e lineêre korrelaasjekoeffizient wurdt bepaald troch t - learkrityk t. Is bepaald troch de berekkende wearde fan t calc , dy't fergelike is mei de tabelwearde t krit . De lineêre korrelaasjekoeffizient wurdt beskôge as de ferhâlding: t calc > t krit .

mei n mei n <50.

t krit wurdt bepaald troch de tabel "De wearde fan it kritearium fan t - studint op it nivo fan betsjutting 0,10, 0,05, 0,01 en frijheid .

De taak fan multifaktor-korrelaasje - regression analisisearring is, earst, in oantal faktoaren te studearjen dy't ynfloed binne op 'e yndikaasje dy't it be>

Mathematysk is de opdracht om de analytyske útdrukking fan 'e funksje te finen = f (x 1 , x 2 , x 3 , ..., x n ), dy't it meast de ferbining fan faktaalsylden mei it resultaat biedt. De resultaten fan 'e teoretyske analyze en de mooglikheid fan har oanfraach oan' e praktyk hingje ôf fan 'e goeie kar fan' e regressionfunksje, dus moat de foarm fan 'e keppeling benammen oerienkomme mei de eigentlike besteande keppelings tusken de resultant- en faktuele eigenskippen. De muoite fan it selektearjen fan in funksje is dat de effektive funksje mei ferskillende faktoaren yn ferskate foarmen fan ferbining wêze kin - rjochtfeardich en kruvilinear. De empiryske justifikaasje fan 'e funksje fan funksje mei grafiken fan paadlike relaasjes is praktysk net te brûken foar meardere korrelaasje en regression.



De kar fan 'e foarm fan' e meardere regressionske-gearhing is basearre op in teoretyske analyze fan it fenomenologysk ûndersyk. As de analyze fan ynterregaasjes tusken 'e effektive en faksjale sinnen net slagget om op ien of oare foarm fan ferbining te bliuwen, dan sjogge se troch ferskillende funksjes en kieze de optimale út' e minst fan 'e omstannichheden fan' e empiryske wearden fan 'e effektive karakteristike lykweardige, mar dat betsjuttet in protte wurkleazens yn' t it berekkenjen fan de parameters fan ferskate lyknames. As der spesjale software is, dy't it algoritme foar iterieren oer ferskate PCR-lykminten útfiert, wurde ferskate modellen krigen, de bêste wurdt selektearre troch statistyske kontrôle fan de parameters fan 'e lykboaasje basearre op it t-t- test fan de studint en Fisher 's test .

De kar foar de foarm fan de lykweardigens fan mear regression wurdt útfierd yn 'e praktyk

basearre op it gebrûk fan fiif types fan modellen :

linear in 0 + a 1 x 1 + a 2 x 2 + ... + a n x n ;

macht ;

indicative ;

parabolysk

hyperboalysk

Meastentiids stopje op lineêre modellen. Dit is lykwols ferklearre troch it feit dat earder de parameters fan lineêre lykwichten maklik ynterpretearre binne, de modellen sels binne ienfâldich en handich foar de ekonomyske analyze, en as twadde, asjebleaft, kin elke funksje yn in lineêre foarm feroarjen wurde troch logarithming of feroarjende fariabelen.

Yn ' e lineêre regression-lykwicht yn' e lineêre foarm binne de paragrafen а 1 , а 2 , а 3 , ..., аn - de regressionskoeffizers, de ynfloed fan 'e relevante faktoaren oer it resultaat fan' e resultaat as oare faktueren fêstlein binne op it gemiddelde nivo, d. hoefolle y wizigje mei in ferheging fan de oerienkommende faktor om 1 puntsje fan syn feroare ienheid; de parameter in 0 is in frije lid, it hat gjin ekonomysk sin.

De parameters fan de mear regressionske-gearhing , lykas it pear, wurde berekkene troch de minste kwadratenmetoade basearre op 'e oplossing fan it systeem fan gewoane lyknames. Sûnt de regressionskoeffizers binne unparmabele mei elkoar (de faktors hawwe ferskillende ienheden fan mjitting), is it net mooglik te fergelykjen de krêft fan 'e ynfloed fan elke fan' e faktoren dy't yn 'e modelle opnommen binne op' e resultantindige op basis fan 'e regressionskoeffizers. Om de relative krêft fan 'e ynfloed fan faktoaren te beoardielje, wurde dieliale elastyske koeffizienten en b-koeffizienten berekkene.

De persoanlike elastetyske koeffizient lit sjen hoe folle prosint yn gemiddelde de effektive yndikaasje feroaret as de faktor feroaret troch 1% en de fêste posysje fan oare faktueren en wurde elk faktor bepaald:

dêr't in i de regressionskoeffizient is foar de i-th-faktor; - de gemiddelde wearde fan 'e i-faktor; - de gemiddelde wearde fan de effektive yndeks.

De b-koeffizient lit sjen dat in part fan 'e standert ôfwikking feroaret de resultant attribút as de oerienkommende faktor feroaret troch de wearde fan syn standertdevigaasje , dêr't s xi , s y - de standert ôfwikingen fan 'e i-f-faktor en de resultant trait.

Troch it feit dat ekonomyske fenomenen eksposearje oan meardere en komplekse oarsaken, soene wichtige, systematyske aktive faktoaren yn 'e meardere regressionske-gearkomste opnommen wurde as it beynfloedzjen fan de ynfloed fan oare faktoaren. De wichtichste faktoaren wurde selektearre op grûn fan 'e analyse fan slotens en materiaal fan' e relaasje tusken de faktoaren en de effektive yndikaasje. Yn dit gefal is de betingst foar it opnimmen fan faktoaren yn 'e modelle it fennoat fan in hechste korrelaasje tusken har, dy't ticht by funksjonele is. De oanwêzichheid fan in tige tichte linear ferhâlding tusken de twa faktoaren (de lineêre korrelaasjekoeffizient r oer de absolute wearde fan 0,85) wurdt kollineariteit neamd, en tusken ferskate faktoaren - multikollineariteit .

De oarsaken fan multikollineariteit tusken de tekens binne, earst, dat de analysearre tekens itselde side fan in fenomeen of proses karakterisearje (bygelyks it autorisearre haadstêd en it oantal meiwurkers karakterisearje de grutte fan it bedriuw) en it is net oan te rieden om se yn 'e modelle tagelyk op te nimmen; Oan 'e oare kant binne faktoarkers eleminten eleminten, duplizearje elkoar of har folsleine wearde jout in konstante wearde (bygelyks de spesjale tsjinst en kapitaalferhâlding, it oandiel fan ferlienen en eigen fûnsen). As multikollineare faktoaren yn 'e modelle opnommen wurde, dan sil de regressionske-gearhing net in echte ekonomyske relaasjes wjerspegele wurde, de modelparameters wurde feroare (oerwichtige), de betsjutting sil feroare wurde, en de ekonomyske ynterpretaasje fan' e regression- en korrelaasjegeskyen sil dreech wêze.

Dêrom, as it bouwen fan in model, wurdt ien fan 'e kollineare faktoaren útsletten op' e basis fan kwalitative en logyske analyze, of de earste faktyen binne feroaren yn nije, fergrutte. De kwaliteit en adequacy fan it model nei in echte sosjaal-ekonomysk fenomen en proses wurdt bepaald troch de optimiteit fan it oantal faktorken: de mear faktors binne opnommen, wat better it model beskriuwt it fenomeen en proses, mar sa'n model is net maklik om te fieren; Mei in lyts tal faktueren is it model net genôch adekwaat.

It probleem foar it selektearjen fan faktyksynten en it ferminderjen fan de dimensje fan it model fan meardere korrelaasje is besluten op grûn fan heuristyske en multidimensjonele metoaden fan analyze. De heuristyske metoaden fan 'e analyze sjogge de metoade fan ekspertlike evaluaasjes, basearre op yntuïtyske logyske prioriteiten en in ynhâldlike en kwalitative analyze fan nonparametriske yndikatoaren fan kommunikaasdichtheid: korrelaasje fan korrelaasje fan rang, konkordânsje. De meast brûkte metoade is stap foarôfgeande regression , besteande út de opfolgjende ynkling fan faktoaren yn it model en de beoardieling fan har betsjutting.

As in faktor yntrodusearre is wurdt fêststeld hoefolle de somma fan kwadraten fan residualen fermindert en de wearde fan 'e mearfâldige korrelaasjekoeffizient R ferheget . As de faktor x k yn it model is opnommen, wurdt de wearde fan R ferhege en de regressionskoeffizient k kt net feroarsake of wat feroaret, dizze faktor is wichtich en syn ynslúzje yn it model nedich.

· De totaliteit fan 'e studearre yndikatoaren moat homogene wurde neffens de betingsten foar it opsetten fan effektive en faktyksyngen (ûnderskate beoardielen moatte útsletten wurde fan' e totaliteit);

It resultaat fan 'e attribus moat de normale ferdieling rjocht hâlde, de faktoraal moat tichtby wêze fan' e normale ferdieling. As it volume fan 'e aggregat genôch grut is (n> 50), dan kin de normale fan' e distribúsje befestige wurde basearre op de berekkening en analyze fan 'e Pearson, Yastremski, Kolmogorov, Boyarski en oare kritearia;

· It simulearre fenomenon of proses wurdt kwantitatyf beskreaun (de parameters moatte in numerike ekspresje hawwe) mei ien of mear ekigaasjes fan cause-effekt-relaasjes. It is oan te rieden om kozale relaasjes te beskriuwen troch linear of ticht by lineêre foarmôfhinklikens;

Konsistinsje fan 'e territoriale en tydlike struktuer fan' e studearre befolking, it ûntbrekken fan kwantitative beheiningen op 'e modelparameter;

Sufficiency fan populêre ienheden : har nûmer moat ferskate kear grutter wurde as it tal faktueren yn it model is. Elke faktor moat op syn minst 5-6 beoardielingen rekkenje, d. it tal faktorsynten moatte 5-6 kear minder wêze as it volume fan 'e studearre populaasje.

De wichtichste stapings fan korrelaasje en regression analyze binne:

In preliminary teoretyske analyze fan 'e essinsje fan' e fenomeen, wêrtroch't feroaring fan 'e oarsaken fan' e effekten tusken sinnen, selektearje de wichtichste faktoaren, beslute oer de mjitting fan effektive en faktorsynten;

De tarieding fan inisjale ynformaasje , ynklusyf fragen fan 'e adequacy fan observaasje-ienheden, de homogeneiteit fan' e set fan studearre eigenskippen en de omjouwing fan har distribúsje oant de normale;

· De kar foar de foarm fan de relaasje tusken de prestaasjesindikator en faktoaren basearre op it opnimmen fan ferskate analysearjende funksjes;

De stúdzje fan 'e fergeliking fan' e relaasje tusken de leeftydskindige en faktoaren, lykas tusken faktoaren basearre op 'e bou fan in matrix fan paar linearisele korrelaasjekoefficiënten en skermings fan multicollineare faktoaren;

Seleksje fan wichtige (wichtige) faktueren dy't yn it multifaktormodel opnommen binne - de lykweardigens fan mear regression, basearre op de oerienkommende statistyske metoaden;

Kalkulaasje fan parameters fan ' e meardere regressionske-gearhing en beoardieling fan' e betsjutting fan selektearre faktoaren, korrelaasje- en regressionskoeffizienten mei help fan 'e t- Studinte- en F- Fisher- kritearia;

Analysis of the results.

De ynterregraasjeferienings tusken tekens wurde as regel analysearre op grûn fan problemen beoardielingen om te kontrolearjen dat de ôfhinklikens fan ôfhingingen regelmjittich binne as willekeurich, de betsjutting (materiaal) fan 'e korrelaasje- en regressionindikaasjes wurdt beoardield.

Korrelaasje - regressionske analyze wurdt brûkt om de bedriuwsplanyniken en reglemintêre nivo's fan ekonomyske yndikatoaren te beoardieljen, wylst de effisjinsje fan gebrûk makket fan produksjemiddels, identiteit fan besteande produksreserves, in fergelykjende analyse, it beoardieljen fan potinsjes fan bedriuwen, koarte termyn prognizearjen fan produksjeûntwikkeling.

De meardere regressionsking kin jo de teoretyske, mooglike wearde fan 'e effektive yndikator fine foar bepaalde wearden fan faktorsynten.

De parameters fan 'e meardere regressionske-gearkomste wurde berekkene troch de minste kwadraten metoade op basis fan it oplossen fan in systeem fan gewoane lyknames. Foar in lineêre regression-lykweardigens mei n faktoaren wurdt in systeem boud fan (n + 1) gewoane lyknommen:

a 0 n + a 1 Sx 1 + a 2 Sx 2 + ... + a n Sx n = Sy,

a 0 Sx 1 + a 1 Sx 2 1 + a 2 Sx 1 x 2 + ... + a n Sx 1 x n = Syx 1 ,

:

a 0 Sx n + a 1 Sx 1 x n + a 2 Sx 2 x n + ... + a n Sx 2 n = Syx n .

De fergeliking fan de relaasje tusken de studearre yndikatoaren foar meardere korrelaasje wurdt bepaald op basis fan ferskate koeffizienten.

Ferkearde korrelaasjekoefficiënten mjit de neistens fan 'e lineêre ferhâlding tusken de faktoaren en tusken de resultant mark en elk fan' e faktoren beskôge sûnder rekken mei har ynteraksje mei oare faktoaren.

Partial correlation coefficients karakterisearje de mjitte fan ynfloed fan faktoaren op 'e resultant mark, asjebleaft dat de oare faktors op in konstante nivo fêste binne. Ofhinklik fan it oantal faktoaren wêryn't ynfloed útsluten wurdt, kinne bysûndere korrelaasjekoafkes fan 'e earste oarder (mei it útsluten fan' e ynfloed fan ien faktor) fan 'e twadde oarder (mei it útsluten fan de ynfloed fan twa faktoaren), ensfh.

De dielde korrelaasjegongtekst fan 'e earste bestelling tusken y en x 1, wylst ek de ynfloed fan x 2 yn in twa-faktormodel útsletten wurdt, wurdt berekkene troch de formule: ,

dêr't r yx 1 , r yx 2 , r x1x2 - pearde korrelaasjekoefficiënten tusken de oerienkommende tekens binne.

De kumulative multiple correlation coefficient, R, skattet de slotens fan 'e relaasje tusken it resultaat-attribút en alle faktoaren. Dit is de wichtige yndikaasje fan lineêre meardere korrelaasje. Foar in twa-faktormodel wurdt de kumulative meardere korrelaasjekoeffizient berekkene troch de formule:

. De kumulative korrelaasjekoeffizient R ferfarret fan 0 oant 1. De lytsere empiryske wearden fan 'e resultaat fan' e trait binne ôfwikend fan dy linen yn 'e meardere regressionline, it tichterby de korrelaasje-relaasje tusken de studearre parameter en de kumulative meardere korrelaasjekoeffizient oan ienheid.

De kumulative koeffizient fan meardere determinaasje , lykas R 2 , lit sjen hoefolle fan 'e fariaasje fan' e resultatlike trait is troch de ynfloed fan 'e faktueren yn' e modelle.

De kumulative multiple correlation index karakterisearret de slotens fan 'e relaasje tusken it resultaat fan' e resultaten en alle faktoaren mei in krulilineare relaasje:

= wêr - de fersprieding fan 'e resultate trait ûnder ynfloed fan faktoaren yn' e modelle; - residuele fersprieding fan 'e resultant trait, feroarsake troch de ynfloed fan faktoaren dy't net rekken hâlden binne troch it model. Yn 'e lineêre foarm fan kommunikaasje binne de kumulative koeffizienten en de meardere korrelaasjekeksje elkoar elkoar.

De betsjutting fan de mearfâldige korrelaasjekoeffizient R wurdt bepaald troch it kritearium F - Fisher. Is bepaald troch de berekkende wearde fan F calc , dy't fergelike is mei de tabelwearde fan F crit . De koeffizienten fan meardere korrelaasje wurdt beskôge as de betsjutting: F calc > F crit .

of ,

n is it tal beoardielen, m is it tal parameter fan 'e lykboaasje.

F крит выбирается по таблице «Значение при заданном F – критерию Фишера при уровне значимости », en .

Оценка существенности включения фактора в модель осуществляется по частному F – критерию Фишера. Фактор считается значимым при соблюдении соотношения: F расч > F крит .

Д л я фактора х 1 : ;

Для фактора х 2 : .





; Datum tafoege: 2014-01-25 ; просмотров: 40223 ; Is it publisearre materiaal it urheberrecht? | | Persoanlike data beskerming | ORDER WORK


Hast net fûn wat jo sochten? Brûk it sykjen:

De bêste redaksjes: By laboratoarium wurket de studint dat hy alles kin; de learaar pretet him te leauwen. 8394 - | 6672 - of alles lêze ...

Sjoch ek:

border=0
2019 @ edudocs.fun

Side-generaasje oer: 0.009 sek.