Współczynnik korelacji to kolejna, po opisywanym wcześniej odchyleniu standardowym, miara wykorzystywana w inwestowaniu. Korelacja pozwala na ocenę w jaki sposób są ze sobą związane ceny i stopy zwrotu poszczególnych aktywów. Może to pomóc w procesie dywersyfikacji portfela w celu ograniczenia jego ryzyka inwestycyjnego. Jakiś czas temu pisałem o tym co to jest i jak działa odchylenie standardowe. W tym wpisie przyglądam się kolejnemu pojęciu z pograniczna światów statystyki i inwestowania, czyli współczynnikowi korelacji.

Co to jest współczynnik korelacji?

WPIS >>> Odchylenie standardowe – jak mierzyć ryzyko? – wcześniejszy wpis o ryzyku w inwestowaniu
Współczynnik korelacji to miara statystyczna mówiąca jak mocno wpływają na siebie 2 dane. Im wyższy współczynnik korelacji, tym większe prawdopodobieństwo, że 2 różne wartości, które obserwujemy, będą się zachowywały podobnie. Korelacja może mieć również wartość ujemną – wtedy wzrost jednej wartości będzie oznaczał, że druga prawdopodobnie zachowa się odwrotnie i spadnie. Współczynnik korelacji (występujący również w literaturze jako „współczynnik korelacji Pearsona”) jest tzw. miarą zestandaryzowaną, co brzmi może skomplikowanie, ale oznacza, że jest miarą bardzo łatwą w interpretacji. Współczynnik korelacji przyjmuje wartości od -1 (doskonała ujemna korelacja) poprzez 0  (całkowita niezależność danych) do 1 (doskonała dodatnia korelacja). Wartości +1 i -1 dla współczynnika korelacji oznaczają dane idealnie ze sobą powiązanej. W takim przypadku nie ma pola na działanie przypadku i oznacza to bezpośrednią zależność jednej wartości od drugiej. Zwykle taka zależność ma jakiś bezpośredni związek przyczynowo-skutkowy i daje się przedstawić za pomocą funkcji liniowej. Dla rzeczywistych danych współczynnik korelacji będzie określony ułamkiem dziesiętnym pomiędzy -1 a 1 np. +0,4 albo -0,6.

Korelacja – 2 przykłady z warszawskiej giełdy

Zerknijmy przykładowo na związek stóp zwrotu z KGHM i kontraktów terminowych na miedź na wykresie za ostatnie 12 miesięcy:
Wykres: akcje KGHM i kontrakty terminowe na miedź - 12 miesięcy
Patrząc na wykres można domniemywać, że występuje dość wyraźny związek pomiędzy cenami miedzi a cenami akcji KGHM. Współczynnik korelacji pomiędzy stopami zwrotu z tych 2 wartości to +0,53 – wartość wyliczona dla ostatnich 250 sesji. Korelacja jest zauważalna, choć nie jest  doskonała. Przyczyną może być np. fakt, że ceny miedzi są wyrażone w dolarach, a ceny akcji KGHM w złotych polskich, więc dochodzi dodatkowy czynnik w postaci kursu walutowego USDPLN.
Wykres: indeksy GPW w Warszawie - WIG i WIG20 - 12 miesięcy
Innym przykładem może być korelacja pomiędzy głównymi indeksami warszawskiej giełdy – WIG i WIG20. Tutaj wizualny związek jest dużo silniejszy i potwierdza to również statystyka. Współczynnik korelacji pomiędzy stopami zwrotu z tych dwóch indeksów wynosi 0,98 (wartość wyliczona dla ostatnich 250 sesji -około  12 miesięcy). Spółki wchodzące w WIG20 to pod względem wagi około 70% indeksu WIG, więc aż tak duża korelacja pomiędzy stopami zwrotu nie powinna być zaskoczeniem.

Ile możemy wyjaśnić za pomocą współczynnika korelacji?

Na początek warto zwrócić uwagę, że współczynnik korelacji nie wyjaśnia zmian jednego parametru w takim procencie jak jego nominalna wartość. Udział zmian wartości jednej danej w zmianach wartości jest równy kwadratowi współczynnika korelacji. Taka informacja jest nazywana współczynnikiem determinacji R² (er kwadrat).
Przykład 1
Współczynnik korelacji między X a Y na poziomie +0,50 wyjaśnia tylko 25% zmian wartości X.
Możemy to policzyć podnosząc do kwadratu wskaźnik korelacji (50% to 0,5 więc R² = 0,5*0,5 = 0,25 = 25%).
Przykład 2
Jeśli współczynnik korelacji wyniesie pomiędzy X a Z wyniesie -0,3, wówczas jedynie 9%  zmian X można  przypisać  zmianom Y. R² wyniesie 9% (0,3 x 0,3 = 0,09 = 9%)
Warto zwrócić uwagę, że aby można było wyjaśnić więcej niż 50% zmian wartości, to współczynnik korelacji musi być wyższy niż 0,71 (wartości między 0,71 a 1,00) lub niższy niż -0,71 (wartości między -0,71 a -1,00)
Cały czas trzeba pamiętać, że współczynnik korelacji mówi tylko o związku statystycznym, a nie przyczynowo-skutkowym. Mając odpowiednią liczbę zbiorów danych prędzej czy później znajdziemy 2 zbiory, pomiędzy którym będzie zachodziła wykrywalna statystycznie korelacja. W dawnych czasach przykładem takiego związku statystycznego była korelacja między nakładem gazety „Trybuna Ludu” a pogłowiem bydła w jednym z afrykańskich krajów. Oczywiście nie miało to ze sobą żadnego związku. Tym niemniej warto poszukiwać wykrywalnych statystycznie związków, bo być może jest między nimi jakaś zależność przyczynowo-skutkowa.

 Współczynnik korelacji dla spółek z indeksu WIG20

 W poniższej tabelce są przedstawione współczynniki korelacji pomiędzy poszczególnymi parami spółek z indeksu WIG20 oraz pomiędzy samymi spółkami oraz indeksem WIG20. Obliczenia zostały przeprowadzone dla dziennych stóp zwrotu z poszczególnych akcji oraz indeksu za 12 miesięcy (okres od 16 października 2017 do 16 października 2018).
Tabela: współczynnik korelacji pomiędzy spółkami z indeksu WIG20

W jaki sposób czytać taką tabelę korelacji?

Poniżej kilka wskazówek:
  • wartości liczbowe oznaczają współczynnik korelacji pomiędzy spółką podaną w tytule wiersza i kolumny
  • na przekątnej (zielone wartości) widzimy wartość 1.00 – jest to korelacja stopy zwrotu spółki z samą sobą, obliczana ze względów „technicznych”.
  • korelacja ma charakter symetryczny, więc części tabeli nad i pod przekątną mają takie same wartości. Przykładowo – korelacja między akcjami PKO BP i KGHM wynosi +0,38 i jest taka sama jak dla pary KGHM i PKO BP. Każda wartość w tabeli, poza wartościami na przekątnej, powtarza się 2 razy.
  • kolory oznaczają wielkość współczynnika korelacji – zielony to najwyższe wartości, czerwony najniższe, a kolor żółty to wartości przeciętne.
  • Spółki zostały ułożone branżami, tak żeby lepiej było widać ewentualną korelację pomiędzy spółkami z poszczególnych branż (banki, spółki energetyczne, paliwowo-gazowe, telekomy, handel)
  • każda para spółek ma współczynnik korelacji wyższy niż 0 (przypomnijmy, że może on mieć wartości od -1 do +1), co oznacza, że nie ma jakiejś spółki idącej bardzo wyraźnie w kontrze do rynku

Porównując pary spółek, widzimy, że:

  • najwyższa korelacja występuje pomiędzy spółkami z branży energetycznej (TAURON, ENERGA, PGE = +0,61/62) oraz pomiędzy dwoma spółkami paliwowymi (LOTOS o PKN ORLEN – +0,63)
  • najniższą korelację widać pomiędzy dość „egzotycznymi” parami spółek np. CDPROJEKT i EUROCASH (+0,05), CCC i PGNIG (+0,04), CYFROWY POLSAT i JSW (+0,05) albo ORANGE POLSKA i PGNiG (+0,06)
  • wysoką korelację widać również między spółkami z branży bankowej – od +0,30 do +0,57 (średnio +0,44 pomiędzy pięcioma bankami notowanymi w indeksie WIG20

Indeks WIG20 i jego korelacja z poszczególnymi spółkami

Dodatkową wartość niesie również analiza korelacji pomiędzy poszczególnymi spółkami a samym indeksem WIG20, co zostało zobrazowane w poniższej tabeli, gdzie znajdziemy:
  • korelację każdej spółki z indeksem WIG20
  • średnią wartość korelacji z innymi spółkami z indeksu (średnia z wierszy we wcześniejszej tabeli)
  • stopa zwrotu za ostatnie 12 miesięcy
  • udział spółki w indeksie WIG20
   Tabela: współczynnik korelacji pomiędzy spółkami oraz indeksem WIG20
Wnioski z analizy tabeli:
  • najwyższą korelację z indeksem mają spółki o największej wadze, kontrolowane przez Skarb Państwa (PKO, PZU, PKN, PEKAO – korelacja na poziomie +0,62/+0,74), Trochę z tej zasady wyłamuje się bank BZ WBK (aktualnie SANPL – Santander Bank Polska) ze współczynnikiem korelacji z indeksem WIG20 +0,65.
  • wysoka korelacja z indeksem jest widoczna również dla spółek z branży finansowej 5 banków oraz PZU) co wynika z ich dużego udziału w indeksie i z wysokiej wzajemnej korelacji spółek z sektora finansowego
  • najniższe wartości korelacji z indeksem WIG20 mają spółki prywatne, nie mające powiązać ze Skarbem Państwa (CCC, LPP, EUROCASH, CYFROWY POLSAT – korelacja na poziomie +0,27/+0,32)
  • nie widać prostego, bezpośredniego związku pomiędzy korelacją z indeksem a stopą zwrotu za ostatnie 12 miesięcy
  • wszystkie spółki mają dodatni współczynnik korelacji z indeksem WIG20 (najniższa wartość +0,27). Przypomnijmy, że przyjmuje on wartości od -1 do +1. Przy przyjętych zakresie analizy żadna ze spółek „nie porusza się” wyraźnie wbrew indeksowi.

Jak samemu policzyć współczynnik korelacji?

Celowo nie podawałem wzorów – mogą one odstraszać od próby intuicyjnego zrozumienia tych pojęć. Jeśli ktoś jest ciekawy – może bez problemu odszukać odpowiednie wzory w Wikipedii.
Jeśli chodzi o samodzielne policzenie współczynnika korelacji, to najprostszym sposobem będzie użycie arkusza kalkulacyjnego (MS Excel, Calc z pakietu OpenOffice). Aby obliczyć współczynnik korelacji, można użyć funkcji o nazwie WSP.KORELACJI() dla której podajemy 2 zakresy danych, a arkusz kalkulacyjny zwraca nam po prostu współczynnik korelacji.
Chcąc policzyć taką macierz korelacji jak dla spółek z indeksu WIG 20 można skorzystać z dodatku do MS Excel o nazwie „Analysis ToolPak” (link – jak załadować dodatek Analysis ToolPak do Excela?). Jedną z dostępnych w nim opcji jest właśnie utworzenie takiej macierzy korelacji.
Warto również zajrzeć do wpisu, w którym opisywałem najbardziej podstawowe pojęcia statystyczne.

Współczynnik korelacji – wskazówki praktyczne

We wpisie dotyczącym odchylenia standardowego podałem kilka wskazówek praktycznych, o których warto pamiętać, jeśli chcemy wykonać podobne obliczenia samodzielnie:
  • współczynniki korelacji liczymy nie dla cen aktywów, ale dla stóp zwrotu dla wybranego okresu (zazwyczaj dzienne lub miesięczne stopy zwrotu)
  • kluczowy jest zakres dat, dla którego liczymy – w zależności od przyjętego zakresu dat możemy otrzymać różne wartości;
  • wskazane wyżej miary są miarami statystycznymi, więc nie działają w sposób automatyczny
  • trzeba pamiętać, że miary statystyczne są obliczane na podstawie wartości historycznych i zaobserwowane prawidłowości niekoniczne będą się sprawdzać w przyszłości

Podsumowanie

Współczynnik korelacji jest wartością, która wskazuje. Policzenie takich wartości może nam pomóc np. przy dywersyfikacji portfela inwestycyjnego. Posiadając w portfelu spółki o dużym współczynniku korelacji może się okazać, że dywersyfikacja ryzyka jest tylko pozorna. Aby zmniejszyć ryzyko portfela warto dobierać spółki o jak najniższym współczynniku korelacji do pozostałych jego elementów.
Zapraszam do utrzymywania kontaktu z blogiem. Możesz to zrobić w następujący sposób:
– zapisać się na newsletter
– polubić na Facebooku fanpage bloga
– obserwować moje konto na Twitterze
Czy uważasz używanie współczynnika korelacji oraz innych miar statystycznych (np. odchylenie standardowe) za przydatne w inwestowaniu? Zapraszam do dyskusji w komentarzach.