Słychać czasem w mediach, że polskie społeczeństwo szybko się starzeje i czeka nas demograficzna apokalipsa. Czy rzeczywiście jest tak źle? Kiedy odczujemy pierwsze efekty tych zmian? Na wstępie zaznaczę, że będę się trochę mądrzyć. Próbuję używać common sense, ale rzecz jasna można, szczególnie będąc ekspertem, wysnuć z tych danych inne wnioski. Już za kilka lat zacznie się szybko kurczyć ludność wieku produkcyjnym. Wynika to z tego, że na emerytury przejdą liczne roczniki z lat 50-tych.

Kontynuuj czytanie

Dzisiaj rocznica bitwy o Monte Cassino, więc wpis będzie mały ,,charakter rocznicowy" :) Poniższa analiza oparta jest o stronę z informacjami o grobach polskich żołnierzy z II Wojny Światowej we Włoszczech. Jak wiadomo II Korpus złożony był z Polaków wywiezionych na Syberię przez bolszewików. Jakich wyznań byli Polacy, którzy zginęli pod Monte Cassino? Czy broni się w tych danych stereotyp polaka-katolika? Monte Cassino to jedna z najważniejszych bitew w jakich uczestniczyli Polacy po roku 1939.

Kontynuuj czytanie

Lie factor, czyli współczynnika kłamstwa, jest miarą zaproponowana przez Edwarda Tuftego do opisu niezgodności wielkości przedstawionej na grafice, do rzeczywistej liczby wynikającej z danych. Udało mi się upolować bardzo ciekawy przykład pochodzący z twitta Michała Szczerby, posła na Sejm, któremu udało się na jednej grafice umieścić dwa rysunki o różnych współczynnikach kłamstwa. Rzeczywisty stosunek nakładów na szkolnictwo to 16.02:10.71, czyli niemal idealnie 1.5:1. A jak to wygląda na rysunku? Wysokość zmierzyłem za pomocą GIMPa.

Kontynuuj czytanie

W ostatnim wpisie zastanawiałem się nad możliwą przyczyną tego, że płace w Polsce rosną wolniej niż PKB (oba liczone w dolarach bez parytetu siły nabywczej). Przy okazji zainteresowało mnie, że dużo od Polski mniejsze Czechy mają niemal taką samą wymianę handlową. Czy można jednak powiedzieć, że handel zagraniczny rośnie w Polsce zbyt, cokolwiek by to nie miało znaczyć, wolno? Wzrost polskiej wymiany handlowej po roku 1989 jest znacznie wyższy niż dynamika światowego handlu.

Kontynuuj czytanie

Czy moglibyśmy w Polsce zarabiać o 50% więcej? W dzisiejszym wpisie zbadamy jak są ze sobą powiązane wzrost PKB na mieszkańca i wzrost wynagrodzeń. W szczególności zobaczymy czy płace w Polsce rosły równie szybko, jak wartość wytwarzanych towarów, oraz jak wyglądamy pod tym względem na tle innych krajów europejskich i świata. Nie mam pełnych danych na temat wynagrodzenia, ale porównamy wynagrodzenie za godzinę pracy w przemyśle (manufacturing) ze wzrostem PKB na mieszkańca.

Kontynuuj czytanie

Szychta w Danych działa dzięki dostępności bezpłatnych danych w internecie, w dużej mierze pochodzących od różnego typu urzędów. Dlatego bardzo interesują mnie konsultacje, jakie przeprowadza Ministerstwo Cyfryzacji, w formie ankiety, dotyczące tego, jak powinny być udostępniane dane publiczne. Zachęcając do jej wypełnienia, podzielę się kilkoma wrażeniami z korzystanie z serwisu Dane Publiczne. Zacznijmy od rzeczy pozytywnych. Strona jest porządnie zrobiona, łatwo się po niej poruszać. Dane pochodzą z wielu różnych ministerstw i agencji rządowych.

Kontynuuj czytanie

W Polsce ma miejsce proces szybkiego rozwoju największych miast i miejscowości leżących w ich bezpośrednim sąsiedztwie. Duży sukces potrafi niestety generować duże problemy, i nie każde z miast potrafi sobie z nimi równie dobrze poradzić. W dzisiejszym wpisie skupimy się na tym, czy przyrost liczby mieszkańców i rozbudowa osiedli mieszkaniowych jest bilansowana zwiększonymi nakładami na transport publiczny.Zacznijmy od analizy infografiki, która wprowadzi nas w ten problem. W których powiatach liczba mieszkańców najszybciej wzrasta, a które najszybciej zwiększają swoje wydatki na transport publiczny?

Kontynuuj czytanie

Sporo mówi się o tym, że w Polsce mamy problem demograficzny. Rodzi się za mało dzieci, a za kilkadziesiąt lat czekają nas bardzo duże problemy finansowe, związane z koniecznością wypłaty dużej liczby emerytur przez małą liczbę pracujących. Zobaczmy jak bardzo zmieniła się struktura polskich rodzin w przeciągu 35 lat i czy gdyby rodzin wielodzietnych było więcej to problem demograficzny zostałby zażegnany? Jednym z problemów na jaki się wskazuje jest to, że kobiety nie decydują się na drugie i kolejne dzieci.

Kontynuuj czytanie

Wbrew tytułowi, dzisiejszy wpis nie będzie dotyczył teologii, tylko ekonomii, a konkretnie (nie)równej dystrybucji dóbr. Pretekstem jest artykuł w Washington Post na temat wizyty Berniego Sandersa, kandydata w prawyborach prezydenckich Partii Demokratycznej, u papieża Franciszka. To co łączy tych dwóch panów, to krytyka liberalnego kapitalizmu, za to, że nie udało mu się doprowadzić do zniwelowania nierówności społecznych i gospodarczych na świecie. Czy rzeczywiście tak jest? Co ma na swoją obronę kapitalizm?

Kontynuuj czytanie

Dzisiaj kolejna odsłona analizy danych komunikacyjnych na Górnym Śląsku. Gdzie tramwaje i autobusy kursują za rzadko? Mieszkańcy których miast nie wykorzystują skierowanej do nich oferty? W oparciu o dane z serwisu jakdojade.pl, zbadamy na ile liczba pasażerów zdeterminowana jest przez liczbę kursów KZK GOP oraz przez czynniki demograficzne. Pierwsze pytanie jest następujące: czy liczba kursów jakie wykonuje komunikacja miejska jest dostosowana do liczby mieszkańców? Dla każdego przystanku zliczona została łączna liczba kursów jakie dziennie wykonuje na nich KZK GOP.

Kontynuuj czytanie

Czasem strach jaki odczuwamy przed terroryzmem, zwłaszcza w Polsce, może wydawać się przesadzony. Jest jednak na świecie wiele miejsc, gdzie terroryzm jest niestety codziennością. W dzisiejszym wpisie prezentuję interaktywną mapę światowego terroryzmu. Aby uruchomić interaktywną mapę wystarczy kliknąć na obrazek poniżej. Uwaga, docelowy plik jest dosyć duży (około 15MB), a w miarę przybliżania wybranego regionu świata, dodatkowo ściągana jest mapa z serwisu open street map. Łączny przesył danych, może więc trochę kosztować :)[

Kontynuuj czytanie

Wszystko co chcielibyście wiedzieć o GOP, ale nie mieliście danych :) W dzisiejszym wpisie przybliżę temat funkcjonowania, unikalnego w skali Polski, systemu komunikacji zbiorowej na Górnym Śląsku. Nigdzie indziej nie mamy tak wielu miast leżących tak blisko siebie i mających wspólny transport publiczny. Ile centrów, popularnych wśród mieszkańców, znajduje się na Górnym Śląsku? Do których miast/dzielnic nikt nie chce jeździć i dlaczego? Na jakich trasach przemieszczają się mieszkańcy GOP? Poniższy wykres to zestawienie wszystkich wyszukiwanych połączeń.

Kontynuuj czytanie

W jakich krajach i regionach przeprowadzanych jest najwięcej zamachów terrorystycznych? Czy jest uzasadnionym, żeby mówić o tym, że Europa Zachodnia jest szczególnie atakowana, czy też mamy do czynienia z globalną eskalacją terroryzmu? Mam wrażenie, że czasem zapominamy iż terroryzm nie jest zjawiskiem nowym. Od dawna wywiera on znaczący wpływ na kształtowanie rzeczywistości politycznej. Wystarczy przypomnieć, że jedna z największych humanitarnych tragedii w historii Europy, I Wojna Światowa, rozpoczęła się od zamachu terrorystycznego w Sarajewie.

Kontynuuj czytanie

Drogi rowerowe

Na stronie fejsbukowej MojaPolis pojawiło się zestawienie miast w Polsce pod względem długości tras rowerowych. Zestawienie dotyczy wartości bezwzględnych, a my spojrzymy na te dane w odniesieniu do powierzchni gmin. W więcej niż połowie gmin w Polsce nie ma żadnych dróg rowerowych. Dotyczy to zwłaszcza Polski wschodniej. Duża gęstość ścieżek rowerowych związana jest nie tylko z dużymi miastami. Część z nich można zidentyfikować jako regiony turstyczne, np. Góry Sowie na Dolnym Śląsku.

Kontynuuj czytanie

Dzisiaj krótko na temat tego, jak stworzyć rysunki z wpisu o wzroście wynagrodzeń. Dane pochodzą z Banku Danych Lokalnych GUS. Kontury województw pochodzą ze strony Centralnego Ośrodka Dokumentacji Geodezyjnej i Kartograficznej. Na początku wczytujemy kontury województw za pomocą pakietu rgdal. [github file = “/psobczyk/szychtawdanych/blob/master/wynagrodzenia/analiza_wynagrodzenia.R” start_line = “10” end_line = “12”] _Data.frame _ nazwy, to brzydki hak, służący do łączenia danych. Jego przydatność zobaczymy później. Dalej przekształcamy, za pomocą funkcji fortify z pakietu ggplot2, dane z typu SpatialPolygons do data.

Kontynuuj czytanie

Czy Polska bogaci się równomiernie? Czy regiony historycznie biedniejsze gonią te bogatsze czy też dystans między nimi się zwiększa? Na początek zobaczmy jak wygląda średnie wynagrodzenie brutto w podziale na województwa. Gołym okiem widać ogromne dysproporcje pomiędzy Warszawą, a resztą Polski. Różnica w wynagrodzeniach pomiędzy Mazowszem a Górnym Śląskiem jest większa niż między Górnym Śląskiem a najbiedniejszymi Warmią i Mazurami. Ale może Warszawa jest goniona przez resztę Polski? Jak zmieniły się zarobki w ciągu ostatnich 12 lat?

Kontynuuj czytanie

Kolejny wpis z serii jak to zrobić w R. Dzisiaj krótkie wprowadzenie do tego jak ściągać bezpośrednio do R tabele zawarte na stronach internetowych, jak kierować zapytania do API, jak przetwarzać otrzymane od serwera odpowiedzi i jak to wszystko połączyć w niebanalną analizę. Ściąganie tabel do R Wykorzystamy w tym celu pakiet XML. Ściągniemy listę najbardziej kasowych filmów wszechczasów. [github file = “/psobczyk/szychtawdanych/blob/master/filmy/analiza_actors_directors.R” start_line = “2” end_line = “10”] Bardziej ogólne rozwiązania opiera się na wczytaniu całego pliku i ręcznego wybrania interesującego nas fragmentu korzystając z XML-owych tagów.

Kontynuuj czytanie

W najbliższym czasie uchwalony zostanie rządowy program świadczeń na dzieci w wysokości 500 złotych miesięcznie. Do procesu obiecywania dołączyła cześć opozycji. Pytanie czy taki program w ogóle ma sens? Czy dokonano dogłębnej diagnozy obecnej sytuacji demograficznej Polski? Czy pomysł na wydawania pieniędzy w formie zasiłku jest efektywny? Ile będzie kosztować budżet narodzenie jednego dodatkowego dziecka w wyniku działania programu 500+? Zaczynamy od porównania. Głównym moim źródłem jest wpis na blogu BIQdata oraz raport firmy PwC, na którym tenże wpis się opiera.

Kontynuuj czytanie

Czy w przemyśle filmowym kryje się seksizm i przewaga mężczyzn nad kobietami? Nawet pobieżne przejrzenie internetu przyniesie odpowiedź że zapewne tak właśnie jest. Na przykład pierwszy wynik w google daje infografikę na ten temat. W dzisiejszym wpisie przyjrzymy się najbardziej kasowym filmom w historii. Sprawdzimy którzy aktorzy i reżyserzy stoją za ich sukcesem, a także jaki jest wśród nich udział kobiet.Na stronie boxofficemojo można znaleźć dane dotyczące 630 najbardziej kasowych filmów wszechczasów.

Kontynuuj czytanie

Nowa seria wpisów na Szychcie - książki przeczytane i warte napisania krótkiej recenzji. Zaczynam od ,,Ekonomii dobra i zła" Tomasa Sedlacka. Od pierwszych stron ogromne wrażenie robi głębokie zakorzenienie autora w kulturze. Widzi on ekonomię jako jeden z wciąż powtarzających się tematów. Podstawowe pytania, na jakie szukają odpowiedzi ekonomiści, odnajduje w najstarszych pismach ludzkości (epos o Gilgameszu, Biblia, dzieła greckich filozofów). Sedlacek nie używa matematycznych wzorów i bardziej od ,,jak" interesuje go ,,dlaczego".

Kontynuuj czytanie

Zdjęcie autora

Szychta w danych

Blog o poznawaniu świata za pomocą danych

Piotr Sobczyk