Čo je R?
R je systém pre štatistické výpočty a grafiku. Skladá sa z jazyka a run-time prostredia s grafikou, debuggeru, má prístup k niektorým funkciám systému.
Jadro R je interpretovaný programovací jazyk, ktorý umožňuje vetvenie a opakovanie, modulárne programovanie pomocou funkcií a taktiež niekoľko objektových princípov. Väčšina z užívateľských funkcií v R je písaných v R. R distribúcia obsahuje funkcie pre veľké množstvo štatistických postupov. Medzi ne patria: lineárne a zovšeobecnené lineárne modely, nelineárne regresné modely, analýza časových radov, klasické parametrické a neparametrické testy, zhlukovanie a vyhladzovania. Je tam tiež veľká množina funkcií, ktoré poskytujú flexibilné grafické prostredie pre vytváranie rôznych typov dátových prezentácií. Doplnkové moduly (“add-on balíky”) sú k dispozícii pre rôzne špecifické účely.
R je rozšírený štatistický softvér, ktorý používajú celosvetovo úspešné spoločnosti ako Google, Facebook, Bank of America, Ford Motor Company, Mozilla, New York Times či Twitter. Skôr, ako začneme používať tento softvér, je dôležité poznať jeho výhody a nevýhody oproti iným štatistickým softvérom (náš výber).
Výhody
- Spracováva veľké množstvo dát (na rozdiel od Excelu – obmedzenie 256 stĺpcov a 65 tisíc riadkov)
- Neobmedzené možnosti analýz
- Jeden z prvých softvérov, ktorý obsahuje najnovšie technológie a postupy
- Pokročilé štatistické funkcie (ANOVA, Chi-square test, bootstrapping)
- Okrem štatistiky zvládne aj matematické výpočty (podobne Matlab)
- Populárny na vysokých školách, univerzitách (po celom svete, ale najmä v USA) a vedeckých inštitúciách
- Zdarma a open source
- Na základnom jadre R pracuje tím 19 vývojárov (sú to aj významní štatistici)
- Výborné grafické schopnosti
- Možnosti vylepšenia kódu
- Okrem ekonometrie a prognostiky využitie – Data mining, priestorové analýzy, bio-informatika a mnoho iných oblastí
- Funguje na rôznych operačných systémoch (Linux, Macintosch, Microsoft Windows)
- Importovanie dát z rôznych súborov a taktiež výstup v rôznych formách
- Hlavní vývojári sú kedykoľvek k dispozícií
Nevýhody
- “Ťažšie” pre nováčika (zadávanie príkazov a nie klikanie na menu)
- Nerovnomerná a stručná dokumentácia
- Nedokonalé balíky
- Keď niečo nefunguje – potrebné to oznámiť, alebo samostatne dorobiť kód (chyby sú odstraňované rýchlosťou blesku)
- Trošku pomalší jazyk
List základných príkazov používaných v R
Zdroje:
R blog [4.2.2015]
Výhody a nevýhody R [4.2.2015]