Kód
Meno | Vek | Mesto | Body | |
---|---|---|---|---|
0 | Anna | 25 | Bratislava | 88 |
1 | Boris | 30 | Košice | 92 |
2 | Cyril | 35 | Žilina | 75 |
3 | Dora | 28 | Bratislava | 90 |
4 | Eva | 22 | Nitra | 66 |
5 | Filip | 40 | Košice | 98 |
🚧️ Stránka vo výstavbe - Stránka je momentálne vo vývoji, niektorý obsah preto nemusí byť dostupný… Pracujeme na jeho vývoji a skorom doplnení… 🚧
Jakub Šperka
18. septembra 2025
V tejto kapitole sa zameriame na základné štatistické operácie, ktoré Pandas
ponúka priamo nad objektom DataFrame
alebo Series
.
Medzi najčastejšie používané patria: - Popisné štatistiky (mean
, median
, mode
, std
, var
, min
, max
) - Súčty a počty (sum
, count
) - Percentily a kvantily (quantile
) - Komplexný prehľad pomocou funkcie .describe()
Meno | Vek | Mesto | Body | |
---|---|---|---|---|
0 | Anna | 25 | Bratislava | 88 |
1 | Boris | 30 | Košice | 92 |
2 | Cyril | 35 | Žilina | 75 |
3 | Dora | 28 | Bratislava | 90 |
4 | Eva | 22 | Nitra | 66 |
5 | Filip | 40 | Košice | 98 |
print("Priemerný vek:", df['Vek'].mean())
print("Medián bodov:", df['Body'].median())
print("Najčastejší vek:", df['Vek'].mode()[0])
print("Rozptyl bodov:", df['Body'].var())
print("Štandardná odchýlka bodov:", df['Body'].std())
print("Minimum bodov:", df['Body'].min())
print("Maximum bodov:", df['Body'].max())
Priemerný vek: 30.0
Medián bodov: 89.0
Najčastejší vek: 22
Rozptyl bodov: 142.56666666666666
Štandardná odchýlka bodov: 11.940128419186566
Minimum bodov: 66
Maximum bodov: 98
Počet riadkov: 6
Súčet bodov: 509
25. percentil veku: 25.75
50. percentil (medián) veku: 29.0
75. percentil veku: 33.75
.describe()
Meno | Vek | Mesto | Body | |
---|---|---|---|---|
count | 6 | 6.00000 | 6 | 6.000000 |
unique | 6 | NaN | 4 | NaN |
top | Anna | NaN | Bratislava | NaN |
freq | 1 | NaN | 2 | NaN |
mean | NaN | 30.00000 | NaN | 84.833333 |
std | NaN | 6.60303 | NaN | 11.940128 |
min | NaN | 22.00000 | NaN | 66.000000 |
25% | NaN | 25.75000 | NaN | 78.250000 |
50% | NaN | 29.00000 | NaN | 89.000000 |
75% | NaN | 33.75000 | NaN | 91.500000 |
max | NaN | 40.00000 | NaN | 98.000000 |
mean
, median
, std
, var
, min
, max
).describe()
rýchlo poskytne súhrnné štatistiky pre všetky stĺpce.Podrobný popis funkcií, ich parametrov a príkladov použitia nájdete v oficiálnej dokumentácii knižnice Pandas na adrese: [https://pandas.pydata.org/docs/](https://pandas.pydata.org/