pandas

 0    103 flashcards    snsijabab
download mp3 print play test yourself
 
Question Answer
pierwsze n wierszy
start learning
df. head(n)
ostatnie n wierszy
start learning
df. tail(n)
losowe n wierszy
start learning
df. sample(n)
wczytanie CSV
start learning
pd. read_csv()
liczba wierszy i kolumn
start learning
df. shape
informacje o danych
start learning
df. info()
statystyki
start learning
df. describe()
typy kolumn
start learning
df. dtypes
nazwy kolumn
start learning
df. columns
liczba wartości
start learning
df["col"]. count()
suma
start learning
df["col"]. sum()
średnia
start learning
df["col"]. mean()
mediana
start learning
df["col"]. median()
maksimum
start learning
df["col"]. max()
minimum
start learning
df["col"]. min()
kwartyl
start learning
df["col"]. quantile(q)
unikalne wartości
start learning
df["col"]. unique()
ilosc unikalnych
start learning
len(df["col"]. unique())
zliczanie wartości
start learning
df["col"]. value_counts()
zliczanie z NaN
start learning
df["col"]. value_counts(dropna=False)
wybór kolumny
start learning
df["col"]
wybór wielu kolumn
start learning
df[["col1","col2"]]
wybór kolumny skrótem
start learning
df. col
dodanie kolumny
start learning
df["new"] =...
wybór wiersza po indeksie
start learning
df. loc[]
wybór wiersza po pozycji
start learning
df. iloc[]
wybór konkretnej komórki
start learning
df. loc[row, col]
histogram
start learning
df["col"]. hist()
usunięcie NaN
start learning
df. dropna()
usunięcie NaN w kolumnie
start learning
df. dropna(subset=["col"])
uzupełnienie NaN
start learning
df. fillna(val)
uzupełnienie medianą
start learning
df. fillna(df. median(numeric_only=True))
uzupełnienie konkretnej kolumny
start learning
df. fillna({"col": val})
dodanie kategorii
start learning
df["col"]. cat. add_categories()
zmiana na unordered
start learning
df["col"]. cat. as_unordered()
sortowanie rosnąco
start learning
df. sort_values("col")
sortowanie malejąco
start learning
df. sort_values("col", ascending=False)
sortowanie po wielu kolumnach
start learning
df. sort_values(["col1","col2"])
filtrowanie równe
start learning
df[df["col"] == val]
większe niż
start learning
df[df["col"] > val]
negacja
start learning
df[~(warunek)]
brak NaN
start learning
df[~df["col"]. isna()]
AND
start learning
&
OR
start learning
|
zaczyna się od
start learning
df["col"]. str. startswith()
kończy się na
start learning
df["col"]. str. endswith()
zawiera tekst
start learning
df["col"]. str. contains()
title case
start learning
df["col"]. str. istitle()
pierwszy pasujący wiersz
start learning
df[warunek]. iloc[0]
df[warunek]. iloc[1]
start learning
df[warunek]. iloc[1]
wycinanie tekstu
start learning
df["col"]. str[a: b]
zapis CSV
start learning
df. to_csv()
mapowanie wartości
start learning
df["col"]. map(dict)
przedziały
start learning
pd. cut()
kwantyle
start learning
pd. qcut()
wycinanie tekstu od indeksu
start learning
df["col"]. str[i:]
rzutowanie typu
start learning
astype()
wielkie litery
start learning
str. upper()
małe litery
start learning
str. lower()
unikalne po operacji
start learning
str. upper(). unique()
zmiana nazw kolumn
start learning
df. columns. str. upper()
usuwanie spacji
start learning
str. strip()
usuwanie z lewej
start learning
str. lstrip()
usuwanie z prawej
start learning
str. rstrip()
długość tekstu
start learning
str. len()
dzielenie tekstu
start learning
str. split()
wybór elementu po split
start learning
str. split(). str[i]
split do kolumn
start learning
str. split(expand=True)
łączenie tekstu
start learning
str. cat()
łączenie z separatorem
start learning
str. cat(sep=",")
łączenie kolumn
start learning
str. cat(df["col"])
zamiana wartości
start learning
replace()
tabela krzyżowa (?)
start learning
pd. crosstab()
tabela wielowymiarowa(?)
start learning
pd. crosstab(col1, [col2, col3])
grupowanie(?)
start learning
df. groupby()
statystyki w grupach(?)
start learning
groupby(). describe()
transpozycja (?)
start learning
.T
średnia w grupach (?)
start learning
groupby(). mean()
agregacja (?)
start learning
groupby(). agg()
agregacja wiele funkcji(?)
start learning
groupby(). agg({})
eksport do dict
start learning
to_dict()
eksport do JSON
start learning
to_json()
eksport do HTML
start learning
to_html()
eksport do LaTeX
start learning
to_latex()
eksport do records
start learning
to_records()
ustaw indeks
start learning
df. set_index()
multiindex
start learning
df. set_index([col1, col2])
join po indeksie
start learning
df. join()
merge po kolumnie
start learning
df. merge()
concat wierszy
start learning
pd. concat()
korelacja
start learning
df. corr()
korelacja kendall
start learning
df. corr(method="kendall")
korelacja spearman
start learning
df. corr(method="spearman")
usuwanie kolumny
start learning
df. drop("col", axis=1)
usuwanie wiersza
start learning
df. drop(i, axis=0)
usuwanie inplace
start learning
df. drop(..., inplace=True)
usuwanie duplikatów
start learning
df. drop_duplicates()
usuwanie duplikatów subset
start learning
df. drop_duplicates(subset=[...])
funkcja na kolumnie
start learning
df["col"]. apply()
funkcja na wierszu
start learning
df. apply(func, axis=1)
suma kolumn
start learning
df. sum()
suma wierszy
start learning
df. sum(axis=1)
wybór kolumny przez loc
start learning
df. loc[:, "col"]

You must sign in to write a comment