Countplot v Pythonu
V tomto článku budeme diskutovat o tom, jak můžeme vytvořit počítání pomocí knihovny seaborn a jak lze různé parametry použít k odvození výsledků z funkcí naší datové sady.
Knihovna Seaborn
Knihovna seaborn je mezi datovými analytiky široce používána, galaxie grafů, které obsahuje, poskytuje nejlepší možnou reprezentaci našich dat.
Seaborn knihovnu lze importovat do našeho pracovního prostředí pomocí-
import seaborn as sns
Pojďme si nyní probrat, proč používáme countplot a jaký význam mají jeho parametry.
Počítadlo
Graf počtu se používá k reprezentaci výskytu (počtů) pozorování přítomných v kategoriální proměnné.
Pro vizuální zobrazení používá koncept sloupcového grafu.
Parametry-
Následující parametry jsou specifikovány, když vytváříme počítací plot, pojďme si o nich udělat krátkou představu-
Nyní se podívejme, jaké jsou různé způsoby reprezentace našich atributů.
V prvním příkladu vytvoříme countplot pro jednu proměnnou. Použili jsme „tipy“ datové sady, abychom totéž implementovali.
1. Hodnota se počítá pro jednu proměnnou
Příklad -
import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'tips' df=pd.read_csv('/content/tips.csv') #plotting the graph sns.countplot(x='sex',data=df) plt.show()
Výstup:
V dalším příkladu použijeme parametr hue a vytvoříme countplot.
Následující program ilustruje totéž -
2. Reprezentace dvou kategoriálních proměnných pomocí parametru odstín
Příklad -
import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'tips' df=pd.read_csv('/content/tips.csv') #plotting the graph sns.countplot(x='sex',hue='smoker',data=df) plt.show()
Výstup:
V dalším příkladu budeme uvažovat osu y a vytvoříme horizontální graf počtu.
Následující program ilustruje totéž
3. Vytváření horizontálních grafů
Příklad -
import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'tips' df=pd.read_csv('/content/tips.csv') #plotting the graph sns.countplot(y='sex',hue='smoker',data=df) plt.show()
Výstup:
Pojďme se nyní podívat na to, jak mohou barevné palety zlepšit prezentaci našich dat.
V dalším příkladu použijeme parametr 'paleta'.
Následující program ilustruje totéž
4. Použití barevných palet
Vstup-
import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'tips' df=pd.read_csv('/content/tips.csv') #plotting the graph sns.countplot(x='sex', data=df, palette='Set1') plt.show()
Výstup:
V dalším příkladu použijeme parametr color a uvidíme, jak to funguje?
Následující program ilustruje totéž
5. Použití parametru „color“
Příklad -
import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'train' df=pd.read_csv('/content/train.csv') #plotting the graph sns.countplot(x='Pclass',hue='Sex', data=df, color='green') plt.show()
Výstup:
Nyní použijeme parametr 'saturation' a uvidíme, jak to ovlivní reprezentaci našich dat.
Následující program ilustruje totéž
6. Pomocí parametru 'saturace'
Příklad -
import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'train' df=pd.read_csv('/content/train.csv') #plotting the graph sns.countplot(x='Pclass',data=df, color='green', saturation=0.1) plt.show()
Výstup:
A nakonec v posledním příkladu použijeme parametry šířka čáry a barva okraje.
Příklad -
import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'train' df=pd.read_csv('/content/train.csv') sns.countplot(x='Sex', data=df, color='green', facecolor=(0,0,0,0), linewidth=5, edgecolor=sns.color_palette('BrBG',2)) plt.show()
Výstup: