Worte zählen I (Python)¶
Hinweis
Diese Datei kann auch heruntergeladen werden (siehe Anhnag).
Wandle den Zelltyp in code, falls die Bibliotheken nicht geladen werden und führe die Installationsanweisungen dieser Zelle einmalig aus.
!pip install pandas
!pip install numpy
Wandle din Zelltyp wieder zu markdown, um ihn zu deaktivieren
Die folgenden Bibliotheken werden wir benötigen und benutzen:
import re
import numpy as np
import pandas as pd
Der Klassiker: Text in Wort zerlegen und dann zählen…
fruits = ['Äpfel', 'Birnen', 'Bananne']
test_string = "Hallo! Ich esse gern Äpfel."
basket = set(fruits)
words = re.compile('\w+')
for match in words.finditer(test_string):
fruit = match.group()
if fruit in basket:
print(f"Dieser Aussage thematisiert: {fruit}")
Dieser Aussage thematisiert: Äpfel
words = ['Hallo', 'Moin', 'Servus', 'Moin', 'Hallo', 'Na', 'Tach och', 'Moin']
pd.value_counts(np.array(words))
Moin 3
Hallo 2
Servus 1
Na 1
Tach och 1
dtype: int64
df = pd.value_counts(np.array(words))
print('Index:', df.index)
print('Values:', df.values)
Index: Index(['Moin', 'Hallo', 'Servus', 'Na', 'Tach och'], dtype='object')
Values: [3 2 1 1 1]