Worte zählen I (Python)

Hinweis

Diese Datei kann auch heruntergeladen werden (siehe Anhnag).

Wandle den Zelltyp in code, falls die Bibliotheken nicht geladen werden und führe die Installationsanweisungen dieser Zelle einmalig aus.

!pip install pandas
!pip install numpy

Wandle din Zelltyp wieder zu markdown, um ihn zu deaktivieren

Die folgenden Bibliotheken werden wir benötigen und benutzen:

import re
import numpy as np
import pandas as pd

Der Klassiker: Text in Wort zerlegen und dann zählen…

fruits = ['Äpfel', 'Birnen', 'Bananne']
test_string = "Hallo! Ich esse gern Äpfel."

basket = set(fruits)
words = re.compile('\w+')

for match in words.finditer(test_string):
    fruit = match.group()
    if fruit in basket:
        print(f"Dieser Aussage thematisiert: {fruit}")
Dieser Aussage thematisiert: Äpfel
words = ['Hallo', 'Moin', 'Servus', 'Moin', 'Hallo', 'Na', 'Tach och', 'Moin']

pd.value_counts(np.array(words))
Moin        3
Hallo       2
Servus      1
Na          1
Tach och    1
dtype: int64
df = pd.value_counts(np.array(words))

print('Index:', df.index)
print('Values:', df.values)
Index: Index(['Moin', 'Hallo', 'Servus', 'Na', 'Tach och'], dtype='object')
Values: [3 2 1 1 1]