updated Project Structure
This commit is contained in:
98
Data/test.csv
Normal file
98
Data/test.csv
Normal file
@@ -0,0 +1,98 @@
|
||||
;;
|
||||
Backhaus;Tina;
|
||||
Beck;Christopher;
|
||||
Beck;Marina;
|
||||
Berger;Charlyn;
|
||||
Bernhardi;Antonia;
|
||||
Bischoff;Meike;
|
||||
Bl<EFBFBD><EFBFBD>;Anne-Kristin;
|
||||
B<EFBFBD>hm;Susanne;
|
||||
Boles;Simone Hildegard;
|
||||
Brabant;Nadja;
|
||||
Bremer;Heinz-Dieter;
|
||||
Bremer;Timo;
|
||||
Buchbinder;J<>rgen;
|
||||
B<EFBFBD>cker;Meike Charlotte;
|
||||
B<EFBFBD>nger;Birte;
|
||||
Delfs;Dorothee;
|
||||
Didt;Marlen;
|
||||
Diercks;Berit-Deike;
|
||||
Dohrendorf;Hella;
|
||||
Ehler;Patricia;
|
||||
Ehrenforth;Maike;
|
||||
Elgert;Dorit;
|
||||
Fischer;Rieke Flavia;
|
||||
Freyer;Jennifer;
|
||||
Gilbert;Amke;
|
||||
Glinzner;Sylke;
|
||||
Gosch;Christina;
|
||||
Grimm;Antonia;
|
||||
Hartmann;Marisa Sophie;
|
||||
Healy-Kloppenburg;Insa;
|
||||
Herrig;Swantje;
|
||||
Holst;Patrick;
|
||||
Iven;Meike;
|
||||
Jacke;Friederike-Lisette;
|
||||
Janshen;Friederike;
|
||||
Kaiser;Yvonne;
|
||||
Klingelh<EFBFBD>fer;Stefanie;
|
||||
Knobbe;Svenja Elena;
|
||||
Krieglstein;Lena;
|
||||
Krohn;Iwanka;
|
||||
Lang;Alisa;
|
||||
Lehnau, Dr.;Frank;
|
||||
Lippitsch;Annette;
|
||||
Llerena;Susanne;
|
||||
Markus-Schnabel;Karsten;
|
||||
Marohn;Kai;
|
||||
Martens;Annika;
|
||||
Ma<EFBFBD>mann;Jillian;
|
||||
M<EFBFBD>bius;Christina;
|
||||
M<EFBFBD>ller;Alexandra;
|
||||
M<EFBFBD>llerherm;Antje;
|
||||
M<EFBFBD>ller;Thomas;
|
||||
Neumann;Lisa Marie;
|
||||
Nicoloff;Alexandra;
|
||||
Niemann;Lara;
|
||||
Noguera Abreu;Kristina;
|
||||
Ochse;Olaf;
|
||||
Pabst;Stefan;
|
||||
Peters;Nicole;
|
||||
Piehl;Jan-Philip;
|
||||
Posselt;Janett;
|
||||
Pr<EFBFBD>fert;Birte;
|
||||
Radloff;Jannika;
|
||||
Resch;Christina Carola;
|
||||
Richter-Conrad;Barbara;
|
||||
Riedel;Dietmar;
|
||||
Ries;Claudia;
|
||||
Ritter;Ewa Joanna;
|
||||
Rohmer;Thomas;
|
||||
Rudolf;Julia;
|
||||
Schacht;D<>rthe;
|
||||
Scharfe;Sarah Marie;
|
||||
Schrader;Lea Ann;
|
||||
Schr<EFBFBD>der;Sandra;
|
||||
Schwarz;Anneli-Dorothea;
|
||||
Schwarz;Berit;
|
||||
Seebauer;Astrid;
|
||||
Seebauer;Benjamin;
|
||||
Siedtmann;Katja;
|
||||
Sommer;Alexander;
|
||||
Steiger;Lisa;
|
||||
Steinfatt;Jan Hendrik;
|
||||
Stukenbrock;Taira;
|
||||
Teichmann;Sascha;
|
||||
Tereshchenko;Oksana;
|
||||
Thiele;J<>rg;
|
||||
Thiele;Ulrike;
|
||||
Topal;Sebnem;
|
||||
Torkuhl;Clara;
|
||||
Treichel;Hannah Lena;
|
||||
Vehrs;Marian;
|
||||
Villwock;Hanno;
|
||||
Voigt;Finja;
|
||||
Wei<EFBFBD>;Lea Pauline Katharina Laetitia;
|
||||
Welder;Jennifer;
|
||||
Wolter;Michael;
|
||||
Wulf;Alexander;
|
||||
|
22
main.py
Normal file
22
main.py
Normal file
@@ -0,0 +1,22 @@
|
||||
from src.format_csv import *
|
||||
|
||||
if __name__ == "__main__":
|
||||
|
||||
oldlist = 'Data/alte-liste-utf.csv'
|
||||
newlist = 'Data/neue-liste-utf.csv'
|
||||
|
||||
test = 'Data/test.csv'
|
||||
new_test = 'Data/test_new.csv'
|
||||
|
||||
# Liste nach Fehler prüfen und Zeichen ersetzen
|
||||
check_file(test)
|
||||
format_csv(test, new_test)
|
||||
|
||||
#path_old_csv = input('Pfad zur alten Liste eingeben eingeben: ')
|
||||
#format_csv(path_old_csv, oldlist)
|
||||
#path_new_csv = input('Pfad zur neuen Liste eingeben eingeben: ')
|
||||
#format_csv(path_new_csv, newlist)
|
||||
|
||||
# Generierte Listen mit pandas öffnen
|
||||
# Spaltennamen prüfen und überflüssige Spalten löschen
|
||||
# Abgleich starten -collisions
|
||||
@@ -2,6 +2,25 @@ import pandas as pd
|
||||
import chardet
|
||||
|
||||
|
||||
def check_file(path):
|
||||
with open(path, 'rb') as file:
|
||||
result = chardet.detect(file.read())
|
||||
|
||||
detected_encoding = result['encoding']
|
||||
try:
|
||||
pd.read_csv(path, encoding=detected_encoding)
|
||||
except pd.errors.ParserError as e:
|
||||
# Wenn ein Parserfehler auftritt, gibt eine Fehlermeldung aus
|
||||
print(f"Fehler beim Einlesen der CSV-Datei: {e}")
|
||||
print()
|
||||
data = open(path, "r")
|
||||
data = ''.join([i for i in data]).replace(",", "")
|
||||
x = open(path, "w")
|
||||
x.writelines(data)
|
||||
x.close()
|
||||
print(f"Alle Kommas entfernt")
|
||||
|
||||
|
||||
# Prüft Formatierung der CSV, formatiert diese zu utf-8 und speichert das Ergebnis als neue Liste
|
||||
def format_csv(path, type):
|
||||
with open(path, 'rb') as file:
|
||||
@@ -19,22 +38,3 @@ def format_csv(path, type):
|
||||
except pd.errors.ParserError as e:
|
||||
# Wenn ein Parserfehler auftritt, gibt eine Fehlermeldung aus
|
||||
print(f"Fehler beim Einlesen der CSV-Datei: {e}")
|
||||
|
||||
|
||||
if __name__ == "__main__":
|
||||
|
||||
oldlist = 'Data/alte-liste-utf.csv'
|
||||
newlist = 'Data/neue-liste-utf.csv'
|
||||
|
||||
# Liste nach Fehler prüfen und ggfs Zeichern ersetzen
|
||||
|
||||
#path_old_csv = input('Pfad zur alten Liste eingeben eingeben: ')
|
||||
#format_csv(path_old_csv, oldlist)
|
||||
#path_new_csv = input('Pfad zur neuen Liste eingeben eingeben: ')
|
||||
#format_csv(path_new_csv, newlist)
|
||||
|
||||
# Generierte Listen mit pandas öffnen
|
||||
# Spaltennamen prüfen und überflüssige Spalten löschen
|
||||
# Abgleich starten -collisions
|
||||
|
||||
|
||||
Reference in New Issue
Block a user