updated Project Structure

This commit is contained in:
Patrick
2023-12-20 15:29:23 +01:00
parent 8d891bd6be
commit 4e5f00a0e4
3 changed files with 139 additions and 19 deletions

98
Data/test.csv Normal file
View File

@@ -0,0 +1,98 @@
;;
Backhaus;Tina;
Beck;Christopher;
Beck;Marina;
Berger;Charlyn;
Bernhardi;Antonia;
Bischoff;Meike;
Bl<EFBFBD><EFBFBD>;Anne-Kristin;
B<EFBFBD>hm;Susanne;
Boles;Simone Hildegard;
Brabant;Nadja;
Bremer;Heinz-Dieter;
Bremer;Timo;
Buchbinder;J<>rgen;
B<EFBFBD>cker;Meike Charlotte;
B<EFBFBD>nger;Birte;
Delfs;Dorothee;
Didt;Marlen;
Diercks;Berit-Deike;
Dohrendorf;Hella;
Ehler;Patricia;
Ehrenforth;Maike;
Elgert;Dorit;
Fischer;Rieke Flavia;
Freyer;Jennifer;
Gilbert;Amke;
Glinzner;Sylke;
Gosch;Christina;
Grimm;Antonia;
Hartmann;Marisa Sophie;
Healy-Kloppenburg;Insa;
Herrig;Swantje;
Holst;Patrick;
Iven;Meike;
Jacke;Friederike-Lisette;
Janshen;Friederike;
Kaiser;Yvonne;
Klingelh<EFBFBD>fer;Stefanie;
Knobbe;Svenja Elena;
Krieglstein;Lena;
Krohn;Iwanka;
Lang;Alisa;
Lehnau, Dr.;Frank;
Lippitsch;Annette;
Llerena;Susanne;
Markus-Schnabel;Karsten;
Marohn;Kai;
Martens;Annika;
Ma<EFBFBD>mann;Jillian;
M<EFBFBD>bius;Christina;
M<EFBFBD>ller;Alexandra;
M<EFBFBD>llerherm;Antje;
M<EFBFBD>ller;Thomas;
Neumann;Lisa Marie;
Nicoloff;Alexandra;
Niemann;Lara;
Noguera Abreu;Kristina;
Ochse;Olaf;
Pabst;Stefan;
Peters;Nicole;
Piehl;Jan-Philip;
Posselt;Janett;
Pr<EFBFBD>fert;Birte;
Radloff;Jannika;
Resch;Christina Carola;
Richter-Conrad;Barbara;
Riedel;Dietmar;
Ries;Claudia;
Ritter;Ewa Joanna;
Rohmer;Thomas;
Rudolf;Julia;
Schacht;D<>rthe;
Scharfe;Sarah Marie;
Schrader;Lea Ann;
Schr<EFBFBD>der;Sandra;
Schwarz;Anneli-Dorothea;
Schwarz;Berit;
Seebauer;Astrid;
Seebauer;Benjamin;
Siedtmann;Katja;
Sommer;Alexander;
Steiger;Lisa;
Steinfatt;Jan Hendrik;
Stukenbrock;Taira;
Teichmann;Sascha;
Tereshchenko;Oksana;
Thiele;J<>rg;
Thiele;Ulrike;
Topal;Sebnem;
Torkuhl;Clara;
Treichel;Hannah Lena;
Vehrs;Marian;
Villwock;Hanno;
Voigt;Finja;
Wei<EFBFBD>;Lea Pauline Katharina Laetitia;
Welder;Jennifer;
Wolter;Michael;
Wulf;Alexander;
1
2 Backhaus Tina
3 Beck Christopher
4 Beck Marina
5 Berger Charlyn
6 Bernhardi Antonia
7 Bischoff Meike
8 Blöß Anne-Kristin
9 Böhm Susanne
10 Boles Simone Hildegard
11 Brabant Nadja
12 Bremer Heinz-Dieter
13 Bremer Timo
14 Buchbinder Jürgen
15 Bücker Meike Charlotte
16 Bünger Birte
17 Delfs Dorothee
18 Didt Marlen
19 Diercks Berit-Deike
20 Dohrendorf Hella
21 Ehler Patricia
22 Ehrenforth Maike
23 Elgert Dorit
24 Fischer Rieke Flavia
25 Freyer Jennifer
26 Gilbert Amke
27 Glinzner Sylke
28 Gosch Christina
29 Grimm Antonia
30 Hartmann Marisa Sophie
31 Healy-Kloppenburg Insa
32 Herrig Swantje
33 Holst Patrick
34 Iven Meike
35 Jacke Friederike-Lisette
36 Janshen Friederike
37 Kaiser Yvonne
38 Klingelhöfer Stefanie
39 Knobbe Svenja Elena
40 Krieglstein Lena
41 Krohn Iwanka
42 Lang Alisa
43 Lehnau, Dr. Frank
44 Lippitsch Annette
45 Llerena Susanne
46 Markus-Schnabel Karsten
47 Marohn Kai
48 Martens Annika
49 Maßmann Jillian
50 Möbius Christina
51 Möller Alexandra
52 Möllerherm Antje
53 Müller Thomas
54 Neumann Lisa Marie
55 Nicoloff Alexandra
56 Niemann Lara
57 Noguera Abreu Kristina
58 Ochse Olaf
59 Pabst Stefan
60 Peters Nicole
61 Piehl Jan-Philip
62 Posselt Janett
63 Prüfert Birte
64 Radloff Jannika
65 Resch Christina Carola
66 Richter-Conrad Barbara
67 Riedel Dietmar
68 Ries Claudia
69 Ritter Ewa Joanna
70 Rohmer Thomas
71 Rudolf Julia
72 Schacht Dörthe
73 Scharfe Sarah Marie
74 Schrader Lea Ann
75 Schröder Sandra
76 Schwarz Anneli-Dorothea
77 Schwarz Berit
78 Seebauer Astrid
79 Seebauer Benjamin
80 Siedtmann Katja
81 Sommer Alexander
82 Steiger Lisa
83 Steinfatt Jan Hendrik
84 Stukenbrock Taira
85 Teichmann Sascha
86 Tereshchenko Oksana
87 Thiele Jörg
88 Thiele Ulrike
89 Topal Sebnem
90 Torkuhl Clara
91 Treichel Hannah Lena
92 Vehrs Marian
93 Villwock Hanno
94 Voigt Finja
95 Weiß Lea Pauline Katharina Laetitia
96 Welder Jennifer
97 Wolter Michael
98 Wulf Alexander

22
main.py Normal file
View File

@@ -0,0 +1,22 @@
from src.format_csv import *
if __name__ == "__main__":
oldlist = 'Data/alte-liste-utf.csv'
newlist = 'Data/neue-liste-utf.csv'
test = 'Data/test.csv'
new_test = 'Data/test_new.csv'
# Liste nach Fehler prüfen und Zeichen ersetzen
check_file(test)
format_csv(test, new_test)
#path_old_csv = input('Pfad zur alten Liste eingeben eingeben: ')
#format_csv(path_old_csv, oldlist)
#path_new_csv = input('Pfad zur neuen Liste eingeben eingeben: ')
#format_csv(path_new_csv, newlist)
# Generierte Listen mit pandas öffnen
# Spaltennamen prüfen und überflüssige Spalten löschen
# Abgleich starten -collisions

View File

@@ -2,6 +2,25 @@ import pandas as pd
import chardet
def check_file(path):
with open(path, 'rb') as file:
result = chardet.detect(file.read())
detected_encoding = result['encoding']
try:
pd.read_csv(path, encoding=detected_encoding)
except pd.errors.ParserError as e:
# Wenn ein Parserfehler auftritt, gibt eine Fehlermeldung aus
print(f"Fehler beim Einlesen der CSV-Datei: {e}")
print()
data = open(path, "r")
data = ''.join([i for i in data]).replace(",", "")
x = open(path, "w")
x.writelines(data)
x.close()
print(f"Alle Kommas entfernt")
# Prüft Formatierung der CSV, formatiert diese zu utf-8 und speichert das Ergebnis als neue Liste
def format_csv(path, type):
with open(path, 'rb') as file:
@@ -19,22 +38,3 @@ def format_csv(path, type):
except pd.errors.ParserError as e:
# Wenn ein Parserfehler auftritt, gibt eine Fehlermeldung aus
print(f"Fehler beim Einlesen der CSV-Datei: {e}")
if __name__ == "__main__":
oldlist = 'Data/alte-liste-utf.csv'
newlist = 'Data/neue-liste-utf.csv'
# Liste nach Fehler prüfen und ggfs Zeichern ersetzen
#path_old_csv = input('Pfad zur alten Liste eingeben eingeben: ')
#format_csv(path_old_csv, oldlist)
#path_new_csv = input('Pfad zur neuen Liste eingeben eingeben: ')
#format_csv(path_new_csv, newlist)
# Generierte Listen mit pandas öffnen
# Spaltennamen prüfen und überflüssige Spalten löschen
# Abgleich starten -collisions