Prof. Dr. rer. nat. Gero Szepannek
Lehrangebot
- BMSIB1800 - Data Literacy
- BMSIB2600 - Analytical Statistics
- BWLM6089 - Methoden des Data Mining
- LTMB1200 - Data Literacy
- LTM8B1700 - Mathematics/Statistics
- LTM8B1800 - Analytical Statistics
- LTM8B1910 - Research Methods
- LTM8B1930 - Research Project
- WINFB2300 - Statistik
- WINFB3400 - Data Science for Business
- WINFB3720 - Methoden der empirischen Forschung
- WINFB4520 - Verfahren des Data Mining
- SMIB6400 - Künstliche Intelligenz
Sprechstunde: Mittwochs 17.30 - 18.30 Uhr nach Voranmeldung
Bei Interesse an einem Abschlussarbeitsthema im Bereich Machine Learning / Data Science / Statistik können Studierende gerne per Email Kontakt mit mir aufnehmen.
- seit 2016: Professur für Statistik, Wirtschaftsmathematik und Machine Learning an der HOST
- 2009 - 2016: Head of Scoring & Rating Models (Santander Consumer Bank / Santander Consumer Group)
- 2008: Promotion an der TU Dortmund: "Mustererkennung zur Informationsextraktion aus simulierten Aktionspotenzialen des Hörnervs" (Zusammenarbeit mit Fraunhofer IDMT)
- 2004: Diplom in Statistik an der TU Dortmund: „Verfahren zur Klassifikation und Visualisierung vieler Klassen in hochdimensionalen Räumen“
- 2000/2001: Studium in Rennes (Frankreich) am ENSAI
Forschungsgebiete:
- Machinelles Lernen
- Erklärbarkeit von Black Box Modellen
- Clusteranalyse bei gemischten Datentypen
- Computational Statistics
- Fairness von Machine Learning Modellen
- Kausale Inferenz
- Text Mining & Sentimentanalyse
Angewandte Forschung:
- Credit Scoring & IRBA
- Data Literacy
- Customer Relationship Management
- Medizinische Diagnostik
- Spracherkennung & Music Information Retrieval

- Implementation of the k prototypes algorithm in R in the clustMixType package.
- Cluster validation for mixed-type data.
- Paper on imputation strategies for mixed-type data.



- A general framework (TAX4CS) for the use of XAI in order to improve transparency and auditability of ML models in credit scoring.
- Paper on methodology (xgrove) to analyze complexity vs. accuracy of an explanation.
- Paper on quantifying explainability of a ML models by partial dependence plots.
- mlr3shiny: state-of the art machine Learning without programming. Github repository.
- German translation of a comic book on reponsible machine learning by P.Biecek, A.Kozak and A.Zawada.
- Hyperparameter Tuning with imbalanced classes
- Article introducing the mlr machine learning framework.
- Interpretable Machine Learning has also been the focus theme of the AG DANK 2018 fall symposium (cf. below). The results of its satellite contest can be found here.
- Framework for transparency and auditability of ML models in credit scoring (TAX4CS).
- Development of an index to measure and quantify the fairness of credit scoring models.
- Overview on the Landscape of R Packages for Open Source Scorecard Modelling.
- Credit Scoring for imbalanced classes.
- Overview on the Landscape of R Packages for Open Source Scorecard Modelling.
- Book on Applications in Statistical Computing.
- R package clustmixtype (k-Prototypes Clustering for Mixed Variable-Type Data).
- R package mlr3shiny (Graphical user interface for machine learning in R using mlr3).
- R package xgrove to analyze complexity vs. accuracy of an explanation.
- R package xPDPy (Computing the explainability of a ML model by partial dependence plots).
- R package for Heteroscedastic discriminant analysis using R.
- Organization of stRalsund R user meetings (cf. below).
- Why we should teach causal inference.
- Article on teaching machine learning.
For a list of my publications cf.e.g.Google Scholar or ResearchGate.
Erstellung von deutschsprachigen Lehrmaterial zur Responsible Machine Learning. Kooperation mit der Scientific Foundation SmarterPoland.pl. Projektlaufzeit: 01.06.2022 – 31.10.2022.
Projekt im Rahmen der hochschulinternen Forschungsprojektförderung in kooperation mit der Störtebeker Braumanufaktur GmbH. Laufzeit: 1.9.2023 - 31.12.2023.

Das Teilprojekt im Rahmen des Landesprogramms „Digitale Lehre“ in Mecklenburg-Vorpommern (Laufzeit: 1.5.2020 bis 31.12.2023) identifiziert für Dozierenden Möglichkeiten zur didaktischen Konzeption ergänzender digitaler Lehrangebote.
Auf dem Lernmanagementsystem Ilias der Hochschule Stralsund finden sich zahlreiche Informationen, Ideen, Anregungen und Handreichungen sowie die Möglichkeit zum Austausch der Lehrenden untereinander. Für alle Mitarbeitenden der HOST ist der Zugang zu den dort bereitgestellten Materialien möglich über den folgenden Link. Projektmitarbeitende sind Steve Sydow (Steve.Sydow@hochschule-stralsund.de) und Rabea Aschenbruck (Rabea.Aschenbruck@hochschule-stralsund.de).
Teilprojekt im Rahmen des Landesprogramms Digitale Lehre in Mecklenburg/Vorpommern (Laufzeit: 1.3.2020 bis 31.12.2023).

Die Hochschule Stralsund ist Bestandteil des Kompetenzzentrums für Digitalisierung: Mittelstand 4.0-Kompetenzzentrum Rostock, das im Rahmen der Förderinitiative Mittelstand 4.0 des Bundesministeriums für Wirtschaft und Energie im Jahr an den Start ging.
Unter der Konsortialführerschaft der IT-Initiative MV e.V. begleiten die Hochschule Stralsund, das Institut für Implantattechnologie und Biomaterialien e.V. (IIB e.V.), die Universitätsmedizin Rostock Versorgungsstrukturen GmbH und die Hochschule Neubrandenburg regionale mittelständische Unternehmen auf dem Weg in die Digitalisierung. Unternehmen aus den Bereichen Tourismus und Gesundheitswirtschaft stehen dabei im Vordergrund.
Im Fokus steht die Sensibilisierung für Chancen und Potentiale, die die Digitalisierung mit sich bringt. Neben der Sensibilisierung und Information wird das Kompetenzzentrum auch Schulungen anbieten, Workshops durchführen und die interessierten Unternehmen bei konkreten Umsetzungsprojekten begleiten. Anhand sogenannter Demonstratoren können sich Unternehmen im Vorfeld anschauen, wie Digitalisierung funktioniert. Im Fokus stehen hierbei insbesondere die Tourismusbranche sowie Data Science.
Das Stralsunder Teilprojekt DigiTOUR wurde in der ersten Förderphase durch Prof. Dr. Gero Szepannek vertreten, der von Prof. Dr. Michael Klotz, Prof. Dr. Björn Jacobsen, Prof. Dr. Jasminko Novak und Projekt-Mitarbeitenden sowie Studierenden begleitet wird. Das Projekt wird unter dem Förderkennzeichen 01MF17005E vom Bundesministerium für Wirtschaft und Energie unterstützt. Projektlaufzeit: 01.10.2017 - 30.09.2020
Analyse des Effektes von Hyperparametern tiefer neuronaler Netzwerke zur Tonhöhen- und Instrumentenklassifikation aus der simulierten Antwort des menschlichen Hörnervs.
Projekt im Rahmen der MINT-Mentoring - Nachwuchsförderung für Studierende in Vorbereitung auf eine Karriere in der Forschung.
Projektlaufzeit: 01.08.2022 – 31.12.2022.
Untersuchungsgegenstand des Projektes sind touristische Entwicklungsprojekte in Transformations- und Schwellenländern. Mit Hilfe von Instrumentarien des Text Mining sollen wahrgenommene Qualitätskriterien der Nutzer identifiziert und untersucht werden. Kooperation mit der HTW Berlin. Projektlaufzeit: 1.8.2019 - 31.7.2020.
Umsetzung des WWM Algorithmus zur Identifikation einer Wechselwirkungsmatrix von Herb-drug interaktionen im Rahmen eines Unterauftrags des Kompetenznetzes Komplementärmedizin in der Onkologie (KOKON). Projektlaufzeit: 01.07.2019 - 31.08.2019.
- Produktevaluierung der Tourismusregion Waren/Müritz (01.01. - 31.12.2017)
- Erwartungshaltung von Gesundheitstourismusgästen am Beispiel der Region Rostock/Warnemünde (01.01. - 31.12.2018)
- Untersuchung des Einflusses von Hyperparametern tiefer neuronaler Netze (01.01. - 31.12.2019)
- Identifikation eines zweckmäßigen Umfangs der Anwendung von Maschinenintelligenz (01.01. - 31.12.2020)
- Modellierung der neuronalen Antwort zur Tonhöhenwahrnehmung von Menschen (01.01. - 31.12.2021)
HanseYachts AG
MakerPort Stralsund
Mecklenburger Backstuben
Störtebeker Braumanufaktur
Strelapark
Tourismuszentrale Rostock & Warnemünde
Vogelpark Marlow
Waren (Müritz) Kur- und Tourismus GmbH
- M.Sc. Rabea Aschenbruck
- B.Sc. Dominic Henning
- Julie Rohrberg
- Einführung in Machine Learning ohne Programmierkenntnisse
- Responsible Machine Learning
- Credit Scoring mit R
- Programmieren in R und SAS
- Beratung in statistischen Fragestellungen
- Date: October 26th and 27th, 2018
- Location: Stralsund University of Applied Sciences, Building 21 ('Wirtschaft'), Room 326
- Focus Theme: Interpretable Machine Learning
- Registration: There is no conference fee. If you want to attend to the meeting or give a talk please write an email to gero.szepannek@hochschule-stralsund.de by October 15th, 2017. Note that talks are not restricted to the focus theme.
- Keynote: Mateusz Staniak (Warsaw University of Technology): DALEX: Descriptive mAchine Learning EXplanations. Tools for exploration, validation and explanation of complex machine learning models.
- Program
- Joint Dinner at Fritz Braugasthaus
- Hotel Recommendations:
- Hotel Rügenblick (Closest hotel to the campus, embrace hotel, +49 (0) 3831 3569 39-0, Please ask for Hochschule Stralsund special rates.)
- Hotel Hafenresidenz (Located in the city center directly at the border of the sea, +49 (0) 3831 2821 20, Please ask for special rates of faculty of economics at Hochschule Stralsund.)
- Younior Hotel (Hostel located close to the railway station, +49 (0) 800 60 60 880.)
- Public Transport:
- Some Destinations: Hiddensee, Kraniche, Fähren
- Data Analysis Competition:
- Competition 1: Predicting Ebay Prices
- Competition 2: Car Configuration Data
- Rabea Aschenbruck: „The k Prototypes Algorithm for Clustering Mixed-Type Data“
- Anna Denkowska, Stanisław Wanat: "Systemic Risk Modeling in the Insurance Sektor based on the Copula-DCC-GARCH-MST-DTW model"
- Grzegorz Korbela: "Modeling human mortality with the usage of macroeconomic factors"
- Krystian Szczęsny, Stanisław Wanat: "Risk Aggregation in Solvency Capital Requirement: Deep Neural Networks, C-vine Copulas in identifying marginal distributions and multidimensional copula"
- Gero Szepannek: „mlr3shiny – a Graphical User Interface for State of the Art Machine Learning”, „Measuring Fairness of Credit Scoring Models”
- Jan Wosnitza: „Calibration of PD Models and Quantification of their General Estimation Error (MoC C)”

Vorträge:
- tba
Vorträge:
- "Application of R in the analysis of the influence of macroeconomic policy on life expectancy", Anna Denkowska and Grzegorz Korbela (Cracow University of Economics),
- "dataquieR — Data Quality Assessments with R“, Stephan Struckmann (Uniklinikum Greifswald Greifswald).
Vorträge:
- "Deskriptive Datenanalysen im Tidyverse", Lars Koppers (Science Media Center, Köln)
- "mlr3shiny – State-of-the-Art Machine Learning Made Easy", Laurens Tetzlaff (Jheronimus Academy of Data Science, 's-Hertogenbosch, NL)
Vorträge:
- "As fast as it gets? Challenging R(cpp) with Julia", Philipp Wittenberg & Philipp Adämmer (Helmut Schmidt Universität Hamburg)
- "Pathway/Disease enrichment analysis using Bioconductor package", Neetika Nath (Institut für Bioinformatik, Universitätsmedizin Greifswald)
- "Schnittmengenvisualisierung mit ComplexUpSet - ein Anwendungsbeispiel in der Blutkulturdiagnostik", Marcus Vollmer (Institut für Bioinformatik, Universitätsmedizin Greifswald)
Vortrag:
- "Die perfekte Grafik mit R - base schlägt gg", Ulrike Grömping (BHT Berlin). Link zu den Folien.
Vorträge:
- "Einführung in Bayesverfahren mit R", Christian Röver (Universität Göttingen)
- "Ergebnisse Performance Coding Challenge", Mario Trouillier (Universität Greifswald), Download Challenge
Vorträge:
- "Circular visualization in R & having fun", Yvonne Gladbach (Universität Rostock)
- "Dimensionsreduktion... von PCA bis HDA -- Heteroskedastische Diskriminanzanalyse (und wofür sie gut ist)", Gero Szepannek (Hochschule Stralsund)
Prof. Dr. rer. nat.
Gero Szepannek
Statistik, Wirtschaftsmathematik und Machine Learning
Tel:
+49 3831 45 6672
Raum:
322, Haus 21