Prof. Dr. rer. nat. Gero Szepannek
Lehrangebot
- BMSIB1800 - Business Mathematics/Statistics
- BMSIB2600 - Analytical Statistics
- BWLM6089 - Methoden des Data Mining
- LTM8B1700 - Mathematics/Statistics
- LTM8B1800 - Analytical Statistics
- LTM8B1910 - Research Methods
- LTM8B1930 - Research Project
- WINFB2300 - Statistik
- WINFB3400 - Data Science for Business
- WINFB3720 - Methoden der empirischen Forschung
- WINFB4520 - Verfahren des Data Mining
- SMIB6400 - Künstliche Intelligenz
Sprechstunde: Mittwochs 17.30 - 18.30 Uhr nach Voranmeldung
Bei Interesse an einem Abschlussarbeitsthema im Bereich Machine Learning / Data Science / Statistik können Studierende gerne per Email Kontakt mit mir aufnehmen.
- seit 2016: Professur für Statistik, Wirtschaftsmathematik und Machine Learning an der HOST
- 2009 - 2016: Head of Scoring & Rating Models (Santander Consumer Bank / Santander Consumer Group)
- 2008: Promotion an der TU Dortmund: "Mustererkennung zur Informationsextraktion aus simulierten Aktionspotenzialen des Hörnervs" (Zusammenarbeit mit Fraunhofer IDMT)
- 2004: Diplom in Statistik an der TU Dortmund: „Verfahren zur Klassifikation und Visualisierung vieler Klassen in hochdimensionalen Räumen“
- 2000/2001: Studium in Rennes (Frankreich) am ENSAI
Forschungsgebiete:
- Machine Learning, Deep Learning und künstliche Intelligenz, insb. Hyperparametertuning & Interpretierbarkeit von Black Box Modellen
- Computational Statistics
- Causal Inference
- Text Mining & Sentimentanalyse
Angewandte Forschung:
- Credit Scoring & IRBA
- Customer Relationship Management
- Industrie 4.0
- Medizinische Diagnostik
- Music Information Retrieval
- Spracherkennung
In the recent years several free open source tools for credit scorecard modelling have become available. An overview on the landscape of R packages for this purpose can be found here. On the other hand modern machine learning methods have entered the application field of credit scoring. A comprehensive study with focus on the imbalance of the target class and hyperparameter tuning can be found under this link. From a regulatory perspective, transparency of risk models is required. A corresponding framerwork has presented here while possibilities to build fair credit scores are investigated here.

In practice, data are often of so called mixed type, i.e. containing both numeric and categorical variables. For clustering of mixed-type data there exists a simple and intuitive extension of the popular k means algorithm, called k prototypes.
- An implementation of the k prototypes algorithm in R can be found in the clustMixType package.
- An R Journal article on the package can be found here.
- An article on validation of mixed-type data clustering can be found in the Archives of Data Science A 6(1).
There is an ongoing hype around artificial intelligence and machine learning and open source autoML tools have made machine learning easily accessible to anyone. Nevertheless it has to be emphasized that a profound understanding of the models should be part of each model development and requires for experienced analysts. In general, understanding of models as they result from many recently proposed machine learning algorithms becomes difficult as the model typically come along as black boxes. I gave a short general overview on the topic at the Predictive Analytics World Conference on 18./19.11.19 in Berlin. Two quite general frameworks that might help understanding can be found here and here.
- A general framework for the use of XAI in order to improve transparency and auditability of ML models in credit scoring is available here.
- Interpretable Machine Learning has also been the focus theme of the AG DANK 2018 fall symposium (cf. below). The results of its satellite contest can be found here.
- Although interpretability is important it should be done carefully as it is outlined in a paper on quantifying explainability of a ML model by partial dependence plots. A corresponding R package can be downloaded here.
- An analysis of fairness correction for credit risk sorring is availble under this link.

There is an increasing number of machine learning frameworks available. A powerful and comprehensive state-of-the-art implementation of the machine learning workflow that covers many aspects of machine learning and allows for hyperparameter tuning is given by the R package mlr3. The package mlr3shiny provides a web-based interface that covers the basic steps and is easy to use even for beginners without programming skills and allows to familiarize with the ML pipeline.
For a list of my publications cf.e.g.Google Scholar or ResearchGate.

Das Teilprojekt im Rahmen des Landesprogramms „Digitale Lehre“ in Mecklenburg-Vorpommern (Laufzeit: 1.5.2020 bis 31.12.2023) identifiziert für Dozierenden Möglichkeiten zur didaktischen Konzeption ergänzender digitaler Lehrangebote.
Auf dem Lernmanagementsystem Ilias der Hochschule Stralsund finden sich zahlreiche Informationen, Ideen, Anregungen und Handreichungen sowie die Möglichkeit zum Austausch der Lehrenden untereinander. Für alle Mitarbeitenden der HOST ist der Zugang zu den dort bereitgestellten Materialien möglich über den folgenden Link. Projektmitarbeitende sind Steve Sydow (Steve.Sydow@hochschule-stralsund.de) und Rabea Aschenbruck (Rabea.Aschenbruck@hochschule-stralsund.de).
Teilprojekt im Rahmen des Landesprogramms Digitale Lehre in Mecklenburg/Vorpommern (Laufzeit: 1.3.2020 bis 31.12.2023).
Untersuchungsgegenstand des Projektes sind touristische Entwicklungsprojekte in Transformations- und Schwellenländern. Mit Hilfe von Instrumentarien des Text Mining sollen wahrgenommene Qualitätskriterien der Nutzer identifiziert und untersucht werden. Kooperation mit der HTW Berlin. Projektlaufzeit: 1.8.2019 - 31.7.2020.
Umsetzung des WWM Algorithmus zur Identifikation einer Wechselwirkungsmatrix von Herb-drug interaktionen im Rahmen eines Unterauftrags des Kompetenznetzes Komplementärmedizin in der Onkologie (KOKON). Projektlaufzeit: 01.07.2019 - 31.08.2019.

Die Hochschule Stralsund ist Bestandteil des Kompetenzzentrums für Digitalisierung: Mittelstand 4.0-Kompetenzzentrum Rostock, das im Rahmen der Förderinitiative Mittelstand 4.0 des Bundesministeriums für Wirtschaft und Energie im Jahr an den Start ging.
Unter der Konsortialführerschaft der IT-Initiative MV e.V. begleiten die Hochschule Stralsund, das Institut für Implantattechnologie und Biomaterialien e.V. (IIB e.V.), die Universitätsmedizin Rostock Versorgungsstrukturen GmbH und die Hochschule Neubrandenburg regionale mittelständische Unternehmen auf dem Weg in die Digitalisierung. Unternehmen aus den Bereichen Tourismus und Gesundheitswirtschaft stehen dabei im Vordergrund.
Im Fokus steht die Sensibilisierung für Chancen und Potentiale, die die Digitalisierung mit sich bringt. Neben der Sensibilisierung und Information wird das Kompetenzzentrum auch Schulungen anbieten, Workshops durchführen und die interessierten Unternehmen bei konkreten Umsetzungsprojekten begleiten. Anhand sogenannter Demonstratoren können sich Unternehmen im Vorfeld anschauen, wie Digitalisierung funktioniert.
Das Stralsunder Teilprojekt DigiTOUR wird durch Prof. Dr. Gero Szepannek vertreten, der von Prof. Dr. Michael Klotz, Prof. Dr. Björn Jacobsen, Prof. Dr. Jasminko Novak und Projekt-Mitarbeitenden sowie Studierenden begleitet wird. Im Fokus stehen hierbei insbesondere die Tourismusbranche sowie Data Science.
Das Projekt wird unter dem Förderkennzeichen 01MF17005E vom Bundesministerium für Wirtschaft und Energie unterstützt. Projektlaufzeit: 01.10.2017 - 30.09.2020
- Produktevaluierung der Tourismusregion Waren/Müritz (01.01. - 31.12.2017)
- Erwartungshaltung von Gesundheitstourismusgästen am Beispiel der Region Rostock/Warnemünde (01.01. - 31.12.2018)
- Untersuchung des Einflusses von Hyperparametern tiefer neuronaler Netze (01.01. - 31.12.2019)
- Identifikation eines zweckmäßigen Umfangs der Anwendung von Maschinenintelligenz (01.01. - 31.12.2020)
- Modellierung der neuronalen Antwort zur Tonhöhenwahrnehmung von Menschen (01.01. - 31.12.2021)
HanseYachts AG
Mecklenburger Backstuben
Strelapark
Tourismuszentrale Rostock & Warnemünde
Vogelpark Marlow
Waren (Müritz) Kur- und Tourismus GmbH
- M.Sc. Rabea Aschenbruck (Digitale Mediendidaktik)
- M.Sc. Alexander Frahm
- B.Sc. Jan-Paul Schulz
- B.Sc. Laurens Tetzlaff
- Bastian Woidt
- Date: October 26th and 27th, 2018
- Location: Stralsund University of Applied Sciences, Building 21 ('Wirtschaft'), Room 326
- Focus Theme: Interpretable Machine Learning
- Registration: There is no conference fee. If you want to attend to the meeting or give a talk please write an email to gero.szepannek@hochschule-stralsund.de by October 15th, 2017. Note that talks are not restricted to the focus theme.
- Keynote: Mateusz Staniak (Warsaw University of Technology): DALEX: Descriptive mAchine Learning EXplanations. Tools for exploration, validation and explanation of complex machine learning models.
- Program
- Joint Dinner at Fritz Braugasthaus
- Hotel Recommendations:
- Hotel Rügenblick (Closest hotel to the campus, embrace hotel, +49 (0) 3831 3569 39-0, Please ask for Hochschule Stralsund special rates.)
- Hotel Hafenresidenz (Located in the city center directly at the border of the sea, +49 (0) 3831 2821 20, Please ask for special rates of faculty of economics at Hochschule Stralsund.)
- Younior Hotel (Hostel located close to the railway station, +49 (0) 800 60 60 880.)
- Public Transport:
- Some Destinations: Hiddensee, Kraniche, Fähren
- Data Analysis Competition:
- Competition 1: Predicting Ebay Prices
- Competition 2: Car Configuration Data

Vorträge:
- "Deskriptive Datenanalysen im Tidyverse", Lars Koppers (Science Media Center, Köln)
- "mlr3shiny – State-of-the-Art Machine Learning Made Easy", Laurens Tetzlaff (Jheronimus Academy of Data Science, 's-Hertogenbosch, NL)
Vorträge:
- "As fast as it gets? Challenging R(cpp) with Julia", Philipp Wittenberg & Philipp Adämmer (Helmut Schmidt Universität Hamburg)
- "Pathway/Disease enrichment analysis using Bioconductor package", Neetika Nath (Institut für Bioinformatik, Universitätsmedizin Greifswald)
- "Schnittmengenvisualisierung mit ComplexUpSet - ein Anwendungsbeispiel in der Blutkulturdiagnostik", Marcus Vollmer (Institut für Bioinformatik, Universitätsmedizin Greifswald)
Vortrag:
- "Die perfekte Grafik mit R - base schlägt gg", Ulrike Grömping (BHT Berlin). Link zu den Folien.
Vorträge:
- "Einführung in Bayesverfahren mit R", Christian Röver (Universität Göttingen)
- "Ergebnisse Performance Coding Challenge", Mario Trouillier (Universität Greifswald), Download Challenge
Vorträge:
- "Circular visualization in R & having fun", Yvonne Gladbach (Universität Rostock)
- "Dimensionsreduktion... von PCA bis HDA -- Heteroskedastische Diskriminanzanalyse (und wofür sie gut ist)", Gero Szepannek (Hochschule Stralsund)
Prof. Dr. rer. nat.
Gero Szepannek
Statistik, Wirtschaftsmathematik und Machine Learning
Tel:
+49 3831 45 6672
Raum:
322, Haus 21