Data Journalism, Data Analytics and AI Summercamp
Ein Kooperations-Event mit Claus Hesseling
Daten und KI spielen eine immer größere Rolle – sowohl im Journalismus, als auch in der Wissenschaft und natürlich in Unternehmen. Du möchtest Python und die Daten-Library Pandas kennenlernen? Du willst lernen, wie man Daten von Webseiten scrapt, APIs anzapft oder große Datenmengen bereinigt, filtert und pivotiert und die Ergebnisse visualisiert? Du freust Dich darauf, KI-Tools kennenzulernen und sie im Python-Umfeld anwenden zu können (Dokumentenanalyse mit RAG und Langchain, NLP mit space, Topic Modeling)? Und Du willst allerhand praktische Tools und Tricks kennenlernen, mit denen die Daten-Analyse leichter wird? Dann bist du hier richtig! In unserer Summer School, die dem LEDE-Programm an der Columbia University nachempfunden ist, geht es darum, innerhalb weniger Wochen in die Welt der Datenanalyse und Datenarbeit einzusteigen. Auf geht’s zur Reise in die Welt der Datenanalyse!
Themenschwerpunkte
Der gesamte Workshop dauert drei Wochen vom 5. bis zum 23. August 2024 und ist wiefolgt aufgebaut:
WOCHE 1
- Python / Pandas
- Scraping mit Requests/BeautifulSoup/Playwright/Selenium
- „Messy data“ reinigen, Regex und Co.
- Datenanlayse mit Pandas
- APIs anzapfen
- Datenvisualisierung mit matplotlib and seaborn
WOCHE 2
- Data-Pipelines mit Github Actions bauen und ausführen
- Bot für TEAMS, Slack oder Telegram bauen
- Interagieren mit Datenbanken / SQL
- Geodatenverarbeitung: QGIS
- Geodatenverarbeitung: GeoPandas
WOCHE 3
- KI-APIs nutzen (z.B. OpenAI Whisper, Vision, etc)
- Image recognition
- Natural Language Processing (NLP mit Space) und Topic Modeling (BERTopic)
- Eigenes Mini-Projekt
Lernziele
Egal, ob Du Einsteiger:in bist oder schon erste Erfahrungen gesammelt hast, unser Workshop bietet Dir die perfekte Gelegenheit, Dein Wissen und Deine Fähigkeiten im Bereich Data Analytics und Data Journalism zu vertiefen und zu erweitern.
Teilnehmergruppe
- Der Workshop richtet sich an alle, die sich für den Bereich Datenanalyse, Datenjournalismus und KI interessieren.
- Summercamp für alle, die in Bereichen wie Datenjournalismus, Business Intelligence, Social Media-Analytics, Daten-Pipelines, Geodaten, Natural Language Processing und Künstliche Intelligenz arbeiten oder sich dafür interessieren.
- Der Workshp eignet sich für Einsteiger:innen in dem Bereich, Coding-Vorerfahrungen sind keine Voraussetzung.
Wie ist der Workshop aufgebaut?
- Das Wichtigste vorweg: Gute Workshops kommen (fast) ohne Powerpoint und Co. aus! So ist es auch bei uns: Der Schwerpunkt liegt auf der praktischen Arbeit. Ausprobieren. Scheitern. Nochmal versuchen. Erfolgserlebnisse mitnehmen. Und vor allem: Spaß haben.
- Der Workshop startet mit 2 Präsenztagen in Berlin – das ist eine gute Chance, sich persönlich kennen zu lernen. Du kannst nicht nach Berlin kommen? Kein Problem, wir führen das Ganze hybrid durch.
- Anschließend treffen wir uns via Zoom im Live-Präsenzworkshop. Der gesamte Workshop dauert drei Wochen.
- Morgens geht es um 9.30 Uhr los mit einer kurzen Wiederholungsrunde, einem Warm-Up Quiz – dann starten wir in die inhaltliche Arbeit. Das Ganze ist anstrengend, aber keine Sorge: Es gibt regelmäßige Pausen (ca. 10 Minuten Pause pro Stunde). Und wir machen auch eine Mittagspause.
- Studien haben gezeigt, dass Menschen sich nicht wirklich lange am Stück konzentrieren können – gerade am Nachmittag ist es schwer, neue Inhalte aufzunehmen. Deshalb ist der Nachmittag dafür reserviert, dass Du allein oder in kleinen Gruppen die Inhalte vom Vormittag selbst ausprobierst. Nur so bleiben sie hängen. Keine Sorge: Du wirst dabei ständig betreut.
Referent
Claus Hesseling (Jahrgang 1979) ist seit vielen Jahren als freier Journalist für verschiedene öffentlich-rechtliche Sender tätig, vor allem für den WDR und NDR. Seit 2019 ist er Teil des Datenteams vom Norddeutschen Rundfunk und setzt dort daten-gestützte Recherchen um. Darüber hinaus entwickelt und leitet Claus Hesseling als Trainer und Dozent seit 2004 Seminare und Workshops unter anderem zu den Themen Recherche, Datenjournalismus, Onlinejournalismus und Crossmediale Produktion.