Web Scraping in Python – mit Mounir Afifi

In dem #OpenLearning-Seminar „Web Scraping in Python“ bietet Mounir Afifi, ein erfahrener Softwareentwickler bei CompuSafe, einen umfassenden Einblick in die Praxis des Web Scrapings unter Verwendung der Programmiersprache Python. Mounir, mit Expertise in Oracle-Datenbanken und Python, zielt darauf ab, sowohl Einsteiger als auch fortgeschrittene Nutzer in die Grundlagen und fortgeschrittenen Techniken des Web Scrapings einzuführen. Dieses Seminar wird in englischer Sprache durchgeführt.

Web Scraping in Python - mit Mounir Afifi Isometrische Illustration #OpenLearning
Created with Midjourney
https://www.youtube.com/watch?v=aAmEG8kfPu0
Web Scraping in Python – mit Mounir Afifi

Das Seminar beginnt mit einer Einführung in das Web Scraping, wobei Mounir die Technik als Methode zur Extraktion von Informationen aus dem Internet definiert, idealerweise aus unstrukturierten oder komplexen Datenquellen. Er betont die Eignung von Python für diese Aufgabe aufgrund seiner Einfachheit, Vielfalt an Bibliotheken und einer aktiven Community.

Im praktischen Teil des Seminars demonstriert Mounir die Installation und Nutzung von Beautiful Soup und Requests, zwei wesentlichen Python-Bibliotheken für das Web Scraping. Er führt durch den Prozess des Schreibens von Python-Code zum Abrufen und Analysieren von Webseiteninhalten, wobei er die Teilnehmer schrittweise durch die Grundlagen führt.

Der Höhepunkt des Seminars ist die Entwicklung einer Preisvergleichsanwendung. Mounir  zeigt, wie man relevante Datenpunkte von Webseiten identifiziert und extrahiert und diese dann in eine Excel-Tabelle exportiert. Dieser Teil des Seminars vermittelt praktische Anwendungsfähigkeiten, die direkt auf reale Szenarien übertragbar sind.

In den abschließenden Abschnitten werden fortgeschrittene Techniken und Methoden für das Web Scraping behandelt. Diese umfassen das Navigieren durch komplexe Datenstrukturen und effektive Strategien zur Datenextraktion und -verarbeitung. Zusammenfassend bietet das Seminar „Web Scraping in Python“ eine grundlegende und fortgeschrittene Ausbildung im Web Scraping, wobei der Schwerpunkt auf der praktischen Anwendung von Python liegt. Es ist ideal für diejenigen, die ihre Fähigkeiten in der Datenerfassung und -analyse erweitern möchten, und bietet wertvolle Einblicke und Fähigkeiten für eine Vielzahl von beruflichen und akademischen Anwendungen.

Die wichtigsten Segmente im Video

  • 0:29 – 1:54 Mounir Afifi, Softwareentwickler bei CompuSafe, stellt sich vor und gibt einen Überblick über das Seminar zum Thema Web Scraping mit Python. Er betont seine Erfahrung mit Oracle-Datenbanken und Python für Automatisierung, Testing und Scraping.
  • 1:55-2:57: Mounir erklärt, dass das Seminar bei Grundlagen anfängt und Beautiful Soup als Bibliothek für das Web Scraping verwendet wird. Vorkenntnisse in HTML und Python sind hilfreich, aber nicht zwingend erforderlich.
  • 2:58-5:10: Es wird diskutiert, was Web Scraping ist, welche Anwendungsmöglichkeiten es bietet und warum Python dafür geeignet ist. Web Scraping wird als Technik definiert, um Informationen aus dem Internet zu extrahieren, oft aus unstrukturierten oder komplexen Datenquellen.
  • 5:11-9:08: Mounir führt aus, warum Python für Web Scraping geeignet ist, hervorhebend, dass Python einfach zu erlernen ist, eine große Bibliotheksvielfalt bietet und eine umfangreiche Community hat.
  • 9:09-27:28: Der praktische Teil des Seminars beginnt. Mounir demonstriert, wie Python für Web Scraping verwendet wird, einschließlich der Installation und Verwendung von Beautiful Soup und Requests. Er zeigt, wie man Python-Code schreibt, um Webseiteninhalte abzurufen und zu analysieren.
  • 27:29-54:01: Mounir demonstriert ein praktisches Beispiel für Web Scraping, indem er eine Preisvergleichsanwendung entwickelt. Er erklärt den Prozess der Identifizierung und Extraktion relevanter Datenpunkte von Webseiten und deren Export in eine Excel-Tabelle.
  • 54:02-Ende: Der Rest des Seminars vertieft die technischen Aspekte des Web Scrapings. Mounir demonstriert fortgeschrittene Techniken und Methoden, um komplexe Datenstrukturen zu navigieren und Daten effektiv zu extrahieren und zu verarbeiten.
Anke Schnitzer

Leitung IT-Workforce Transformation

52
offene Stellen