Kurs 1: Information Retrieval

Wie moderne Suchmaschinen funktionieren

Suchmaschinen wie Google, Bing und Co. begleiten uns täglich bei unseren Ausflügen in die Online Welt. Der Zugang zu Informationen ist so einfach wie noch nie, aber den Überblick zu behalten wird immer mehr zur Herausforderung. Bei jeder Web-Suche wird erwartet, dass die relevantesten Ergebnisse auf den ersten fünf Plätzen stehen. Es scheint selbstverständlich, dass uns persönliche Assistenten wie Siri, Cortana und Google Now in unserem digitalen Alltag helfen und auf jede Frage eine passende und personalisierte Antwort liefern. Clevere Suchmaschinen mit ausgefallenen Algorithmen befeuern diese Entwicklung.

PBG_1.1_Bild

In diesem Kurs lernen die Teilnehmenden, wie moderne Suchmaschinen riesige Datenmengen durchsuchbar machen. Zu Beginn des Kurses untersuchen die Teilnehmenden wie Daten aus verschiedenen Informationsquellen für Suchmaschinen aufbereitet werden können. Zum schnellen Wiederfinden der gespeicherten Informationen wird typischerweise ein Index angelegt. Im weiteren Verlauf des Kurses werden Algorithmen betrachtet, mit denen die Daten anhand dieses Index aufgefunden und nach Relevanzkriterien geordnet werden können. Die Teilnehmenden erarbeiten im Rahmen von Gruppenarbeiten und Vorträgen diese Techniken und Algorithmen.

Die praxisnahe Arbeit an Programmierprojekten bildet einen besonderen Schwerpunkt im Kurs. Die besprochenen Techniken und Theorien werden dabei Schritt für Schritt nachvollzogen und greifbar gemacht. Ein weiteres Augenmerk liegt dabei auf einer interaktiven Benutzeroberfläche und effizienter Anfragenverarbeitung. Gegen Ende des Kurses setzen sich die verschiedenen Bausteine zu einer kompletten Suchmaschine zusammen.

Weil ein gutes Computerprogramm nicht nur vom Computer, sondern auch vom Teamkollegen verstanden werden muss, erwerben die Teilnehmenden auch Fähigkeiten in der Software-Projektentwicklung: von verteilter Quellcodeverwaltung über grundlegende Architekturkonzepte bis hin zu Konventionen, die den Code lesbarer machen. Fortlaufend werden wichtige Abwägungen diskutiert, sodass die Teilnehmenden eine erste Intuition für Entscheidungen in der Softwaretechnik entwickeln können.

Aufgrund unserer Abhängigkeit von Suchmaschinen, haben die Anbieter mittlerweile eine sehr große Marktmacht entwickelt. Dadurch können sie leichter als jemals zuvor Meinungen und Märkte beeinflussen. Außerdem sammeln Suchmaschinen auch Daten über die Nutzer und greifen somit direkt in ihre Privatsphäre ein. Neben den technischen Fragestellungen werden im Kurs ebenfalls die Implikationen auf die Gesellschaft, Wissenschaft und Wirtschaft mit den Teilnehmenden diskutiert.

In Vorbereitung auf den Kurs erarbeiten sich die Teilnehmenden die nötigen mathematischen Grundlagen anhand des zur Verfügung gestellten Materials. Von den Teilnehmenden wird erwartet, dass sie schon erste Erfahrungen bei der Programmierung haben. Spezifische Kenntnisse von Programmiersprachen oder Technologien sind aber nicht notwendig.

Norman Rzepka, Tom Herold

Comments are closed.