Datenaggregation mit Repco – Replication & Collector
Durch den Einsatz unseres Open Source Metadatenaggregators Repco können verschiedenste Datenquellen, etwa über RSS oder über das Übertragungsprotokoll ActivityPub, in einer Datenbank aggregiert werden.
Unsere Projektwebsite zeigt prototypisch die Funktionsweise dieser Software in Kombination mit dem entstandenen Such- und Empfehlungssystem: Als zusätzliche, vertrauenswürdige Quellen wurden exemplarisch die RSS Feeds der Arbeiterkammer Österreich, Blog Arbeit & Wirtschaft, Forba sowie dem Momentum Institut aggregiert. Wird nun ein Suchbegriff eingegeben, erscheinen neben den plattformeigenen Inhalten zusätzlich relevante Suchergebnisse aus diesen Quellen. Auf diese Weise kann selbst eine erweiterte Knowledge-Base als ganz unterschiedlichen Datenquellen aufgebaut werden.
Code Repository: https://git.fairkom.net/emb/displ.eu/repco
Technische Dokumentation unter https://git.fairkom.net/emb/displ.eu/repco/-/tree/main/docs
Recommendation & Search
Das Such- und Recommendersystem kann in einem zweiten Schritt auf diesen Datenbestand angewendet werden.
Das Repository des Recommender- und Suchsystems inklusive einer technischen Einführung findest du unter https://gitlab.com/cbamedia/recommender/
Empfohlene Recommender Prozessarchitektur
In der Prozessarchitektur werden alle Schritte, von der Recommenderentwicklung, Datenanreicherung, -aufbereitung, und -cleaning über das Fine-Tuning bis hin zum fertigen Produkt dargestellt.
Klicke auf die Grafik, um das PDF herunterzuladen.