n8n · B2B · Leadgenerierung Berufsprojekt

B2B Lead-Pipeline – 257 Firmenkontakte vollautomatisch

Eine mehrstufige, vollautomatisierte B2B-Leadgenerierungs-Pipeline aus 6 n8n-Workflows – gebaut für ppm Fulda. Sammelt Firmen aus deutschen Bibliotheksdatenbanken, Google Places und strukturierten Datenquellen, reichert sie mit Kontaktdaten an und konsolidiert alles dedupliziert in einem Master-Sheet.

März 2026 · 6 n8n-Workflows · 257+ Leads · ppm Fulda

Die Ausgangslage

ppm Fulda druckt hochwertige Kataloge, Zeitschriften und Broschüren für Kunden aus Industrie, Handel und Verlagswesen. Potenzielle neue Kunden – Verlage, Bibliotheken, Institutionen, Verbände – gibt es viele. Aber wer sind sie konkret, wie heißen sie, wie erreicht man sie?

Die Aufgabe: Aus einer langen Liste von Firmennamen automatisch vollständige Kontaktdaten ermitteln und strukturiert aufbereiten. Website, Adresse, Telefon, E-Mail, Ansprechpartner, Funktion. Für über 250 Firmen. Ohne manuelle Recherche.

Was früher Wochen manueller Recherche bedeutet hätte, erledigte die Pipeline in wenigen Stunden – vollautomatisch, ohne erfundene Daten.

Das Ergebnis

257+
qualifizierte B2B-Leads im Master-Sheet
6
n8n-Workflows in der Pipeline
Deduplizierung – keine Duplikate im Master

Was pro Firma ermittelt wird

🏢
Firmenname
normalisiert und bereinigt
🌐
Website
offizielle Domain, verifiziert
📍
Adresse
aus Impressum extrahiert
📞
Telefon
aus Kontakt-/Impressumsseite
✉️
E-Mail
direkte Adresse bevorzugt
👤
Ansprechpartner
nur wenn eindeutig gefunden
🏷️
Funktion
Position der Person
📊
Status & Quelle
Herkunft + Prüfdatum
Keine erfundenen Daten

Ansprechpartner und Funktionen werden nur übernommen wenn sie eindeutig auf der Website gefunden werden. Lieber ein leeres Feld als eine falsche Person. Das war eine explizite Anforderung – und technisch die schwierigste zu erfüllen.

Die 3-stufige Pipeline

1
Lead-Quellen – 3 parallele Finder
Drei Workflows laufen parallel und befüllen eigene Sheets. Jede Quelle liefert andere Firmentypen – zusammen entsteht eine breite Abdeckung.
lobid.org (kostenlos) Wikidata SPARQL (kostenlos) ZDB SRU/XML (kostenlos) Google Places API Scrape.do OpenAI Agent
2
Anreicherung – Kontaktdaten aus dem Web
Zwei Workflows crawlen für jeden Lead die Homepage, Kontaktseite und Impressum. Ein automatischer Scheduler verarbeitet 30 Firmen pro Lauf, ein manueller Workflow schließt Lücken. OpenAI extrahiert strukturierte Felder aus dem HTML.
Impressum-Crawling OpenAI Structured Output Schedule (30/Lauf)
3
Konsolidierung – Master-Sheet
Der sechste Workflow liest alle drei Quell-Sheets, merged die Daten, normalisiert Felder, dedupliziert global und führt einen Upsert in den Master-Sheet durch. Bestehende Einträge werden aktualisiert, neue angehängt – kein Datenverlust bei Mehrfachläufen.
Dreistufige Deduplizierung Upsert-Pattern Google Sheets Master

Die 6 Workflows im Detail

01
Lead Finder 1 – lobid.org + Wikidata
Ruft deutsche Institutionen aus dem Bibliotheksnetz (lobid REST-API) und Wikidata (SPARQL) ab. Läuft in Batches, merged beide Quellen, dedupliziert und schreibt per Upsert in Sheets. Komplett kostenlos.
02
Lead Finder 4 – ZDB Zeitschriftendatenbank
Durchsucht die deutsche Zeitschriftendatenbank über das SRU-Protokoll, parst XML-Antworten und mappt auf ein einheitliches Lead-Format. Kostenlos, kein API-Key.
03
Automated B2B Lead Generation
Findet Firmen per Google Places API, bewertet sie mit einem Qualitäts-Score, filtert Low-Quality-Leads heraus. Scrapt Websites via Scrape.do und extrahiert Kontaktdaten per OpenAI-Agent mit Structured Output Parser.
04
Kontaktdaten-Anreicherung (automatisch)
Läuft per Schedule, verarbeitet 30 Firmen pro Lauf. Normalisiert URLs, crawlt Homepage + Impressum, extrahiert E-Mail/Telefon/Adresse per Code-Node. Bereits bearbeitete Einträge werden übersprungen.
05
Firmenrecherche – manuelle Anreicherung
Sucht fehlende Websites, crawlt Homepage + Kontaktseite + Impressum in einem Loop. Konsolidiert Ergebnisse und updated den Sheets-Eintrag – oder markiert „nichts gefunden".
06
Leads zusammenführen – Master-Konsolidierung
Liest alle drei Quell-Sheets parallel, merged und normalisiert, dedupliziert global und führt Upsert in den Kundendaten-Master-Sheet durch. Kernstück der Pipeline.
📊
Screenshot-Platzhalter
Master-Sheet mit strukturierten Firmenkontakten

Was dieses Projekt besonders macht

Kostenoptimiert: Zwei von drei Lead-Quellen (lobid.org und ZDB) sind vollständig kostenlos – kein API-Key, kein Limit. Nur Google Places und Scrape.do sind kostenpflichtig, kommen aber für Firmentypen zum Einsatz die in den freien Quellen nicht auftauchen.

Impressum-First: Deutsche Firmen haben rechtlich verpflichtende Impressum-Seiten – die zuverlässigste und rechtssicherste Quelle für valide Kontaktdaten. Der Anreicherungs-Workflow priorisiert Impressum vor Kontaktseite vor Homepage.

Fehlerresistenz: Jeder Fehler pro Firma wird abgefangen ohne den gesamten Lauf zu stoppen. Bereits bearbeitete Datensätze werden übersprungen. Das macht die Pipeline stabil für mehrere hundert Firmen über mehrere Läufe hinweg.

Vom Berufsprojekt zum privaten System

Was für ppm Fulda als Kundenlisten-Projekt begann, wurde zur Blaupause für alle weiteren Lead-Projekte. Die dreistufige Deduplizierung, das Upsert-Pattern und die Impressum-First-Strategie sind seitdem Standardbausteine in allen meinen n8n-Workflows die mit Firmendaten arbeiten.