Datenquellen verbinden
Überblick
Ein effektives Management deiner Datenquellen ist die Grundlage eines zuverlässigen Analyse-Workflows. In dieser Anleitung zeigen wir dir, wie du auf den Bereich Sources (Datenquellen) zugreifst, die wichtigsten Informationen sofort erkennst, deine Schemas aktuell hältst und neue Verbindungen hinzufügst – in einem klaren, nachvollziehbaren Ablauf, der erklärt, warum jeder Schritt wichtig ist.
Zugriff auf deine Datenquellen
Sobald du dich im Builder befindest, wirf einen Blick auf das Hauptmenü auf der linken Seite. Klicke dort auf Builder und anschließend auf Sources. Sofort erscheint eine vollständige Übersicht aller Datenquellen, die du jemals registriert hast – kein Suchen in versteckten Einstellungen oder komplizierten Terminal-Kommandos. Diese zentrale Seite ist dein Kontrollzentrum zum Verbinden, Testen und Verwalten sämtlicher Systeme, die deine Analysen antreiben.
Was du siehst – und warum es wichtig ist
Im Mittelpunkt des Sources-Bildschirms steht eine tabellarische Darstellung all deiner Verbindungen. Jede Zeile liefert wichtige Informationen:
Name
Eine frei wählbare Bezeichnung, die du selbst vergibst – z. B. prod_orders_db oder stripe_payments_api. Durch sprechende Namen wird aus einer kryptischen Liste eine verständliche Übersicht, in der du dich sofort zurechtfindest.
Connection Type
Zeigt die verwendete Technologie – etwa PostgreSQL, MySQL, REST API usw. So weißt du sofort, welche Protokolle oder Treiber im Einsatz sind und kannst im Fehlerfall gezielt ansetzen.
Created & Last Modified
Zwei Zeitstempel: Wann wurde die Datenquelle hinzugefügt, wann zuletzt bearbeitet? Das hilft bei der Nachverfolgung von Änderungen und zur Vermeidung von Konfigurationsabweichungen.
Status
Eine einfache Anzeige, ob der letzte Verbindungstest erfolgreich war. Grün heißt: alles funktioniert. Rot signalisiert: Es gibt ein Problem, das behoben werden muss.
Actions
Vier Buttons ermöglichen es dir, Konfigurationen zu bearbeiten, Tests erneut durchzuführen, Quellen zu löschen oder – ganz wichtig – den Schema-Cache zu erneuern. Alles mit nur einem Klick, ohne durch Untermenüs zu navigieren.
Schemas aktuell halten
Im Hintergrund speichert der Builder Metadaten zu Tabellen, Spalten und Datentypen in einem Cache, um die Performance zu optimieren. Doch Datenbanken leben – Tabellen werden ergänzt, Spalten umbenannt, Typen verändert. Wenn sich das physische Schema ändert, kann der Cache veraltet sein – was zu fehlenden Tabellen in deinen Abfragen oder SQL-Fehlern in deinen Modellen führen kann.
Hier hilft „Renew Cache“. Klicke darauf, und der Builder führt folgende Schritte aus:
- Liest das aktuelle Schema der Datenquelle ein
- Aktualisiert den internen Cache
- Macht neue oder geänderte Tabellen und Spalten sofort verfügbar
Bearbeiten, Testen, Löschen
Im selben Aktionsmenü findest du:
Edit ändert Hostnamen, Ports oder Zugangsdaten direkt, ohne die Quelle neu erstellen zu müssen.
Test führt sofort einen Verbindungstest durch. So erkennst du Netzwerkprobleme oder fehlerhafte Zugangsdaten frühzeitig.
Delete entfernt die Datenquelle samt Metadaten dauerhaft. Wichtig: Stelle sicher, dass keine Entities mehr von dieser Quelle abhängig sind.
Neue Datenquelle hinzufügen
Bereit für ein weiteres System? Direkt unter der Tabelle findest du den Button ⁺ Add Source. Er führt dich durch ein einfaches Formular:
Name – Vergib einen klaren, wiedererkennbaren Namen.
Connection Type – Wähle zwischen relationaler Datenbank, REST API, CSV-Datei oder anderen unterstützten Typen.
Host & Port – Gib IP-Adresse oder URL ein; Standardports werden automatisch vorgeschlagen.
Authentication Mode – Wähle zwischen Benutzername/Passwort, OAuth, API-Schlüssel oder anderen Methoden.
Use SSL – Aktiviere diese Option, wenn du eine verschlüsselte Verbindung benötigst.
Credentials – Trage die Zugangsdaten (und ggf. den Datenbanknamen) ein.
Create – Der Builder testet die Verbindung sofort und informiert dich, ob alles korrekt eingerichtet ist.
Falls der Test fehlschlägt, erhältst du eine klare Fehlermeldung – inklusive Hinweise zur Behebung (z. B. Tippfehler, Netzwerkregeln oder fehlende Berechtigungen).
Best Practices für einen reibungslosen Ablauf
Namenskonventionen
Verwende Präfixe wie dev_, stg_, prod_ und Suffixe wie _eu_central, _us_west, um deine Quellen systematisch zu benennen.
Minimalberechtigungen
Gib nur die Rechte, die wirklich benötigt werden. Drehe Zugangsdaten und API-Schlüssel regelmäßig.
SSL überall
Verschlüssele alle Datenübertragungen – vor allem über öffentliche Netzwerke. Bei Zertifikatsfehlern hilft oft ein Blick in die CA-Kette.
Wenn du diese Schritte und Empfehlungen befolgst, bleiben deine Datenquellen stabil, aktuell und jederzeit einsatzbereit – bereit, deine nächste große Analyse oder Machine-Learning-Pipeline zu unterstützen.
Viel Erfolg beim Bauen!