Grundlagen von Pipelines

Implementierung mit Dagster

Pipelines werden als Python-Code mit Dagster definiert. Dieser Ansatz ermöglicht:

Kundenspezifische Verarbeitungslogik für bestimmte Inhaltstypen, Geschäftsregeln oder Qualitätsstandards
Bedingte Workflows, bei denen die Verarbeitungswege je nach Dokumentinhalt, Quelle oder Klassifizierung variieren
Fehlerbehandlung für Netzwerkprobleme, Datenanomalien oder Systemausfälle

Pipeline-Code ist über verschiedene Datenquellen und Agenten hinweg wiederverwendbar. Teams können Pipelines erstellen und ändern, ohne den Agenten-Code anpassen zu müssen.

Datenquellen

Die Plattform umfasst einen vorgefertigten SharePoint-Konnektor für die automatisierte Synchronisierung mit SharePoint-Sites und Dokumentenbibliotheken. Dokumente können auch manuell über die Benutzeroberfläche zur Verarbeitung hochgeladen werden.

Benutzerdefinierte Konnektoren für zusätzliche Quellen erfordern die Implementierung von I/O-Managern und Operationen, die spezifisch für Ihre Datenquelle sind, unter Verwendung des Pipeline-SDKs.

Qualitäts- und Sicherheitskontrollen

Pipelines können Validierungs- und Sicherheitsschritte umfassen:

Die Inhaltsvalidierung prüft eingehende Daten auf Qualität und Vollständigkeit. Dokumente, die die Validierung nicht bestehen, können zur Überprüfung unter Quarantäne gestellt werden.
Das Security Scanning prüft auf bösartige Inhalte oder Richtlinienverstöße vor der Aufnahme.
Die Datenbereinigung wendet Transformationsregeln an, um sensible Informationen zu redigieren oder Klassifizierungsrichtlinien durchzusetzen.

Alle Pipeline-Aktionen werden protokolliert, wodurch eine Audit-Spur von der Dokumentenabfrage über die Verarbeitung bis zur Speicherung entsteht.

Einführung: Die Vision des Swiss AI Hub

Warum Swiss AI Hub

Schnellstart: Ihre ersten 30 Minuten

Plattform-Architektur

Bereitstellungsanleitung

Überwachung und Alarmierung

Einrichtung des Identitätsanbieters

Microsoft Entra ID

Agents

Daten-Pipelines

8 Knowledges

Chat-Schnittstelle

Zugriffsverwaltung

Auditierung und Beobachtbarkeit

Sprachmodelle

Gedächtnis

Mandantenfähigkeit

17 Slack Teams Integrations

18 Api

Sicherheit

Compliance und Vorschriften

Schnellstart

Agenten erstellen

Pipelines erstellen

Prozesse erstellen

Erweiterte SDK-Themen

Funktionen

Mitwirken

KI für Beiträge nutzen

Zertifizierung

API-Referenz

Fehlerbehebung

Glossar

Keycloak-Konfiguration

Pipeline

Sources

Grundlagen von Pipelines

Implementierung mit Dagster

Datenquellen

Qualitäts- und Sicherheitskontrollen

Überwachung und Alarmierung

Einrichtung des Identitätsanbieters

Microsoft Entra ID

Sources

Grundlagen von Pipelines ​

Implementierung mit Dagster ​

Datenquellen ​

Qualitäts- und Sicherheitskontrollen ​

Grundlagen von Pipelines

Implementierung mit Dagster

Datenquellen

Qualitäts- und Sicherheitskontrollen