Hosting · Wie Sie DripBack in Betrieb bekommen

Sie brauchen keine Hardware. Wir hosten alles.

DripBack ist Hosted-SaaS auf unseren dedizierten deutschen Servern (Hetzner Frankfurt, RTX-5090-GPUs). Sie bekommen Zugang über Web-Login, Telefon-Number-Forwarding, IMAP-Anbindung. Optional: für Kunden mit strengen Datenschutz-Anforderungen bauen wir dedizierte On-Premise-Hardware (Dual-RTX-4090-Workstation), die wir bei Ihnen installieren und remote betreuen.

Zwei Wege · DripBack in Betrieb

Hosted-SaaS oder On-Premise. Sie wählen.

Option B · On-Premise · Custom-Hardware

Wir bauen. Sie betreiben.

Für Kunden mit strengsten Datenschutz-Anforderungen (Berufsgeheimnis, Anwalt, Steuerberater, Healthcare): wir custom-builden eine GPU-Workstation und installieren sie bei Ihnen. Daten verlassen NIE Ihr Gebäude.

  • Custom-Build: Dual RTX 4090 24GB in Verbund · 256GB RAM · NVMe
  • Vor-Ort-Installation in Ihrem Server-Raum · 1 Tag Aufwand
  • Remote-Wartung via Wireguard-VPN · keine ständige Cloud-Verbindung nötig
  • 100% Air-Gap-Option: komplett offline-fähig wenn gewünscht
  • Daten-Souveränität absolut: Berufsgeheimnis-konform für Anwälte/Ärzte
  • Garantie + Support 36 Monate · Hardware-Tausch im Defekt-Fall
  • Schulung Ihres IT-Teams oder Wartungsvertrag mit uns
  • Skalierbar lokal: bis 200 parallele Anrufe / 50k Mails/Tag
Preise · On-Premise
ab 12.500 € einmalig · Hardware + Setup
ab 499 € / Monat · Wartungsvertrag (Pflicht)

Pilot-Phase (erste 3 Monate) reduziert auf 299 €/Monat, danach Standard-Tarif. Wartung umfasst: Security-Updates, Modell-Updates, Remote-Support 4h SLA, Hardware-Garantie 36 Monate.

Warum Pflicht? On-Premise-Hardware in regulierter Umgebung (Anwalt, Arzt, Steuerberater) muss permanent gepatcht und überwacht werden. Ein ungewarteter LLM-Server ist ein Compliance-Risiko — wir liefern keine ungewarteten Systeme aus.

On-Premise · Wie wir bauen

Vier Schritte. Ein dedizierter AI-Server bei Ihnen vor Ort.

Scrollen Sie durch , der Server-Rack rechts wird mit jedem Schritt weiter zusammengebaut. Custom-Hardware, Vault-DB, VPN-Wartung, Garantie.

01 · Frame

Custom-Case · 4U Tower mit gehärtetem Glas

Wir starten mit einem dedizierten Tower-Case. Tempered-Glass-Seite, EMI-geschirmt, mit Fußrollen für Server-Raum oder Büro. Burn-in 72h im Test-Lab vor Versand.

02 · Mainboard

ASUS WRX90 · Threadripper-fähig

Workstation-Mainboard mit 8× DIMM-Slots, 7× PCIe-5.0-x16 (full-length), 10G-Ethernet, IPMI für Out-of-Band-Management. Plattform für Multi-GPU-Inferenz und 256 GB RAM.

03 · GPUs

2× NVIDIA RTX 4090 · 48 GB VRAM total

Zwei RTX 4090 mit je 24 GB VRAM. Reicht für qwen-2.5 14b in beiden GPUs gespiegelt + parallele STT/TTS-Inferenz. Custom-Watercooling optional bei Dauer-Workloads (>16h/Tag).

04 · RAM + Storage

256 GB DDR5-ECC · 2× 4 TB NVMe RAID-1

ECC-RAM für 24/7-Stabilität, RAID-1 NVMe für ausfallsichere Conversation-Logs. Postgres + Hashicorp Vault verschlüsselt komplett lokal , Berufsgeheimnis-konform, kein Cloud-Sync.

05 · Live · DripBack-RGB

Eingeschaltet · 36 Monate Garantie + Wartung

Wireguard-VPN für Remote-Wartung (Air-Gap-Modus möglich). 4h-SLA Komponenten-Tausch in DE-Ballungsräumen. Security-Patches, Modell- Updates, Backups , alles im monatlichen Wartungsvertrag.

Hosting-Details

Was unter der Haube läuft.

Vier Säulen unserer Infrastruktur , gilt sowohl für Hosted-SaaS als auch für On-Premise-Builds.

⌑ GPU-Stack

RTX 5090 + RTX 4090

Dedizierte GPUs für Inferenz. RTX 5090 in unseren SaaS-Servern (32GB VRAM), RTX 4090 in On-Premise-Builds (24GB). Sub-1.5s Latenz für Phone-Anwendungen.

⌑ Modelle

qwen-2.5/3 + Spezialisten

qwen-2.5:14b/32b für Standard-Anwendungen, qwen-2.5-coder für Code-Generierung, faster-whisper-large-v3 für STT, VoxCPM2 für TTS. Modulare Modell-Wahl pro Use-Case.

⌑ Compliance

DSGVO + BDSG + AVV

Hosting ausschließlich in DE. AVV-Vertrag mit jedem Kunden. Berufsrecht-Sonder-Setups für Anwalt/Arzt verfügbar. Audit-Logs 90 Tage aufbewahrt.

⌑ Support

4h Response · Mo-Fr

Direkter Zugang zu Tech-Lead Timo. Kein Call-Center, keine Eskalationsstufen. Antwort auf Tickets typisch unter 4h, garantiert unter 24h. Wochenendsupport on-call bei Pro/Enterprise.

Funktions-Matrix

Alle Module · Alle Hosting-Modelle.

Jedes Modul läuft sowohl in Hosted-SaaS als auch auf On-Premise-Hardware. Sie können später zwischen beiden Modi migrieren , kein Lock-in.

Modul Hosted-SaaS On-Premise Latenz typ. Kapazität
AI-Receptionist · Phone ✓ ab 699€/mo ✓ included 1.0-1.4s 1.000 parallele Calls
E-Mail-Triage ✓ ab 599€/mo ✓ included ~0.84s / 87 Mails 100k Mails/Tag
Workflow-Bundle (Buchh. · Einkauf · Kalender) ✓ ab 699€/mo ✓ included 60s/Beleg → DATEV 10k Belege/Monat
Websites-on-Demand ✓ Setup 2.500€ · Wartung 349€/mo via Hosted-SaaS 30-60s/Mockup Vercel-DE skaliert
Custom-AI ✓ Preis auf Anfrage · Wartung ab 449€/mo ✓ Custom-Build je Use-Case je Use-Case
60-Min Discovery-Audit

Welcher Pfad passt zu Ihnen?

Wir besprechen Ihren Pain-Point, klären Compliance-Anforderungen (Berufsgeheimnis ja/nein, Datenschutz-Level) und empfehlen ehrlich Hosted-SaaS oder On-Premise-Hardware. Kostenlos, 60 Minuten.

Audit anfragen →