SYSTEM_ONLINE

Das KI-Kompendium

Alles, was Sie über KI im Unternehmenseinsatz wissen müssen.
Lösungen. Infrastruktur. Fachwissen. Praxis.

Lösungen Wissenslandkarte Fachartikel Glossar

Plattformen

Fachartikel

Glossar-Einträge

Services

// KI-Lösungen

Unsere KI-Plattformen

Zwei Produkte, ein Ziel: KI sicher und produktiv in Ihrem Unternehmen. Ohne Cloud. Ohne Datenabfluss.

KI Workplace

Die On-Premise KI-Plattform für den Mittelstand. Unternehmenswissen per natürlicher Sprache durchsuchen, Prozesse automatisieren, Dokumente auswerten.

KI On-Premise Infrastruktur

GPU-Server, Hardware-Planung und Betriebsmodelle für Ihre eigene KI-Infrastruktur. NVIDIA A100/H100, Multi-GPU-Setups, Enterprise-Hardware.

// Wissenslandkarte

KI-Themen im Überblick

Die wichtigsten Themenbereiche rund um KI im Unternehmenseinsatz.

Large Language Models

Open-Source-Modelle für den Unternehmenseinsatz

Qwen 2.5 Mistral Llama 3 DeepSeek Fine-Tuning

RAG & Wissensmanagement

Semantische Suche statt Stichwortsuche

RAG Vektordatenbank Embeddings Qdrant Chunking

GPU-Infrastruktur

Von einzelnen GPUs bis Multi-Node-Cluster

NVIDIA A100 H100 RTX 4090 vGPU Apple Silicon

Automatisierung

KI-gestützte Workflows für den Alltag

n8n Workflows KI-Agenten Ticket-Automation

DSGVO & Compliance

KI datenschutzkonform betreiben

DSGVO On-Premise Audit-Log ISO 27001

KI-Entwicklung

Code-Generierung, Vibe Coding, Legacy

Vibe Coding Code-Gen API-Wrapper MLX

// Fachartikel

KI-Wissen zum Nachlesen

Praxisnahe Artikel. Kein Marketing, sondern fundierte Informationen für Entscheider und IT-Verantwortliche.

DSGVO

KI On-Premise: DSGVO-konforme KI-Lösungen

KI im eigenen Rechenzentrum: Volle Datenkontrolle, DSGVO-Konformität und keine Cloud-Abhängigkeit.

Datenschutz Private AI Datensouveränität

Modernisierung

Wie KI veraltete Software wieder wettbewerbsfähig macht

VB.NET/C# Legacy-Systeme durch Vibe Coding und KI-Integration modernisieren. APIs statt Neubau.

Legacy Vibe Coding API-Wrapper

Hardware

Mac Studio Cluster: Große Modelle lokal betreiben

Kimi K2, DeepSeek und andere auf Apple Silicon Clustern. Bis zu 512 GB Unified Memory.

Apple Silicon M4 Ultra MLX

Deployment

MoltBot & OpenClaw via ki.gateway

KI-Modelle per One-Click deployen. Einheitliche API, Kostencontrolling, DSGVO-konform.

ki.gateway MoltBot API

Launch

ki-spezial.systems: KI-Hosting der nächsten Generation

Spezialisiertes KI-Hosting mit GPU-Servern für Machine Learning und Deep Learning Workloads.

GPU-Server KI-Hosting ML/DL

// Ergänzende Leistungen

KI braucht eine solide Basis

Diese Services bilden die Grundlage für einen erfolgreichen KI-Betrieb.

Hardware & GPU

Enterprise-Server und GPU-Hardware für KI-Workloads. NVIDIA-zertifiziert.

Virtualisierung

Proxmox VE mit vGPU-Support für KI-Container und GPU-Sharing.

Managed IT

KI-Plattform als Teil Ihres Managed IT. Betrieb, Wartung, Support.

Cyber Security

Absicherung der KI-Infrastruktur. Netzwerkisolation, Zugriffskontrolle.

Backup & DR

Sicherung der KI-Modelle, Vektordatenbanken und Konfigurationen.

Monitoring

GPU-Auslastung, Modell-Performance und Systemgesundheit.

// Glossar

KI-Begriffe erklärt

Die wichtigsten Begriffe. Verständlich, nicht akademisch.

ESC

LLM (Large Language Model)

Sprachmodell, das auf großen Textmengen trainiert wurde. Kann Texte verstehen, zusammenfassen, übersetzen und generieren. Beispiele: Qwen, Mistral, Llama.

RAG (Retrieval Augmented Generation)

Technik, bei der das LLM vor der Antwort relevante Dokumente aus einer Wissensdatenbank abruft. Damit antwortet die KI auf Basis Ihrer echten Daten.

Vektordatenbank

Datenbank, die Inhalte als mathematische Vektoren speichert. Ermöglicht semantische Suche: Findet inhaltlich ähnliche Dokumente, auch bei anderer Formulierung.

Embedding

Mathematische Darstellung eines Textes als Zahlenvektor. Texte mit ähnlicher Bedeutung haben ähnliche Vektoren. Grundlage für RAG.

On-Premise

Software und Hardware im eigenen Rechenzentrum. Keine Daten verlassen das Unternehmen. Gegenteil von Cloud.

VRAM (Video RAM)

Arbeitsspeicher der GPU. Bestimmt, wie große KI-Modelle geladen werden können. 24 GB reicht für 7B-13B Parameter, 80 GB+ für größere.

Inferenz

Der Vorgang, bei dem ein trainiertes KI-Modell eine Anfrage verarbeitet und eine Antwort generiert. Benötigt weniger Rechenleistung als Training.

Fine-Tuning

Nachtraining eines vortrainierten Modells mit eigenen Daten. Spezialisiert das Modell auf bestimmte Aufgaben oder Fachsprache.

Prompt Engineering

Die Kunst, Anfragen an KI-Modelle optimal zu formulieren. Systemanweisungen, Kontext und Beispiele steuern die Ausgabequalität.

Halluzination

Wenn ein KI-Modell plausibel klingende, aber falsche Antworten generiert. RAG reduziert dies durch echte Dokumente als Kontext.

Open WebUI

Open-Source-Benutzeroberfläche für lokale LLMs. Chat-Interface, Dokumenten-Upload, Rollen und Berechtigungen.

n8n

Open-Source-Automatisierungsplattform. Verbindet KI-Modelle visuell mit bestehenden Systemen. Keine Programmierkenntnisse nötig.

Kein Treffer. Versuchen Sie einen anderen Begriff.

// Nächster Schritt

Bereit, KI in Ihrem Unternehmen einzusetzen?

In einem kostenlosen Erstgespräch klären wir, welche KI-Lösung zu Ihren Anforderungen passt.

KI-Beratung anfordern

Häufige Fragen

FAQ — KI-Kompendium

Antworten rund um KI-Einsatz im Mittelstand, On-Premise vs. Cloud und Datenschutz.

Ja, wenn konkrete Anwendungsfälle mit messbarem Nutzen im Fokus stehen. Typische Mittelstandsszenarien: Dokumentenanalyse, Angebotserstellung, E-Mail-Klassifikation, technischer Support, Wissensmanagement und Qualitätssicherung. Pilotprojekte amortisieren sich oft innerhalb von 6 bis 12 Monaten, wenn die Prozesse klar abgegrenzt sind. Wichtig ist, nicht mit der Technik, sondern mit dem Geschäftsproblem zu starten. Wir begleiten Auswahl, Proof of Concept und Rollout.

Die Antwort hängt von Datenschutz, Latenz und Auslastung ab. On-Premise (eigene GPU-Server oder unser Rechenzentrum) bietet volle Datenhoheit, planbare Kosten und keine Abhängigkeit von US-Anbietern. Cloud-KI (OpenAI, Azure AI) skaliert flexibel, bringt aber Datenschutzfragen und laufende Nutzungsgebühren. Für sensible Bereiche (Gesundheit, Recht, KRITIS) empfehlen wir On-Premise mit Open-Source-Modellen, für breite Bürotools oft die Cloud.

Mit Enterprise-Verträgen, Azure OpenAI in EU-Regionen und abgeschlossenem AVV grundsätzlich ja. Wichtig: Eingaben dürfen nicht ins Modelltraining fließen, Protokolle müssen geschützt sein, und Mitarbeiter brauchen klare Richtlinien, welche Daten eingegeben werden dürfen. Personenbezogene oder kritische Geschäftsdaten gehören bevorzugt in ein on-premise betriebenes Modell. Wir unterstützen bei Richtlinien, Schulungen und technischer Absicherung des Zugriffs.

Für die meisten Fachaufgaben reichen Modelle zwischen 7 und 70 Milliarden Parametern. Llama 3.1 (8B/70B) eignet sich für Chat, Zusammenfassungen und Retrieval-Augmented Generation. Mistral und Mixtral liefern starke Ergebnisse bei deutschen Texten und Code. Für Spezialdomänen empfehlen sich feinjustierte Modelle oder RAG mit eigenem Wissen. Quantisierung (4-Bit) senkt den Hardwarebedarf deutlich, ohne Qualität massiv zu verlieren.

Für 7B-Modelle reicht eine NVIDIA RTX 4090 oder L4 mit 24 GB VRAM. 70B-Modelle benötigen mindestens eine H100 mit 80 GB oder eine Multi-GPU-Konfiguration. RAM sollte dem Modell entsprechen, schneller NVMe-Storage beschleunigt Ladezeiten. Für Produktion empfehlen wir redundante Server mit USV und ECC-RAM. Wer nicht selbst investieren will, mietet GPUs monatlich in unserem Rechenzentrum inklusive Strom, Kühlung und 24/7-Betreuung.