SYSTEM_ONLINE

Das KI-Kompendium

Alles, was Sie über KI im Unternehmenseinsatz wissen müssen.
Lösungen. Infrastruktur. Fachwissen. Praxis.

0
Plattformen
0
Fachartikel
0
Glossar-Einträge
0
Services
KI-Themen im Überblick
Die wichtigsten Themenbereiche rund um KI im Unternehmenseinsatz.

Large Language Models

Open-Source-Modelle für den Unternehmenseinsatz

Qwen 2.5 Mistral Llama 3 DeepSeek Fine-Tuning

RAG & Wissensmanagement

Semantische Suche statt Stichwortsuche

RAG Vektordatenbank Embeddings Qdrant Chunking

GPU-Infrastruktur

Von einzelnen GPUs bis Multi-Node-Cluster

NVIDIA A100 H100 RTX 4090 vGPU Apple Silicon

Automatisierung

KI-gestützte Workflows für den Alltag

n8n Workflows KI-Agenten Ticket-Automation

DSGVO & Compliance

KI datenschutzkonform betreiben

DSGVO On-Premise Audit-Log ISO 27001

KI-Entwicklung

Code-Generierung, Vibe Coding, Legacy

Vibe Coding Code-Gen API-Wrapper MLX
KI-Begriffe erklärt
Die wichtigsten Begriffe. Verständlich, nicht akademisch.
ESC
LLM (Large Language Model)
Sprachmodell, das auf großen Textmengen trainiert wurde. Kann Texte verstehen, zusammenfassen, übersetzen und generieren. Beispiele: Qwen, Mistral, Llama.
RAG (Retrieval Augmented Generation)
Technik, bei der das LLM vor der Antwort relevante Dokumente aus einer Wissensdatenbank abruft. Damit antwortet die KI auf Basis Ihrer echten Daten.
Vektordatenbank
Datenbank, die Inhalte als mathematische Vektoren speichert. Ermöglicht semantische Suche: Findet inhaltlich ähnliche Dokumente, auch bei anderer Formulierung.
Embedding
Mathematische Darstellung eines Textes als Zahlenvektor. Texte mit ähnlicher Bedeutung haben ähnliche Vektoren. Grundlage für RAG.
On-Premise
Software und Hardware im eigenen Rechenzentrum. Keine Daten verlassen das Unternehmen. Gegenteil von Cloud.
VRAM (Video RAM)
Arbeitsspeicher der GPU. Bestimmt, wie große KI-Modelle geladen werden können. 24 GB reicht für 7B-13B Parameter, 80 GB+ für größere.
Inferenz
Der Vorgang, bei dem ein trainiertes KI-Modell eine Anfrage verarbeitet und eine Antwort generiert. Benötigt weniger Rechenleistung als Training.
Fine-Tuning
Nachtraining eines vortrainierten Modells mit eigenen Daten. Spezialisiert das Modell auf bestimmte Aufgaben oder Fachsprache.
Prompt Engineering
Die Kunst, Anfragen an KI-Modelle optimal zu formulieren. Systemanweisungen, Kontext und Beispiele steuern die Ausgabequalität.
Halluzination
Wenn ein KI-Modell plausibel klingende, aber falsche Antworten generiert. RAG reduziert dies durch echte Dokumente als Kontext.
Open WebUI
Open-Source-Benutzeroberfläche für lokale LLMs. Chat-Interface, Dokumenten-Upload, Rollen und Berechtigungen.
n8n
Open-Source-Automatisierungsplattform. Verbindet KI-Modelle visuell mit bestehenden Systemen. Keine Programmierkenntnisse nötig.
Kein Treffer. Versuchen Sie einen anderen Begriff.

Bereit, KI in Ihrem Unternehmen einzusetzen?

In einem kostenlosen Erstgespräch klären wir, welche KI-Lösung zu Ihren Anforderungen passt.

KI-Beratung anfordern

FAQ — KI-Kompendium

Antworten rund um KI-Einsatz im Mittelstand, On-Premise vs. Cloud und Datenschutz.

Ja, wenn konkrete Anwendungsfälle mit messbarem Nutzen im Fokus stehen. Typische Mittelstandsszenarien: Dokumentenanalyse, Angebotserstellung, E-Mail-Klassifikation, technischer Support, Wissensmanagement und Qualitätssicherung. Pilotprojekte amortisieren sich oft innerhalb von 6 bis 12 Monaten, wenn die Prozesse klar abgegrenzt sind. Wichtig ist, nicht mit der Technik, sondern mit dem Geschäftsproblem zu starten. Wir begleiten Auswahl, Proof of Concept und Rollout.

Die Antwort hängt von Datenschutz, Latenz und Auslastung ab. On-Premise (eigene GPU-Server oder unser Rechenzentrum) bietet volle Datenhoheit, planbare Kosten und keine Abhängigkeit von US-Anbietern. Cloud-KI (OpenAI, Azure AI) skaliert flexibel, bringt aber Datenschutzfragen und laufende Nutzungsgebühren. Für sensible Bereiche (Gesundheit, Recht, KRITIS) empfehlen wir On-Premise mit Open-Source-Modellen, für breite Bürotools oft die Cloud.

Mit Enterprise-Verträgen, Azure OpenAI in EU-Regionen und abgeschlossenem AVV grundsätzlich ja. Wichtig: Eingaben dürfen nicht ins Modelltraining fließen, Protokolle müssen geschützt sein, und Mitarbeiter brauchen klare Richtlinien, welche Daten eingegeben werden dürfen. Personenbezogene oder kritische Geschäftsdaten gehören bevorzugt in ein on-premise betriebenes Modell. Wir unterstützen bei Richtlinien, Schulungen und technischer Absicherung des Zugriffs.

Für die meisten Fachaufgaben reichen Modelle zwischen 7 und 70 Milliarden Parametern. Llama 3.1 (8B/70B) eignet sich für Chat, Zusammenfassungen und Retrieval-Augmented Generation. Mistral und Mixtral liefern starke Ergebnisse bei deutschen Texten und Code. Für Spezialdomänen empfehlen sich feinjustierte Modelle oder RAG mit eigenem Wissen. Quantisierung (4-Bit) senkt den Hardwarebedarf deutlich, ohne Qualität massiv zu verlieren.

Für 7B-Modelle reicht eine NVIDIA RTX 4090 oder L4 mit 24 GB VRAM. 70B-Modelle benötigen mindestens eine H100 mit 80 GB oder eine Multi-GPU-Konfiguration. RAM sollte dem Modell entsprechen, schneller NVMe-Storage beschleunigt Ladezeiten. Für Produktion empfehlen wir redundante Server mit USV und ECC-RAM. Wer nicht selbst investieren will, mietet GPUs monatlich in unserem Rechenzentrum inklusive Strom, Kühlung und 24/7-Betreuung.