KI-Integration · Retrieval Augmented Generation AI integration · Retrieval Augmented Generation

RAG-Wissensdatenbank — DSGVO-konform für Ihren Mittelstand. RAG knowledge base — GDPR-compliant for your Mittelstand.

Ihre Verträge, Handbücher, Angebote und Tickets sind das eigentliche Firmen-Wissen. RAG (Retrieval Augmented Generation) macht daraus eine KI-Suche, die mit Quellenangabe antwortet — und das Sprachmodell mit Ihren Inhalten nicht trainiert. Wir bauen die Lösung, die zu Ihrer Datenrealität und Ihrem Datenschutz-Niveau passt: M365 Copilot, EU-Cloud-RAG oder voll On-Prem. Your contracts, manuals, quotes and tickets are your real company knowledge. RAG (Retrieval Augmented Generation) turns them into AI search with citations — and the language model is not trained on your content. We build the solution that fits your data reality and privacy level: M365 Copilot, EU cloud RAG, or fully on-prem.

Eine Suche, die einem LLM die richtigen Stellen vorlegt. A search engine that hands the LLM the right passages.

Ein Sprachmodell allein erfindet plausible Antworten — auch zu Themen, die es nicht kennt. RAG dreht das um: Die Frage wird zuerst gegen einen Index Ihrer eigenen Dokumente gestellt, die besten Treffer landen als Kontext im Prompt. Das LLM antwortet dann auf Basis Ihrer Inhalte — und gibt die Quelle an.

A language model alone invents plausible answers — even for topics it doesn't know. RAG flips that: the question is first run against an index of your own documents, the best matches go into the prompt as context. The LLM then answers based on your content — with sources.

Der Vorteil: keine Halluzinationen, Sie können Antworten überprüfen, Ihre Daten füttern kein Modell-Training, Aktualisierungen sind eine Frage des Index — nicht eines Modell-Updates.

Upside: no hallucinations, you can verify answers, your data doesn't feed model training, updates are an index question — not a model retraining.

Drei Anwendungsfelder mit messbarem Ertrag. Three application areas with measurable return.

Vertrags- & Klausel-Suche

Contract & clause search

„Welche Lieferantenverträge enthalten eine Haftungsobergrenze unter 50.000 €?" Antwort mit Vertragsname, Klauselnummer, Originalzitat.

"Which supplier contracts cap liability below €50,000?" Answer with contract name, clause number, original quote.

Interne Doku- & Handbuchsuche

Internal docs & manuals

Servicetechniker fragt: „Wie kalibriere ich Modell X-2024?" Antwort aus dem aktuellen Handbuch, mit Seitenzahl. Statt 20 Minuten Suche.

Service tech asks: "How do I calibrate model X-2024?" Answer from the current manual, with page number. Instead of 20 minutes of searching.

Sales-Enablement

Sales enablement

„Was haben wir Kunde Y 2024 angeboten? Welche Argumente haben gezogen?" Antwort aus CRM-Notizen, Angeboten, Mailverkehr — mit Quellen.

"What did we offer customer Y in 2024? Which arguments worked?" Answer from CRM notes, quotes, emails — with sources.

Helpdesk-Triage

Helpdesk triage

Hereinkommendes Ticket wird gegen alte Tickets, Knowledge Base und FAQ gematcht. Vorschlag für Erstantwort plus Wahrscheinlichkeit der Lösung.

Incoming ticket matched against past tickets, KB, FAQ. Draft first reply plus likelihood of resolution.

Drei Wege. Wir wählen pro Use-Case. Three paths. We choose per use case.

A

Microsoft 365 Copilot

Microsoft 365 Copilot

Wenn Ihre Inhalte ohnehin in M365 leben und SharePoint sauber ist: schnellster Weg, lizenz-getrieben. Siehe Copilot einführenCopilot rollout.

If your content lives in M365 and SharePoint is clean: fastest path, license-driven.

B

Cloud-RAG (EU)

Cloud RAG (EU)

Azure OpenAI Service in EU-Region, AWS Bedrock EU, OVHcloud. Embedding + Vektor-DB + LLM in EU-Cloud-Tenant. Flexibel, mit AVV und Standardvertragsklauseln.

Azure OpenAI EU region, AWS Bedrock EU, OVHcloud. Embedding + vector DB + LLM in EU cloud tenant. Flexible, with DPA and SCCs.

C

On-Prem RAG-Stack

On-prem RAG stack

Ollama oder vLLM für LLM-Inferenz, Qdrant/Weaviate/pgvector als Vektor-DB, Open WebUI / Anything LLM als Frontend. Volle Kontrolle, höhere Initialinvestition. Siehe On-Prem LLMOn-prem LLM.

Ollama or vLLM for inference, Qdrant/Weaviate/pgvector as vector DB, Open WebUI / Anything LLM as frontend. Full control, higher upfront cost.

Drei Hebel — und ein dokumentierter Bericht. Three levers — and a written assessment.

Hosting-Wahl: EU-Cloud mit Standardvertragsklauseln oder On-Prem komplett ohne Drittland-Transfer. Wir empfehlen pro Use-Case nicht pauschal.

Hosting choice: EU cloud with SCCs or on-prem without third-country transfer. We recommend per use case, not blanket.

Berechtigungsfilter: Mitarbeitende sehen nur Treffer aus Dokumenten, für die sie originär berechtigt sind. Identität wird im Retrieval-Schritt weitergegeben, nicht erst in der LLM-Antwort gefiltert.

Permission filter: Users only see results from documents they're originally entitled to. Identity is enforced at retrieval, not after the LLM answers.

Klassifizierung & Lebenszyklus: Personenbezogene Daten und Geschäftsgeheimnisse mit definierten Aufbewahrungs- und Löschregeln. Versionierung, damit ein gelöschter Vertrag auch aus dem Index verschwindet.

Classification & lifecycle: Personal data and trade secrets with defined retention and deletion rules. Versioning so a deleted contract disappears from the index too.

Sie bekommen: AVV-Entwurf mit allen Subprozessoren, technische Dokumentation für die Aufsichtsbehörde, DSFA-Entwurf, Lösch- und Auskunftskonzept.

You receive: DPA draft listing all sub-processors, technical documentation for the DPA, DPIA draft, deletion and access concept.

Häufige Fragen zu RAG. Frequent questions about RAG.

Was ist eine RAG-Wissensdatenbank?What is a RAG knowledge base?

Retrieval Augmented Generation: Eine Suchstufe über Ihre Dokumente plus ein Sprachmodell, das auf Basis der gefundenen Stellen antwortet — mit Quellenangabe und ohne Halluzinationen.

Retrieval Augmented Generation: a search layer over your documents plus a language model that answers based on the passages found — with sources and without hallucinations.

Was unterscheidet RAG von Microsoft 365 Copilot?How does RAG differ from M365 Copilot?

Copilot ist eine fertige Lösung an M365 gebunden. Eigene RAG ist passgenau auf Ihre Quellen, ohne Microsoft-Lock-in — auch für Fileshares, Datenbanken, Wikis, Ticketsysteme.

Copilot is a ready-made solution tied to M365. Custom RAG fits your sources exactly, with no Microsoft lock-in — also for fileshares, databases, wikis, ticket systems.

Wo macht RAG besonders Sinn?Where does RAG pay off most?

Vertrags-/Klausel-Suche, Handbuchsuche für Service-Personal, Sales-Enablement, Helpdesk-Triage. Überall, wo Wissens-Suche heute Stunden kostet.

Contract/clause search, manual search for service staff, sales enablement, helpdesk triage. Anywhere knowledge search currently eats hours.

Welche Architektur-Optionen gibt es?What architecture options exist?

M365 Copilot, EU-Cloud-RAG (Azure OpenAI EU, AWS Bedrock EU, OVHcloud), oder On-Prem Open-Source-Stack (Ollama + Qdrant + Open WebUI). Auswahl pro Use-Case.

M365 Copilot, EU cloud RAG (Azure OpenAI EU, AWS Bedrock EU, OVHcloud), or on-prem open-source stack (Ollama + Qdrant + Open WebUI). Choice per use case.

Wie ist RAG DSGVO-konform?How is RAG GDPR-compliant?

Hosting-Wahl (EU-Cloud oder On-Prem), Berechtigungsfilter im Retrieval, Klassifizierung & Lifecycle. AVV, DSFA-Entwurf, technische Doku liefern wir.

Hosting choice (EU cloud or on-prem), permission filtering at retrieval, classification & lifecycle. DPA, DPIA draft, technical docs included.

Was kostet eine RAG-Lösung?What does a RAG solution cost?

Erster Use-Case (z. B. 500–2.000 Dokumente) als Proof of Value: 4–8 Wochen, 8.000–18.000 € einmalig + laufende Kosten Cloud/Hardware. Folge-Use-Cases günstiger.

First use case (e.g., 500–2,000 docs) as a proof of value: 4–8 weeks, €8,000–18,000 one-time + cloud/hardware running costs. Follow-up use cases cheaper.

Erst der Use-Case. Dann die Architektur.Use case first. Architecture second.

Das Erstaudit ist kostenfrei. Wir identifizieren den Use-Case mit dem besten Ertrag und entscheiden gemeinsam, welche Architektur dazu passt. The initial audit is free. We identify the highest-return use case and choose the matching architecture together.

RAG-Audit anfragenRequest RAG audit
+49 7157 5298749 Mo–Fr 08:00–18:00 Uhr Mon–Fri 08:00–18:00