MCP-Tool-Aufrufe bündeln: Weniger Anfragen, bessere Performance
MCP-Performance durch effektives Batching verbessern. Dieser Guide zeigt: einmal listen, dann Teilmengen bearbeiten, Tool-Schleifen reduzieren und Antwortzeiten mit effizienten Prompt-Vorlagen verbessern.
Inhalt dieses Guides
Dieser Guide vermittelt Batching-Strategien für bessere Performance:
Themen
- Einmal listen, oft bearbeiten: Daten einmal laden, dann mit Teilmenge arbeiten
- Schleifen reduzieren: Keine Iteration über Einträge mit Tool-Aufrufen
- Stapel-Operationen: Zugehörige Operationen zusammenfassen
- Prompt-Vorlagen: Effiziente Muster, die Aufrufe minimieren
- Performance-Vorteile: Schnellere Antworten, geringere Latenz
Strategie 1: Einmal listen, Teilmenge bearbeiten
Daten einmal laden, dann mit gefilterter Teilmenge arbeiten:
Effizientes Muster
Was die KI macht:
- Ruft
list_taskseinmal auf (mit due_date-Filter) - Wählt die Top 3 aus den Ergebnissen
- Ruft
update_taskfür jede der 3 Aufgaben auf - Gesamt: 1 List-Aufruf + 3 Update-Aufrufe = 4 Aufrufe
✓ Effizient: Ein List-Aufruf, dann gezielte Updates
⚠️ Ineffizientes Muster (vermeiden)
Was passiert:
- KI ruft
list_tasksauf - Für jede Aufgabe
get_task(unnötig) - Für jede Aufgabe
update_task - Gesamt: 1 list + N get + N update = viele Aufrufe
✗ Ineffizient: Zu viele Aufrufe, langsame Performance
Strategie 2: Filter auf Tool-Ebene nutzen
Auf Tool-Ebene filtern, nicht im Prompt:
Effizient: Filter im Tool-Aufruf
Was die KI macht:
- Ruft
list_tasksmit Filtern auf: status='blocked', due_date='this_week' - Erhält gefilterte Ergebnisse direkt
- Aktualisiert nur die Top 2
- Gesamt: 1 List-Aufruf + 2 Update-Aufrufe = 3 Aufrufe
✓ Effizient: Server filtert, weniger Ergebnisse
⚠️ Ineffizient: Filter im Prompt
Was passiert:
- KI ruft
list_tasksauf (erhält ALLE Aufgaben) - KI filtert im Speicher (unnötige Arbeit)
- Dann Updates der gefilterten Teilmenge
- Gesamt: 1 großer List-Aufruf + N Update-Aufrufe
✗ Ineffizient: Lädt mehr Daten als nötig
Strategie 3: Tool-Schleifen vermeiden
KI nicht iterieren lassen – stattdessen Tool-Filter nutzen:
Effizient: Einzelabfrage mit Filtern
Was die KI macht:
- Ruft
list_tasksmit allen Filtern auf einmal auf - Erhält gefilterte, sortierte Ergebnisse
- Zeigt Top 5
- Gesamt: 1 Aufruf
✓ Effizient: Ein Aufruf, Server übernimmt die Filterung
⚠️ Ineffizient: Schleifen-Muster (vermeiden)
Was passiert:
- KI ruft
list_projectsauf - Für jedes Projekt
list_tasks - Für jede Aufgabe Fälligkeit prüfen (im Speicher)
- Gesamt: 1 + N Projekt-Aufrufe = viele Aufrufe
✗ Ineffizient: Erzeugt Schleife, viele Tool-Aufrufe
Prompt-Vorlagen
Vorlage 1: Stapel-Update-Muster
Effizientes Stapel-Update
Muster: Einmal listen → Teilmenge wählen → Stapel-Update
Vorlage 2: Multi-Projekt-Zusammenfassung
Effiziente Multi-Projekt-Abfrage
Muster: Projekte listen → Aufgaben pro Projekt → Zusammenfassen
Hinweis: Erfordert weiterhin mehrere Aufrufe, die für den Anwendungsfall nötig sind
Vorlage 3: Einzelne umfassende Abfrage
Effizientestes Muster
Muster: Ein Aufruf mit allen Filtern → Server erledigt alles
Performance-Vorteile
Warum Batching wichtig ist
- Schnellere Antworten: Weniger Roundtrips = geringere Latenz
- Geringere Serverlast: Weniger Anfragen = bessere Skalierbarkeit
- Besseres Nutzererlebnis: Schnellere Ergebnisse
- Weniger Rate-Limiting: Weniger Aufrufe = seltener Limits
- Geringere Kosten: Weniger API-Aufrufe
Best Practices
Batching Best Practices
- Filter auf Tool-Ebene: Tool-Filter nutzen, nicht Prompt-Filterung
- Einmal listen: Daten einmal laden, dann mit Teilmenge arbeiten
- Schleifen vermeiden: KI nicht über Einträge iterieren lassen
- Operationen bündeln: Zugehörige Updates zusammenfassen
- Paginierung nutzen: Bei großen Listen Paginierung statt alles laden
- Filter kombinieren: Mehrere Filter in einer Abfrage
Fehlerbehebung
Langsame Antworten
Symptom: MCP-Operationen dauern zu lange
Mögliche Ursachen:
- Zu viele Tool-Aufrufe in einer Schleife
- Alle Daten laden statt filtern
- Operationen nicht bündeln
Abhilfe: Batching-Muster nutzen, auf Tool-Ebene filtern, einmal listen dann bearbeiten
Rate Limiting
Symptom: 429 Rate-Limit-Fehler
Mögliche Ursachen:
- Zu viele Tool-Aufrufe
- Operationen nicht bündeln
- Über Einträge mit Tool-Aufrufen iterieren
Abhilfe: Operationen bündeln, Tool-Aufrufe reduzieren, Filter nutzen
Weitere Ressourcen
Paginierungs-Guide
Große Listen effizient handhaben
Timeout-Probleme
Langsame Antworten beheben
Rate Limiting
Tool-Aufrufe reduzieren
Tool-Referenz
Verfügbare Filter und Optionen
MCP-Performance optimieren
Batching-Strategien nutzen – weniger Tool-Aufrufe, bessere Antwortzeiten
