Block B: ClaudeCliError + differenzierte HTTP-Status + Rate-Limit-Retry

- Neue Exception-Klasse ClaudeCliError(error_type, message) in claude_client.py
  mit Kategorien rate_limit / auth_error / timeout / cli_error.
- _classify_cli_error() als geteilter Klassifikator (Keywords fuer Rate-Limit
  und Auth-Fehler wie "does not have access", "login again").
- call_claude() erkennt jetzt auch is_error=true im JSON bei returncode=0
  (Hauptursache des Ausfalls vom 22.04.: CLI liefert "Your organization
  does not have access" mit is_error=true statt Exit-Code).
- Orchestrator: ClaudeCliError mit rate_limit/timeout als transient behandelt
  (3 Retries mit Backoff 0s/120s/300s). auth_error/cli_error brechen sofort
  ab ohne Retry. Behebt den bestehenden Bug, dass Rate-Limit-Fehler gar nicht
  retried wurden.
- routers/incidents.py Enhance-Endpoint: ClaudeCliError wird auf
  503 (auth_error) / 429 (rate_limit) gemappt, TimeoutError auf 504.
- routers/chat.py _call_claude_chat(): wirft jetzt ClaudeCliError statt
  generischem RuntimeError. Chat-Endpoint mappt auth_error auf 503.
- Frontend: neue ApiError-Klasse in api.js mit status+detail.
  generateDescription() in app.js zeigt differenzierte Toasts nach
  HTTP-Status (503/429/504/403).
- dashboard.html: Cache-Bust api.js + app.js auf v=20260423a
Dieser Commit ist enthalten in:
claude-dev
2026-04-23 17:54:13 +00:00
Ursprung e8ac0d0c50
Commit 5d5ec7c924
7 geänderte Dateien mit 151 neuen und 51 gelöschten Zeilen

Datei anzeigen

@@ -15,7 +15,7 @@ from config import CLAUDE_PATH, CLAUDE_MODEL_FAST
from database import db_dependency
from middleware.license_check import require_writable_license
from services.license_service import charge_usage_to_tenant
from agents.claude_client import ClaudeUsage
from agents.claude_client import ClaudeUsage, ClaudeCliError, _classify_cli_error
import aiosqlite
logger = logging.getLogger("osint.chat")
@@ -59,10 +59,11 @@ async def _call_claude_chat(prompt: str) -> tuple[str, int, ClaudeUsage]:
if process.returncode != 0:
err_msg = stderr.decode("utf-8", errors="replace").strip()
logger.error(f"Chat Claude CLI Fehler (rc={process.returncode}): {err_msg[:500]}")
if "rate_limit" in err_msg.lower() or "overloaded" in err_msg.lower():
raise RuntimeError("rate_limit")
raise RuntimeError(f"Claude CLI Fehler: {err_msg[:200]}")
stdout_msg = stdout.decode("utf-8", errors="replace").strip()
combined = f"{err_msg} {stdout_msg}"
error_type = _classify_cli_error(combined)
logger.error(f"Chat Claude CLI Fehler [{error_type}] (rc={process.returncode}): {(stdout_msg or err_msg)[:500]}")
raise ClaudeCliError(error_type, stdout_msg or err_msg)
raw = stdout.decode("utf-8", errors="replace").strip()
duration_ms = 0
@@ -71,6 +72,12 @@ async def _call_claude_chat(prompt: str) -> tuple[str, int, ClaudeUsage]:
try:
data = _json.loads(raw)
if data.get("is_error"):
error_text = str(data.get("result", ""))
error_type = _classify_cli_error(error_text)
logger.error(f"Chat Claude CLI Fehler [{error_type}] (is_error): {error_text[:500]}")
raise ClaudeCliError(error_type, error_text)
result_text = data.get("result", raw)
duration_ms = data.get("duration_ms", 0)
u = data.get("usage", {})
@@ -437,11 +444,15 @@ async def chat(
result, duration_ms, usage = await _call_claude_chat(prompt)
except TimeoutError:
raise HTTPException(status_code=504, detail="Der Assistent antwortet gerade nicht. Bitte versuche es erneut.")
except RuntimeError as e:
error_str = str(e)
if "rate_limit" in error_str:
except ClaudeCliError as e:
if e.error_type == "rate_limit":
raise HTTPException(status_code=429, detail="Der Assistent ist gerade ausgelastet. Bitte versuche es in einer Minute erneut.")
logger.error(f"Chat Claude-Fehler: {e}")
if e.error_type == "auth_error":
raise HTTPException(status_code=503, detail="KI-Zugang aktuell nicht verfuegbar. Bitte Administrator kontaktieren.")
logger.error(f"Chat Claude-Fehler [{e.error_type}]: {e}")
raise HTTPException(status_code=502, detail="Der Assistent ist voruebergehend nicht erreichbar.")
except RuntimeError as e:
logger.error(f"Chat Claude-Fehler (unspezifisch): {e}")
raise HTTPException(status_code=502, detail="Der Assistent ist voruebergehend nicht erreichbar.")
# Credits buchen