Block B: ClaudeCliError + differenzierte HTTP-Status + Rate-Limit-Retry
- Neue Exception-Klasse ClaudeCliError(error_type, message) in claude_client.py mit Kategorien rate_limit / auth_error / timeout / cli_error. - _classify_cli_error() als geteilter Klassifikator (Keywords fuer Rate-Limit und Auth-Fehler wie "does not have access", "login again"). - call_claude() erkennt jetzt auch is_error=true im JSON bei returncode=0 (Hauptursache des Ausfalls vom 22.04.: CLI liefert "Your organization does not have access" mit is_error=true statt Exit-Code). - Orchestrator: ClaudeCliError mit rate_limit/timeout als transient behandelt (3 Retries mit Backoff 0s/120s/300s). auth_error/cli_error brechen sofort ab ohne Retry. Behebt den bestehenden Bug, dass Rate-Limit-Fehler gar nicht retried wurden. - routers/incidents.py Enhance-Endpoint: ClaudeCliError wird auf 503 (auth_error) / 429 (rate_limit) gemappt, TimeoutError auf 504. - routers/chat.py _call_claude_chat(): wirft jetzt ClaudeCliError statt generischem RuntimeError. Chat-Endpoint mappt auth_error auf 503. - Frontend: neue ApiError-Klasse in api.js mit status+detail. generateDescription() in app.js zeigt differenzierte Toasts nach HTTP-Status (503/429/504/403). - dashboard.html: Cache-Bust api.js + app.js auf v=20260423a
Dieser Commit ist enthalten in:
@@ -15,7 +15,7 @@ from config import CLAUDE_PATH, CLAUDE_MODEL_FAST
|
||||
from database import db_dependency
|
||||
from middleware.license_check import require_writable_license
|
||||
from services.license_service import charge_usage_to_tenant
|
||||
from agents.claude_client import ClaudeUsage
|
||||
from agents.claude_client import ClaudeUsage, ClaudeCliError, _classify_cli_error
|
||||
import aiosqlite
|
||||
|
||||
logger = logging.getLogger("osint.chat")
|
||||
@@ -59,10 +59,11 @@ async def _call_claude_chat(prompt: str) -> tuple[str, int, ClaudeUsage]:
|
||||
|
||||
if process.returncode != 0:
|
||||
err_msg = stderr.decode("utf-8", errors="replace").strip()
|
||||
logger.error(f"Chat Claude CLI Fehler (rc={process.returncode}): {err_msg[:500]}")
|
||||
if "rate_limit" in err_msg.lower() or "overloaded" in err_msg.lower():
|
||||
raise RuntimeError("rate_limit")
|
||||
raise RuntimeError(f"Claude CLI Fehler: {err_msg[:200]}")
|
||||
stdout_msg = stdout.decode("utf-8", errors="replace").strip()
|
||||
combined = f"{err_msg} {stdout_msg}"
|
||||
error_type = _classify_cli_error(combined)
|
||||
logger.error(f"Chat Claude CLI Fehler [{error_type}] (rc={process.returncode}): {(stdout_msg or err_msg)[:500]}")
|
||||
raise ClaudeCliError(error_type, stdout_msg or err_msg)
|
||||
|
||||
raw = stdout.decode("utf-8", errors="replace").strip()
|
||||
duration_ms = 0
|
||||
@@ -71,6 +72,12 @@ async def _call_claude_chat(prompt: str) -> tuple[str, int, ClaudeUsage]:
|
||||
|
||||
try:
|
||||
data = _json.loads(raw)
|
||||
if data.get("is_error"):
|
||||
error_text = str(data.get("result", ""))
|
||||
error_type = _classify_cli_error(error_text)
|
||||
logger.error(f"Chat Claude CLI Fehler [{error_type}] (is_error): {error_text[:500]}")
|
||||
raise ClaudeCliError(error_type, error_text)
|
||||
|
||||
result_text = data.get("result", raw)
|
||||
duration_ms = data.get("duration_ms", 0)
|
||||
u = data.get("usage", {})
|
||||
@@ -437,11 +444,15 @@ async def chat(
|
||||
result, duration_ms, usage = await _call_claude_chat(prompt)
|
||||
except TimeoutError:
|
||||
raise HTTPException(status_code=504, detail="Der Assistent antwortet gerade nicht. Bitte versuche es erneut.")
|
||||
except RuntimeError as e:
|
||||
error_str = str(e)
|
||||
if "rate_limit" in error_str:
|
||||
except ClaudeCliError as e:
|
||||
if e.error_type == "rate_limit":
|
||||
raise HTTPException(status_code=429, detail="Der Assistent ist gerade ausgelastet. Bitte versuche es in einer Minute erneut.")
|
||||
logger.error(f"Chat Claude-Fehler: {e}")
|
||||
if e.error_type == "auth_error":
|
||||
raise HTTPException(status_code=503, detail="KI-Zugang aktuell nicht verfuegbar. Bitte Administrator kontaktieren.")
|
||||
logger.error(f"Chat Claude-Fehler [{e.error_type}]: {e}")
|
||||
raise HTTPException(status_code=502, detail="Der Assistent ist voruebergehend nicht erreichbar.")
|
||||
except RuntimeError as e:
|
||||
logger.error(f"Chat Claude-Fehler (unspezifisch): {e}")
|
||||
raise HTTPException(status_code=502, detail="Der Assistent ist voruebergehend nicht erreichbar.")
|
||||
|
||||
# Credits buchen
|
||||
|
||||
In neuem Issue referenzieren
Einen Benutzer sperren