fix(researcher): Lagentitel-Eigennamen als Pflicht-Keywords (Bug 2 Buckelwal-Diagnose)

KEYWORD_EXTRACTION_PROMPT explizit erweitert: - Eigennamen/Tiernamen/Personennamen aus dem THEMA als ZWINGEND markiert. - Hinweis dass DE und EN identisch sein duerfen (Eigennamen). - Klar gesagt: bei spezifischen Begriffen (>=7 Zeichen) reicht 1 Treffer in RSS-Headlines (passt zu rss_parser.py adaptive Schwelle aus a08df3d). Code-Post-Processing (researcher.py _extract_keywords): - Nach dem Parser werden Lagentitel-Woerter (>=4 Zeichen, nicht in Stopwords) ggf. in die Keyword-Liste injiziert, falls Haiku sie weggelassen hat. - Verhindert konkret den "Buckelwal timmy"-Bug: "timmy" fehlte in Haikus Liste, damit fielen Headlines mit nur "Buckelwal" durch das min_matches. Hintergrund: Memory-Eintrag rss_match_und_keyword_bug.md, Bug 2 von 3. Bug 1 (rss_parser min_matches adaptiv) ist seit Commit a08df3d auf Live. Bug 3 (international=True default) bleibt offen, ist primaer UX-Frage.
Mojibake fix: source_suggester.py + source_health.py via ftfy
2026-05-09 03:52:36 +00:00 · 2026-05-09 03:39:34 +00:00 · 2026-05-07 01:45:19 +02:00 · 2026-05-06 23:40:39 +00:00 · 2026-05-07 01:31:33 +02:00 · 2026-05-03 20:43:40 +00:00
--- a/RELEASES.json
+++ b/RELEASES.json
@@ -1,4 +1,13 @@
 [
  {
    "version": "2026-05-03T15:21Z",
    "date": "2026-05-03",
    "title": "Übersichtlichere Navigation in der Seitenleiste",
    "items": [
      "Schaltflächen in der Seitenleiste haben jetzt klarere Icons und kürzere Beschriftungen",
      "Der Feedback-Button zeigt nun ein Brief-Symbol für bessere Erkennbarkeit"
    ]
  },
  {
    "version": "2026-04-30T23:12Z",
    "date": "2026-04-30",
--- a/src/agents/analyzer.py
+++ b/src/agents/analyzer.py
@@ -47,7 +47,6 @@ Antworte AUSSCHLIESSLICH als JSON-Objekt mit diesen Feldern:
 - "summary": Zusammenfassung auf {output_language} mit Quellenverweisen [1], [2] etc. im Text (Markdown-Überschriften ## erlaubt wenn sinnvoll, aber KEINE "## ZUSAMMENFASSUNG"/"## ÜBERBLICK"-Sektion)
 - "sources": Array von Quellenobjekten, je: {{"nr": 1, "name": "Quellenname", "url": "https://..."}}
 - "key_facts": Array von bestätigten Kernfakten (Strings, in Ausgabesprache)
 - "translations": Array von Objekten mit "article_id", "headline_de", "content_de" (nur für fremdsprachige Artikel)
 Antworte NUR mit dem JSON-Objekt. Keine Einleitung, keine Erklärung."""
@@ -102,7 +101,6 @@ Antworte AUSSCHLIESSLICH als JSON-Objekt mit diesen Feldern:
 - "summary": Das strukturierte Briefing als Markdown-Text mit Quellenverweisen [1], [2] etc.
 - "sources": Array von Quellenobjekten, je: {{"nr": 1, "name": "Quellenname", "url": "https://..."}}
 - "key_facts": Array von gesicherten Kernfakten (Strings, in Ausgabesprache)
 - "translations": Array von Objekten mit "article_id", "headline_de", "content_de" (nur für fremdsprachige Artikel)
 Antworte NUR mit dem JSON-Objekt. Keine Einleitung, keine Erklärung."""
@@ -149,7 +147,6 @@ Antworte AUSSCHLIESSLICH als JSON-Objekt mit diesen Feldern:
 - "summary": Aktualisierte Zusammenfassung mit Quellenverweisen [1], [2] etc.
 - "sources": Array mit NUR den NEUEN Quellen aus den neuen Meldungen, je: {{"nr": <fortlaufende ganze Zahl, KEINE Buchstaben-Suffixe>, "name": "Quellenname", "url": "https://..."}}. Alte Quellen werden automatisch gemerged.
 - "key_facts": Array aller aktuellen Kernfakten (in Ausgabesprache)
 - "translations": Array von Objekten mit "article_id", "headline_de", "content_de" (nur für neue fremdsprachige Artikel)
 Antworte NUR mit dem JSON-Objekt. Keine Einleitung, keine Erklärung."""
@@ -201,7 +198,6 @@ Antworte AUSSCHLIESSLICH als JSON-Objekt mit diesen Feldern:
 - "summary": Das aktualisierte Briefing als Markdown-Text mit Quellenverweisen
 - "sources": Array mit NUR den NEUEN Quellen aus den neuen Meldungen, je: {{"nr": <fortlaufende ganze Zahl, KEINE Buchstaben-Suffixe>, "name": "Quellenname", "url": "https://..."}}. Alte Quellen werden automatisch gemerged.
 - "key_facts": Array aller gesicherten Kernfakten (in Ausgabesprache)
 - "translations": Array von Objekten mit "article_id", "headline_de", "content_de" (nur für neue fremdsprachige Artikel)
 Antworte NUR mit dem JSON-Objekt. Keine Einleitung, keine Erklärung."""
@@ -796,5 +792,5 @@ class AnalyzerAgent:
            except json.JSONDecodeError:
                pass
-        return {"summary": summary, "sources": sources, "key_facts": [], "translations": []}
+        return {"summary": summary, "sources": sources, "key_facts": []}
--- a/src/agents/orchestrator.py
+++ b/src/agents/orchestrator.py
@@ -489,6 +489,9 @@ class AgentOrchestrator:
            logger.info(f"Lage {incident_id} aus Warteschlange entfernt (removed={removed})")
            # refresh_log-Eintrag schreiben, damit Auto-Refresh nicht im naechsten Tick erneut einreiht
            await self._log_queued_cancellation(incident_id)
            # Send cancelled event
            if self._ws_manager:
                try:
@@ -624,18 +627,56 @@ class AgentOrchestrator:
                self._queue.task_done()
    async def _mark_refresh_cancelled(self, incident_id: int):
-        """Markiert den laufenden Refresh-Log-Eintrag als cancelled."""
+        """Markiert den laufenden Refresh-Log-Eintrag als cancelled und schliesst
        alle noch aktiven Pipeline-Schritte. Ohne den zweiten Schritt blieb der
        zuletzt aktive Step-Eintrag verwaist und das Frontend zeigte dauerhaft
        'Schritt X laeuft', weil /api/incidents/<id>/pipeline aus
        refresh_pipeline_steps liest."""
        from database import get_db
        from services.pipeline_tracker import cancel_active_steps
        db = await get_db()
        try:
            now_str = datetime.now(TIMEZONE).strftime('%Y-%m-%d %H:%M:%S')
            cur = await db.execute(
                "SELECT id FROM refresh_log WHERE incident_id = ? AND status = 'running'",
                (incident_id,),
            )
            row = await cur.fetchone()
            refresh_log_id = row["id"] if row else None
            await db.execute(
                """UPDATE refresh_log SET status = 'cancelled', error_message = 'Vom Nutzer abgebrochen',
                   completed_at = ? WHERE incident_id = ? AND status = 'running'""",
-                (datetime.now(TIMEZONE).strftime('%Y-%m-%d %H:%M:%S'), incident_id),
+                (now_str, incident_id),
            )
            await db.commit()
            if refresh_log_id is not None:
                await cancel_active_steps(db, refresh_log_id=refresh_log_id)
        except Exception as e:
            logger.warning(f"Konnte Refresh-Log nicht als abgebrochen markieren: {e}")
        finally:
            await db.close()
    async def _log_queued_cancellation(self, incident_id: int):
        """Schreibt einen cancelled-Eintrag fuer einen Queue-Abbruch (Lage war noch nicht laufend).
        Verhindert, dass der Auto-Refresh-Scheduler im naechsten Tick sofort wieder einreiht."""
        from database import get_db
        db = await get_db()
        try:
            cur = await db.execute("SELECT tenant_id FROM incidents WHERE id = ?", (incident_id,))
            row = await cur.fetchone()
            tid = row["tenant_id"] if row else None
            now_str = datetime.now(TIMEZONE).strftime("%Y-%m-%d %H:%M:%S")
            await db.execute(
                """INSERT INTO refresh_log (incident_id, started_at, completed_at, status,
                   trigger_type, error_message, tenant_id)
                   VALUES (?, ?, ?, 'cancelled', 'manual', 'Aus Warteschlange entfernt', ?)""",
                (incident_id, now_str, now_str, tid),
            )
            await db.commit()
        except Exception as e:
-            logger.warning(f"Konnte Refresh-Log nicht als abgebrochen markieren: {e}")
+            logger.warning(f"Konnte Queue-Cancel nicht in refresh_log loggen: {e}")
        finally:
            await db.close()
@@ -1410,20 +1451,64 @@ class AgentOrchestrator:
                             snap_articles, snap_fcs, log_id, now, tenant_id),
                        )
-                    # Übersetzungen aktualisieren (nur für gültige DB-IDs)
+                    # Translations werden vom dedizierten Translator-Agent unten
-                    for translation in analysis.get("translations", []):
+                    # erzeugt (frueher inline im Analyzer-Output, das war token-
-                        article_id = translation.get("article_id")
+                    # instabil und schaetzte regelmaessig content_de aus).
                        if isinstance(article_id, int):
                            await db.execute(
                                "UPDATE articles SET headline_de = ?, content_de = ? WHERE id = ? AND incident_id = ?",
                                (translation.get("headline_de"), translation.get("content_de"), article_id, incident_id),
                            )
                    await db.commit()
                # Cancel-Check nach paralleler Verarbeitung
                self._check_cancelled(incident_id)
                # --- Translator (Haiku) fuer fremdsprachige Artikel ohne DE-Texte ---
                # Idempotent: nur Artikel ohne headline_de/content_de werden geholt.
                # Lauft nach der Analyse (Lagebild ist schon committed) und vor QC
                # (damit normalize_umlaut_articles auch die frischen DE-Texte fasst).
                try:
                    tr_cursor = await db.execute(
                        """SELECT id, headline, content_original, language
                           FROM articles
                           WHERE incident_id = ?
                             AND language IS NOT NULL AND LOWER(language) != 'de'
                             AND (headline_de IS NULL OR headline_de = ''
                                  OR content_de IS NULL OR content_de = '')""",
                        (incident_id,),
                    )
                    pending_translations = [dict(r) for r in await tr_cursor.fetchall()]
                    if pending_translations:
                        logger.info(
                            "Translator fuer Incident %d: %d Artikel ohne DE-Uebersetzung",
                            incident_id, len(pending_translations),
                        )
                        from agents.translator import translate_articles
                        from services.post_refresh_qc import normalize_german_umlauts as _norm_de2
                        translations = await translate_articles(
                            pending_translations,
                            output_lang="de",
                            usage_accumulator=usage_acc,
                        )
                        for t in translations:
                            hd = t.get("headline_de")
                            cd = t.get("content_de")
                            if hd:
                                hd, _ = _norm_de2(hd)
                            if cd:
                                cd, _ = _norm_de2(cd)
                            if hd or cd:
                                await db.execute(
                                    "UPDATE articles SET headline_de = COALESCE(?, headline_de), "
                                    "content_de = COALESCE(?, content_de) WHERE id = ? AND incident_id = ?",
                                    (hd, cd, t["id"], incident_id),
                                )
                        await db.commit()
                        logger.info(
                            "Translator fuer Incident %d: %d/%d Artikel uebersetzt",
                            incident_id, len(translations), len(pending_translations),
                        )
                except Exception as e:
                    logger.error("Translator-Fehler fuer Incident %d: %s", incident_id, e, exc_info=True)
                    # Refresh trotz Translator-Fehler weiterlaufen lassen
                # --- Neueste Entwicklungen (nur Live-Monitoring / adhoc) ---
                # Basis ist jetzt das frisch generierte Lagebild (autoritativ, thematisch sauber).
                # Zeitstempel und Quellen kommen aus den jüngsten belegenden Artikeln.
--- a/src/agents/researcher.py
+++ b/src/agents/researcher.py
@@ -199,14 +199,22 @@ AKTUELLE HEADLINES (die letzten Meldungen zu diesem Thema):
 AUFGABE:
 Generiere 5 Begriffspaare (DE + EN), mit denen neue RSS-Artikel zu diesem Thema gefunden werden.
-Ein Artikel gilt als relevant, wenn mindestens 2 dieser Begriffe im Titel oder der Beschreibung vorkommen.
+Ein Artikel gilt als relevant, wenn mindestens 2 dieser Begriffe im Titel oder der Beschreibung vorkommen
 - bei spezifischen Begriffen (Eigennamen, lange Begriffe ab 7 Zeichen) reicht 1 Treffer.
 REGELN:
- Die ersten 2 Begriffspaare MUESSEN die zentralen Akteure/Laender/Themen sein (z.B. iran, israel, usa) — also die Begriffe, die in fast JEDEM Artikel zum Thema vorkommen
+- ZWINGEND: Eigennamen oder spezifische Begriffe aus dem THEMA (z.B. Personennamen, Tiernamen,
- Die letzten 3 Begriffspaare sind aktuelle Entwicklungen aus den Headlines (Orte, Akteure, Schluesselwoerter der aktuellen Phase)
+  Ortsnamen wie "timmy", "buckelwal", "merz", "dobrindt") MUESSEN als eigene Begriffspaare
- Begriffe muessen so gewaehlt sein, dass sie in kurzen RSS-Titeln matchen (einzelne Woerter, keine Phrasen)
+  enthalten sein. Solche Begriffe sind oft das einzige, was in kurzen Headlines vorkommt.
- Alle Begriffe in Kleinbuchstaben
+- Die ersten 2 Begriffspaare sind die zentralen Akteure/Laender/Themen (z.B. iran, israel,
- Exakt 5 Begriffspaare
+  buckelwal, timmy) — also die Begriffe, die in fast JEDEM Artikel zum Thema vorkommen.
 - Die uebrigen 3 Begriffspaare sind aktuelle Entwicklungen aus den Headlines (Orte, Akteure,
  Schluesselwoerter der aktuellen Phase).
 - Wenn DE und EN identisch sind (Eigennamen), trotzdem das Paar einreichen.
 - Begriffe muessen so gewaehlt sein, dass sie in kurzen RSS-Titeln matchen (einzelne Woerter,
  keine Phrasen, keine Konjunktionen).
 - Alle Begriffe in Kleinbuchstaben.
 - Exakt 5 Begriffspaare.
 Antwort NUR als JSON-Array:
 [{{"de": "iran", "en": "iran"}}, {{"de": "israel", "en": "israel"}}, {{"de": "teheran", "en": "tehran"}}, {{"de": "luftangriff", "en": "airstrike"}}, {{"de": "trump", "en": "trump"}}]"""
@@ -365,6 +373,17 @@ class ResearcherAgent:
                if en and en != de:
                    keywords.append(en)
            # Bug-2-Fallback: Lagentitel-Wörter (>=4 Zeichen) zwingend in Keyword-Liste,
            # falls Haiku sie weggelassen hat. Verhindert "Buckelwal timmy"-Bug, bei dem
            # der Eigenname "timmy" fehlte und damit Headlines mit nur "Buckelwal" durchfielen.
            STOPWORDS = {"der", "die", "das", "und", "oder", "von", "vom", "zum", "zur",
                         "the", "and", "for", "with", "ueber", "über", "von", "for"}
            for word in (title or "").lower().split():
                w = word.strip(".,;:!?\"\'()[]{}")
                if len(w) >= 4 and w not in STOPWORDS and w not in keywords:
                    keywords.append(w)
                    logger.info(f"Lagentitel-Keyword '{w}' nachträglich injiziert")
            if keywords:
                logger.info(f"Dynamische Keywords ({len(keywords)}): {keywords}")
            return keywords if keywords else None, usage
--- a/src/agents/translator.py
+++ b/src/agents/translator.py
@@ -0,0 +1,254 @@
 """Translator-Agent: uebersetzt fremdsprachige Artikel ins Deutsche.
 Eigener Agent (separat vom Analyzer), damit Token-Limits nicht zwischen
 Lagebild und Uebersetzung konkurrieren. Nutzt CLAUDE_MODEL_FAST (Haiku) in
 Batches.
 Aufgerufen vom Orchestrator nach analyzer.analyze() und vor post_refresh_qc.
 Backfill-Skript nutzt dieselbe Funktion fuer rueckwirkendes Auffuellen.
 """
 import json
 import logging
 import re
 from agents.claude_client import call_claude, ClaudeUsage, UsageAccumulator
 from config import CLAUDE_MODEL_FAST, TRANSLATOR_ENABLED
 logger = logging.getLogger("osint.translator")
 # Pro Batch nicht mehr als so viele Artikel an Claude geben.
 # Bei Haiku ist das Output-Limit ca. 8k Tokens. Pro Artikel kommen leicht
 # 400-600 Tokens raus (headline_de + content_de bis 1000 Zeichen). Bei 15
 # wurde regelmaessig getrunkt (mid-JSON broken). 5 ist sicher mit Reserve.
 DEFAULT_BATCH_SIZE = 5
 # content_original wird ohnehin auf 1000 Zeichen gecappt (rss_parser).
 # Fuer den Translator nochmal verkuerzen, falls vorhanden mehr.
 CONTENT_INPUT_MAX = 1200
 # content_de soll wie content_original auf 1000 Zeichen begrenzt sein.
 CONTENT_OUTPUT_MAX = 1000
 def _extract_complete_objects(text: str) -> list[dict]:
    """Extrahiert vollstaendige JSON-Objekte aus moeglicherweise abgeschnittenem Text.
    Klammer-Counter-Ansatz: jedes balancierte {...} wird probiert.
    """
    results = []
    depth = 0
    start = -1
    in_string = False
    escape = False
    for i, ch in enumerate(text):
        if escape:
            escape = False
            continue
        if ch == "\\":
            escape = True
            continue
        if ch == '"' and not escape:
            in_string = not in_string
            continue
        if in_string:
            continue
        if ch == "{":
            if depth == 0:
                start = i
            depth += 1
        elif ch == "}":
            depth -= 1
            if depth == 0 and start >= 0:
                obj_text = text[start:i + 1]
                try:
                    obj = json.loads(obj_text)
                    if isinstance(obj, dict):
                        results.append(obj)
                except json.JSONDecodeError:
                    pass
                start = -1
    return results
 def _build_prompt(articles: list[dict], output_lang: str = "de") -> str:
    """Bauen den Translation-Prompt fuer eine Batch."""
    lang_label = {"de": "Deutsch", "en": "Englisch"}.get(output_lang, output_lang)
    items = []
    for a in articles:
        items.append({
            "id": a["id"],
            "headline": a.get("headline", "") or "",
            "content": (a.get("content_original") or "")[:CONTENT_INPUT_MAX],
            "source_lang": a.get("language", "en"),
        })
    return f"""Du bist ein praeziser Uebersetzer fuer Nachrichten-Artikel.
 Uebersetze die folgenden Artikel nach {lang_label}.
 WICHTIG:
 - Verwende IMMER echte UTF-8-Umlaute (ä, ö, ü, ß) - NIEMALS Umschreibungen wie ae, oe, ue, ss.
  Beispiele: "Gespraeche" -> "Gespräche", "Fuehrer" -> "Führer", "grosse" -> "große".
 - Behalte Eigennamen (Personen, Orte, Organisationen) im Original.
 - Headline kurz und buendig wie im Original.
 - Content auf MAX {CONTENT_OUTPUT_MAX} Zeichen kuerzen, kein HTML, kein Markdown.
 - Wenn der Artikel schon auf {lang_label} ist (z.B. source_lang="{output_lang}"),
  kopiere headline und content unveraendert.
 Antworte AUSSCHLIESSLICH mit einem flachen JSON-Array (kein Wrapper-Objekt!).
 Format genau so:
 [
  {{"id": 1, "headline_de": "Titel auf Deutsch", "content_de": "Inhalt auf Deutsch"}},
  {{"id": 2, "headline_de": "...", "content_de": "..."}}
 ]
 NICHT erlaubt: {{"translations": [...]}} oder {{"items": [...]}} oder Markdown-Codefences.
 Nur das Array, ohne Einleitung, ohne Erklaerung.
 ARTIKEL:
 {json.dumps(items, ensure_ascii=False, indent=2)}
 """
 def _parse_response(text: str) -> list[dict]:
    """Robustes JSON-Array-Parsing.
    Handhabt:
    - reines JSON
    - JSON in Markdown-Codefence ```json ... ```
    - abgeschnittene Antworten (extrahiert vollstaendige Top-Level-Objekte)
    """
    text = text.strip()
    # Markdown-Codefence entfernen
    if text.startswith("```"):
        text = re.sub(r"^```(?:json)?\s*", "", text)
        text = re.sub(r"\s*```\s*$", "", text)
        text = text.strip()
    try:
        data = json.loads(text)
    except json.JSONDecodeError:
        # Erst Array versuchen
        match = re.search(r"\[.*\]", text, re.DOTALL)
        if match:
            try:
                data = json.loads(match.group(0))
            except json.JSONDecodeError:
                # Truncate-Fallback: einzelne Top-Level-Objekte extrahieren
                data = _extract_complete_objects(text)
        else:
            data = _extract_complete_objects(text)
    # Claude wraps das Array gelegentlich in {"translations": [...]} oder {"items": [...]}
    if isinstance(data, dict):
        for key in ("translations", "items", "results", "data"):
            if isinstance(data.get(key), list):
                data = data[key]
                break
        else:
            # Einzelnes Objekt? Dann als Liste mit einem Element behandeln
            if "id" in data:
                data = [data]
            else:
                raise ValueError(f"Translator-Antwort: Dict ohne erwarteten Array-Key (keys={list(data.keys())[:5]})")
    if not isinstance(data, list):
        raise ValueError(f"Translator-Antwort ist kein Array: {type(data).__name__}")
    cleaned = []
    for item in data:
        if not isinstance(item, dict):
            continue
        aid = item.get("id")
        if not isinstance(aid, int):
            try:
                aid = int(aid)
            except (TypeError, ValueError):
                continue
        cleaned.append({
            "id": aid,
            "headline_de": (item.get("headline_de") or "").strip() or None,
            "content_de": (item.get("content_de") or "").strip() or None,
        })
    return cleaned
 async def translate_articles_batch(
    articles: list[dict],
    output_lang: str = "de",
 ) -> tuple[list[dict], ClaudeUsage]:
    """Uebersetzt eine Batch von Artikeln.
    Erwartet articles als Liste von Dicts mit den Feldern id, headline,
    content_original, language.
    Rueckgabe: (uebersetzte_artikel, usage)
    Wenn der Call fehlschlaegt, wird ([], leere_usage) zurueckgegeben - der
    Caller kann entscheiden, ob retry oder skip.
    """
    if not articles:
        return [], ClaudeUsage()
    prompt = _build_prompt(articles, output_lang)
    try:
        result_text, usage = await call_claude(prompt, tools=None, model=CLAUDE_MODEL_FAST)
    except Exception as e:
        logger.error(f"Translator Claude-Call fehlgeschlagen: {e}")
        return [], ClaudeUsage()
    try:
        translations = _parse_response(result_text)
    except Exception as e:
        logger.error(f"Translator JSON-Parsing fehlgeschlagen: {e}; raw: {result_text[:300]!r}")
        return [], usage
    # Validierung: nur Translations zurueckgeben, deren id wirklich
    # in der angefragten Batch war
    requested_ids = {a["id"] for a in articles}
    valid = [t for t in translations if t["id"] in requested_ids]
    if len(valid) != len(translations):
        logger.warning(
            "Translator: %d von %d Translations referenzieren unbekannte IDs",
            len(translations) - len(valid), len(translations),
        )
    return valid, usage
 async def translate_articles(
    articles: list[dict],
    output_lang: str = "de",
    batch_size: int = DEFAULT_BATCH_SIZE,
    usage_accumulator: UsageAccumulator | None = None,
 ) -> list[dict]:
    """Uebersetzt eine beliebige Anzahl Artikel in Batches.
    Bringt die Batches durch Logik in `translate_articles_batch` und gibt
    EINE flache Liste der Translations zurueck. Wenn ein Batch fehlschlaegt,
    wird er uebersprungen (anderer Batches laufen weiter).
    """
    if not articles:
        return []
    if not TRANSLATOR_ENABLED:
        logger.info(
            "Translator deaktiviert (TRANSLATOR_ENABLED=false), %d Artikel uebersprungen",
            len(articles),
        )
        return []
    all_translations = []
    for i in range(0, len(articles), batch_size):
        batch = articles[i : i + batch_size]
        translations, usage = await translate_articles_batch(batch, output_lang)
        if usage_accumulator is not None:
            usage_accumulator.add(usage)
        all_translations.extend(translations)
        logger.info(
            "Translator-Batch %d/%d: %d/%d uebersetzt (cost=$%.4f)",
            (i // batch_size) + 1,
            (len(articles) + batch_size - 1) // batch_size,
            len(translations), len(batch),
            usage.cost_usd,
        )
    return all_translations
--- a/src/config.py
+++ b/src/config.py
@@ -41,6 +41,10 @@ OUTPUT_LANGUAGE = "Deutsch"
 # In Kundenversion auf False setzen oder Env-Variable entfernen
 DEV_MODE = os.environ.get("DEV_MODE", "true").lower() == "true"
 # Feature-Flag: Translator-Agent (Haiku) komplett deaktivieren.
 # False = keine Uebersetzungen mehr, fremdsprachige Artikel bleiben unuebersetzt.
 TRANSLATOR_ENABLED = os.environ.get("TRANSLATOR_ENABLED", "true").lower() == "true"
 # RSS-Feeds (Fallback, primär aus DB geladen)
 RSS_FEEDS = {
    "deutsch": [
--- a/src/feeds/rss_parser.py
+++ b/src/feeds/rss_parser.py
@@ -6,6 +6,8 @@ import httpx
 from datetime import datetime, timezone
 from config import TIMEZONE, MAX_ARTICLES_PER_DOMAIN_RSS
 from source_rules import _extract_domain
 from feeds.transcript_extractors._common import html_to_text
 from services.post_refresh_qc import normalize_german_umlauts
 logger = logging.getLogger("osint.rss")
@@ -152,7 +154,15 @@ class RSSParser:
            for entry in feed.entries[:50]:
                title = entry.get("title", "")
-                summary = entry.get("summary", "")
+                # RSS-summary ist bei vielen Quellen HTML (Guardian, AP, SZ, ...).
                # Vor weiterer Verwendung strippen, sonst landet HTML in DB
                # und KI-Agenten und Sprach-Heuristik werden gestoert.
                summary_raw = entry.get("summary", "")
                summary = html_to_text(summary_raw) if summary_raw else ""
                # ASCII-Umlaut-Normalisierung (z.B. dpa-AFX schreibt "Gespraeche").
                # Dictionary-basiert, sicher gegen englische Woerter wie "Boeing".
                title, _ = normalize_german_umlauts(title)
                summary, _ = normalize_german_umlauts(summary)
                text = f"{title} {summary}".lower()
                # Adaptive Match-Schwelle:
--- a/src/main.py
+++ b/src/main.py
@@ -124,7 +124,7 @@ async def check_auto_refresh():
            # Letzten abgeschlossenen oder laufenden Refresh pruefen
            cursor = await db.execute(
-                "SELECT started_at, status FROM refresh_log WHERE incident_id = ? AND status IN ('completed', 'running') ORDER BY id DESC LIMIT 1",
+                "SELECT started_at, status FROM refresh_log WHERE incident_id = ? AND status IN ('completed', 'running', 'cancelled', 'error') ORDER BY id DESC LIMIT 1",
                (incident_id,),
            )
            last_refresh = await cursor.fetchone()
--- a/src/middleware/license_check.py
+++ b/src/middleware/license_check.py
@@ -47,7 +47,7 @@ async def require_writable_license(
    if lic.get("read_only"):
        reason = lic.get("read_only_reason") or "expired"
        if reason == "budget_exceeded":
-            detail = "Token-Budget aufgebraucht. Bitte Verwaltung kontaktieren."
+            detail = "Token-Budget aufgebraucht. Für Aufstockung oder Upgrade bitte info@aegis-sight.de kontaktieren."
        elif reason == "expired":
            detail = "Lizenz abgelaufen. Nur Lesezugriff moeglich."
        elif reason == "no_license":
--- a/src/services/pipeline_tracker.py
+++ b/src/services/pipeline_tracker.py
@@ -228,3 +228,25 @@ async def error_step(db, ws_manager, *, step_id: Optional[int], refresh_log_id:
        "status": "error",
        "pass_number": pass_number,
    }, visibility, created_by, tenant_id)
 async def cancel_active_steps(db, *, refresh_log_id: int) -> int:
    """Schliesst alle noch aktiven Pipeline-Schritte eines Refreshs als 'cancelled' ab.
    Wird vom Orchestrator nach einem User-Cancel aufgerufen. Ohne diesen Schritt
    bleibt der zuletzt aktive Step-Eintrag verwaist und der Pipeline-Endpoint
    liefert dauerhaft 'Schritt X laeuft' an die UI.
    """
    try:
        cur = await db.execute(
            """UPDATE refresh_pipeline_steps
               SET status = 'cancelled', completed_at = ?
               WHERE refresh_log_id = ? AND status = 'active'""",
            (_now_db(), refresh_log_id),
        )
        await db.commit()
        return cur.rowcount or 0
    except Exception as e:
        logger.warning(f"Pipeline cancel_active_steps DB-Fehler: {e}")
        return 0
--- a/src/services/post_refresh_qc.py
+++ b/src/services/post_refresh_qc.py
@@ -400,18 +400,20 @@ async def run_post_refresh_qc(db, incident_id: int) -> dict:
            db, incident_id, incident_title, incident_desc
        )
        umlauts_fixed = await normalize_umlaut_fields(db, incident_id)
        article_umlauts_fixed = await normalize_umlaut_articles(db, incident_id)
-        if facts_removed > 0 or locations_fixed > 0 or umlauts_fixed > 0:
+        total_umlaut_changes = umlauts_fixed + article_umlauts_fixed
        if facts_removed > 0 or locations_fixed > 0 or total_umlaut_changes > 0:
            await db.commit()
            logger.info(
-                "Post-Refresh QC fuer Incident %d: %d Duplikate entfernt, %d Locations korrigiert, %d Umlaute normalisiert",
+                "Post-Refresh QC fuer Incident %d: %d Duplikate entfernt, %d Locations korrigiert, %d Umlaute normalisiert (davon %d in Articles)",
-                incident_id, facts_removed, locations_fixed, umlauts_fixed,
+                incident_id, facts_removed, locations_fixed, total_umlaut_changes, article_umlauts_fixed,
            )
        return {
            "facts_removed": facts_removed,
            "locations_fixed": locations_fixed,
-            "umlauts_fixed": umlauts_fixed,
+            "umlauts_fixed": total_umlaut_changes,
        }
    except Exception as e:
@@ -568,3 +570,64 @@ async def normalize_umlaut_fields(db, incident_id: int) -> int:
        incident_id, count_summary, count_dev,
    )
    return total
 async def normalize_umlaut_articles(db, incident_id: int) -> int:
    """Normalisiert Umlaute in allen Artikel-Texten des Incidents.
    Felder die behandelt werden:
    - headline_de und content_de bei allen Artikeln (LLM-Uebersetzung kann
      ASCII-Umlaute liefern trotz Prompt-Anweisung)
    - headline und content_original bei language='de' (manche Quellen wie
      dpa-AFX, Telegram-Kanaele liefern selbst schon ASCII-Umlaute)
    Idempotent: Wenn der Text schon korrekt ist, macht das Dict-Lookup
    keine Aenderung und wir schreiben nicht zurueck.
    Rueckgabe: Gesamtzahl der Wort-Ersetzungen ueber alle Artikel.
    """
    cursor = await db.execute(
        """SELECT id, language, headline, headline_de, content_original, content_de
           FROM articles WHERE incident_id = ?""",
        (incident_id,),
    )
    rows = await cursor.fetchall()
    if not rows:
        return 0
    total = 0
    for row in rows:
        is_de = (row["language"] or "").lower() == "de"
        updates = {}
        # Felder die immer behandelt werden (LLM-Uebersetzungen)
        if row["headline_de"]:
            new, n = normalize_german_umlauts(row["headline_de"])
            if n > 0:
                updates["headline_de"] = new
                total += n
        if row["content_de"]:
            new, n = normalize_german_umlauts(row["content_de"])
            if n > 0:
                updates["content_de"] = new
                total += n
        # Originalfelder nur bei deutschen Quellen
        if is_de:
            if row["headline"]:
                new, n = normalize_german_umlauts(row["headline"])
                if n > 0:
                    updates["headline"] = new
                    total += n
            if row["content_original"]:
                new, n = normalize_german_umlauts(row["content_original"])
                if n > 0:
                    updates["content_original"] = new
                    total += n
        if updates:
            set_clause = ", ".join(f"{k} = ?" for k in updates)
            values = list(updates.values()) + [row["id"]]
            await db.execute(f"UPDATE articles SET {set_clause} WHERE id = ?", values)
    return total
--- a/src/services/source_health.py
+++ b/src/services/source_health.py
@@ -1,282 +1,282 @@
-"""Quellen-Health-Check Engine - prÃ¼ft Erreichbarkeit, Feed-ValiditÃ¤t, Duplikate."""
+"""Quellen-Health-Check Engine - prüft Erreichbarkeit, Feed-Validität, Duplikate."""
-import asyncio
+import asyncio
-import logging
+import logging
-import json
+import json
-from urllib.parse import urlparse
+from urllib.parse import urlparse
-
+
-import httpx
+import httpx
-import feedparser
+import feedparser
-import aiosqlite
+import aiosqlite
-
+
-logger = logging.getLogger("osint.source_health")
+logger = logging.getLogger("osint.source_health")
-
+
-
+
-async def run_health_checks(db: aiosqlite.Connection) -> dict:
+async def run_health_checks(db: aiosqlite.Connection) -> dict:
-    """FÃ¼hrt alle Health-Checks fÃ¼r aktive Grundquellen durch."""
+    """Führt alle Health-Checks für aktive Grundquellen durch."""
-    logger.info("Starte Quellen-Health-Check...")
+    logger.info("Starte Quellen-Health-Check...")
-
+
-    # Alle aktiven Grundquellen laden
+    # Alle aktiven Grundquellen laden
-    cursor = await db.execute(
+    cursor = await db.execute(
-        "SELECT id, name, url, domain, source_type, article_count, last_seen_at "
+        "SELECT id, name, url, domain, source_type, article_count, last_seen_at "
-        "FROM sources WHERE status = 'active' AND tenant_id IS NULL"
+        "FROM sources WHERE status = 'active' AND tenant_id IS NULL"
-    )
+    )
-    sources = [dict(row) for row in await cursor.fetchall()]
+    sources = [dict(row) for row in await cursor.fetchall()]
-
+
-    # Aktuelle Health-Check-Ergebnisse lÃ¶schen (werden neu geschrieben)
+    # Aktuelle Health-Check-Ergebnisse löschen (werden neu geschrieben)
-    await db.execute("DELETE FROM source_health_checks")
+    await db.execute("DELETE FROM source_health_checks")
-    await db.commit()
+    await db.commit()
-
+
-    checks_done = 0
+    checks_done = 0
-    issues_found = 0
+    issues_found = 0
-
+
-    # 1. Erreichbarkeit + Feed-ValiditÃ¤t (nur Quellen mit URL)
+    # 1. Erreichbarkeit + Feed-Validität (nur Quellen mit URL)
-    sources_with_url = [s for s in sources if s["url"]]
+    sources_with_url = [s for s in sources if s["url"]]
-
+
-    async with httpx.AsyncClient(
+    async with httpx.AsyncClient(
-        timeout=15.0,
+        timeout=15.0,
-        follow_redirects=True,
+        follow_redirects=True,
-        headers={"User-Agent": "Mozilla/5.0 (compatible; OSINT-Monitor/1.0)"},
+        headers={"User-Agent": "Mozilla/5.0 (compatible; OSINT-Monitor/1.0)"},
-    ) as client:
+    ) as client:
-        for i in range(0, len(sources_with_url), 5):
+        for i in range(0, len(sources_with_url), 5):
-            batch = sources_with_url[i:i + 5]
+            batch = sources_with_url[i:i + 5]
-            tasks = [_check_source_reachability(client, s) for s in batch]
+            tasks = [_check_source_reachability(client, s) for s in batch]
-            results = await asyncio.gather(*tasks, return_exceptions=True)
+            results = await asyncio.gather(*tasks, return_exceptions=True)
-
+
-            for source, result in zip(batch, results):
+            for source, result in zip(batch, results):
-                if isinstance(result, Exception):
+                if isinstance(result, Exception):
-                    await _save_check(
+                    await _save_check(
-                        db, source["id"], "reachability", "error",
+                        db, source["id"], "reachability", "error",
-                        f"PrÃ¼fung fehlgeschlagen: {result}",
+                        f"Prüfung fehlgeschlagen: {result}",
-                    )
+                    )
-                    issues_found += 1
+                    issues_found += 1
-                else:
+                else:
-                    for check in result:
+                    for check in result:
-                        await _save_check(
+                        await _save_check(
-                            db, source["id"], check["type"], check["status"],
+                            db, source["id"], check["type"], check["status"],
-                            check["message"], check.get("details"),
+                            check["message"], check.get("details"),
-                        )
+                        )
-                        if check["status"] != "ok":
+                        if check["status"] != "ok":
-                            issues_found += 1
+                            issues_found += 1
-                checks_done += 1
+                checks_done += 1
-
+
-    # 2. Veraltete Quellen (kein Artikel seit >30 Tagen)
+    # 2. Veraltete Quellen (kein Artikel seit >30 Tagen)
-    for source in sources:
+    for source in sources:
-        if source["source_type"] in ("excluded", "web_source"):
+        if source["source_type"] in ("excluded", "web_source"):
-            continue
+            continue
-        stale_check = _check_stale(source)
+        stale_check = _check_stale(source)
-        if stale_check:
+        if stale_check:
-            await _save_check(
+            await _save_check(
-                db, source["id"], stale_check["type"],
+                db, source["id"], stale_check["type"],
-                stale_check["status"], stale_check["message"],
+                stale_check["status"], stale_check["message"],
-            )
+            )
-            if stale_check["status"] != "ok":
+            if stale_check["status"] != "ok":
-                issues_found += 1
+                issues_found += 1
-
+
-    # 3. Duplikate erkennen
+    # 3. Duplikate erkennen
-    duplicates = _find_duplicates(sources)
+    duplicates = _find_duplicates(sources)
-    for dup in duplicates:
+    for dup in duplicates:
-        await _save_check(
+        await _save_check(
-            db, dup["source_id"], "duplicate", "warning",
+            db, dup["source_id"], "duplicate", "warning",
-            dup["message"], json.dumps(dup.get("details", {})),
+            dup["message"], json.dumps(dup.get("details", {})),
-        )
+        )
-        issues_found += 1
+        issues_found += 1
-
+
-    await db.commit()
+    await db.commit()
-    logger.info(
+    logger.info(
-        f"Health-Check abgeschlossen: {checks_done} Quellen geprÃ¼ft, "
+        f"Health-Check abgeschlossen: {checks_done} Quellen geprüft, "
-        f"{issues_found} Probleme gefunden"
+        f"{issues_found} Probleme gefunden"
-    )
+    )
-    return {"checked": checks_done, "issues": issues_found}
+    return {"checked": checks_done, "issues": issues_found}
-
+
-
+
-async def _check_source_reachability(
+async def _check_source_reachability(
-    client: httpx.AsyncClient, source: dict,
+    client: httpx.AsyncClient, source: dict,
-) -> list[dict]:
+) -> list[dict]:
-    """PrÃ¼ft Erreichbarkeit und Feed-ValiditÃ¤t einer Quelle."""
+    """Prüft Erreichbarkeit und Feed-Validität einer Quelle."""
-    checks = []
+    checks = []
-    url = source["url"]
+    url = source["url"]
-
+
-    try:
+    try:
-        resp = await client.get(url)
+        resp = await client.get(url)
-
+
-        if resp.status_code >= 400:
+        if resp.status_code >= 400:
-            checks.append({
+            checks.append({
-                "type": "reachability",
+                "type": "reachability",
-                "status": "error",
+                "status": "error",
-                "message": f"HTTP {resp.status_code} - nicht erreichbar",
+                "message": f"HTTP {resp.status_code} - nicht erreichbar",
-                "details": json.dumps({"status_code": resp.status_code, "url": url}),
+                "details": json.dumps({"status_code": resp.status_code, "url": url}),
-            })
+            })
-            return checks
+            return checks
-
+
-        if resp.status_code >= 300:
+        if resp.status_code >= 300:
-            checks.append({
+            checks.append({
-                "type": "reachability",
+                "type": "reachability",
-                "status": "warning",
+                "status": "warning",
-                "message": f"HTTP {resp.status_code} - Weiterleitung",
+                "message": f"HTTP {resp.status_code} - Weiterleitung",
-                "details": json.dumps({
+                "details": json.dumps({
-                    "status_code": resp.status_code,
+                    "status_code": resp.status_code,
-                    "final_url": str(resp.url),
+                    "final_url": str(resp.url),
-                }),
+                }),
-            })
+            })
-        else:
+        else:
-            checks.append({
+            checks.append({
-                "type": "reachability",
+                "type": "reachability",
-                "status": "ok",
+                "status": "ok",
-                "message": "Erreichbar",
+                "message": "Erreichbar",
-            })
+            })
-
+
-        # Feed-ValiditÃ¤t nur fÃ¼r RSS-Feeds
+        # Feed-Validität nur für RSS-Feeds
-        if source["source_type"] == "rss_feed":
+        if source["source_type"] == "rss_feed":
-            text = resp.text[:20000]
+            text = resp.text[:20000]
-            if "<rss" not in text and "<feed" not in text and "<channel" not in text:
+            if "<rss" not in text and "<feed" not in text and "<channel" not in text:
-                checks.append({
+                checks.append({
-                    "type": "feed_validity",
+                    "type": "feed_validity",
-                    "status": "error",
+                    "status": "error",
-                    "message": "Kein gÃ¼ltiger RSS/Atom-Feed",
+                    "message": "Kein gültiger RSS/Atom-Feed",
-                })
+                })
-            else:
+            else:
-                feed = await asyncio.to_thread(feedparser.parse, text)
+                feed = await asyncio.to_thread(feedparser.parse, text)
-                if feed.get("bozo") and not feed.entries:
+                if feed.get("bozo") and not feed.entries:
-                    checks.append({
+                    checks.append({
-                        "type": "feed_validity",
+                        "type": "feed_validity",
-                        "status": "error",
+                        "status": "error",
-                        "message": "Feed fehlerhaft (bozo)",
+                        "message": "Feed fehlerhaft (bozo)",
-                        "details": json.dumps({
+                        "details": json.dumps({
-                            "bozo_exception": str(feed.get("bozo_exception", "")),
+                            "bozo_exception": str(feed.get("bozo_exception", "")),
-                        }),
+                        }),
-                    })
+                    })
-                elif not feed.entries:
+                elif not feed.entries:
-                    checks.append({
+                    checks.append({
-                        "type": "feed_validity",
+                        "type": "feed_validity",
-                        "status": "warning",
+                        "status": "warning",
-                        "message": "Feed erreichbar aber leer",
+                        "message": "Feed erreichbar aber leer",
-                    })
+                    })
-                else:
+                else:
-                    checks.append({
+                    checks.append({
-                        "type": "feed_validity",
+                        "type": "feed_validity",
-                        "status": "ok",
+                        "status": "ok",
-                        "message": f"Feed gÃ¼ltig ({len(feed.entries)} EintrÃ¤ge)",
+                        "message": f"Feed gültig ({len(feed.entries)} Einträge)",
-                    })
+                    })
-
+
-    except httpx.TimeoutException:
+    except httpx.TimeoutException:
-        checks.append({
+        checks.append({
-            "type": "reachability",
+            "type": "reachability",
-            "status": "error",
+            "status": "error",
-            "message": "Timeout (15s)",
+            "message": "Timeout (15s)",
-        })
+        })
-    except httpx.ConnectError as e:
+    except httpx.ConnectError as e:
-        checks.append({
+        checks.append({
-            "type": "reachability",
+            "type": "reachability",
-            "status": "error",
+            "status": "error",
-            "message": f"Verbindung fehlgeschlagen: {e}",
+            "message": f"Verbindung fehlgeschlagen: {e}",
-        })
+        })
-    except Exception as e:
+    except Exception as e:
-        checks.append({
+        checks.append({
-            "type": "reachability",
+            "type": "reachability",
-            "status": "error",
+            "status": "error",
-            "message": f"{type(e).__name__}: {e}",
+            "message": f"{type(e).__name__}: {e}",
-        })
+        })
-
+
-    return checks
+    return checks
-
+
-
+
-def _check_stale(source: dict) -> dict | None:
+def _check_stale(source: dict) -> dict | None:
-    """PrÃ¼ft ob eine Quelle veraltet ist (keine Artikel seit >30 Tagen)."""
+    """Prüft ob eine Quelle veraltet ist (keine Artikel seit >30 Tagen)."""
-    if source["source_type"] == "excluded":
+    if source["source_type"] == "excluded":
-        return None
+        return None
-
+
-    article_count = source.get("article_count") or 0
+    article_count = source.get("article_count") or 0
-    last_seen = source.get("last_seen_at")
+    last_seen = source.get("last_seen_at")
-
+
-    if article_count == 0:
+    if article_count == 0:
-        return {
+        return {
-            "type": "stale",
+            "type": "stale",
-            "status": "warning",
+            "status": "warning",
-            "message": "Noch nie Artikel geliefert",
+            "message": "Noch nie Artikel geliefert",
-        }
+        }
-
+
-    if last_seen:
+    if last_seen:
-        try:
+        try:
-            from datetime import datetime
+            from datetime import datetime
-            last_dt = datetime.fromisoformat(last_seen)
+            last_dt = datetime.fromisoformat(last_seen)
-            now = datetime.now()
+            now = datetime.now()
-            age_days = (now - last_dt).days
+            age_days = (now - last_dt).days
-            if age_days > 30:
+            if age_days > 30:
-                return {
+                return {
-                    "type": "stale",
+                    "type": "stale",
-                    "status": "warning",
+                    "status": "warning",
-                    "message": f"Letzter Artikel vor {age_days} Tagen",
+                    "message": f"Letzter Artikel vor {age_days} Tagen",
-                }
+                }
-        except (ValueError, TypeError):
+        except (ValueError, TypeError):
-            pass
+            pass
-
+
-    return None
+    return None
-
+
-
+
-def _find_duplicates(sources: list[dict]) -> list[dict]:
+def _find_duplicates(sources: list[dict]) -> list[dict]:
-    """Findet doppelte Quellen (gleiche URL)."""
+    """Findet doppelte Quellen (gleiche URL)."""
-    duplicates = []
+    duplicates = []
-    url_map = {}
+    url_map = {}
-
+
-    for s in sources:
+    for s in sources:
-        if not s["url"]:
+        if not s["url"]:
-            continue
+            continue
-        url_norm = s["url"].lower().rstrip("/")
+        url_norm = s["url"].lower().rstrip("/")
-        if url_norm in url_map:
+        if url_norm in url_map:
-            existing = url_map[url_norm]
+            existing = url_map[url_norm]
-            duplicates.append({
+            duplicates.append({
-                "source_id": s["id"],
+                "source_id": s["id"],
-                "message": f"Doppelte URL wie '{existing['name']}' (ID {existing['id']})",
+                "message": f"Doppelte URL wie '{existing['name']}' (ID {existing['id']})",
-                "details": {"duplicate_of": existing["id"], "type": "url"},
+                "details": {"duplicate_of": existing["id"], "type": "url"},
-            })
+            })
-        else:
+        else:
-            url_map[url_norm] = s
+            url_map[url_norm] = s
-
+
-    return duplicates
+    return duplicates
-
+
-
+
-async def _save_check(
+async def _save_check(
-    db: aiosqlite.Connection, source_id: int, check_type: str,
+    db: aiosqlite.Connection, source_id: int, check_type: str,
-    status: str, message: str, details: str = None,
+    status: str, message: str, details: str = None,
-):
+):
-    """Speichert ein Health-Check-Ergebnis."""
+    """Speichert ein Health-Check-Ergebnis."""
-    await db.execute(
+    await db.execute(
-        "INSERT INTO source_health_checks "
+        "INSERT INTO source_health_checks "
-        "(source_id, check_type, status, message, details) "
+        "(source_id, check_type, status, message, details) "
-        "VALUES (?, ?, ?, ?, ?)",
+        "VALUES (?, ?, ?, ?, ?)",
-        (source_id, check_type, status, message, details),
+        (source_id, check_type, status, message, details),
-    )
+    )
-
+
-
+
-async def get_health_summary(db: aiosqlite.Connection) -> dict:
+async def get_health_summary(db: aiosqlite.Connection) -> dict:
-    """Gibt eine Zusammenfassung der letzten Health-Check-Ergebnisse zurÃ¼ck."""
+    """Gibt eine Zusammenfassung der letzten Health-Check-Ergebnisse zurück."""
-    cursor = await db.execute("""
+    cursor = await db.execute("""
-        SELECT
+        SELECT
-            h.id, h.source_id, s.name, s.domain, s.url, s.source_type,
+            h.id, h.source_id, s.name, s.domain, s.url, s.source_type,
-            h.check_type, h.status, h.message, h.details, h.checked_at
+            h.check_type, h.status, h.message, h.details, h.checked_at
-        FROM source_health_checks h
+        FROM source_health_checks h
-        JOIN sources s ON s.id = h.source_id
+        JOIN sources s ON s.id = h.source_id
-        ORDER BY
+        ORDER BY
-            CASE h.status WHEN 'error' THEN 0 WHEN 'warning' THEN 1 ELSE 2 END,
+            CASE h.status WHEN 'error' THEN 0 WHEN 'warning' THEN 1 ELSE 2 END,
-            s.name
+            s.name
-    """)
+    """)
-    checks = [dict(row) for row in await cursor.fetchall()]
+    checks = [dict(row) for row in await cursor.fetchall()]
-
+
-    error_count = sum(1 for c in checks if c["status"] == "error")
+    error_count = sum(1 for c in checks if c["status"] == "error")
-    warning_count = sum(1 for c in checks if c["status"] == "warning")
+    warning_count = sum(1 for c in checks if c["status"] == "warning")
-    ok_count = sum(1 for c in checks if c["status"] == "ok")
+    ok_count = sum(1 for c in checks if c["status"] == "ok")
-
+
-    cursor = await db.execute(
+    cursor = await db.execute(
-        "SELECT MAX(checked_at) as last_check FROM source_health_checks"
+        "SELECT MAX(checked_at) as last_check FROM source_health_checks"
-    )
+    )
-    row = await cursor.fetchone()
+    row = await cursor.fetchone()
-    last_check = row["last_check"] if row else None
+    last_check = row["last_check"] if row else None
-
+
-    return {
+    return {
-        "last_check": last_check,
+        "last_check": last_check,
-        "total_checks": len(checks),
+        "total_checks": len(checks),
-        "errors": error_count,
+        "errors": error_count,
-        "warnings": warning_count,
+        "warnings": warning_count,
-        "ok": ok_count,
+        "ok": ok_count,
-        "checks": checks,
+        "checks": checks,
-    }
+    }
--- a/src/services/source_suggester.py
+++ b/src/services/source_suggester.py
@@ -1,4 +1,4 @@
-"""KI-gestÃƒÂ¼tzte Quellen-VorschlÃƒÂ¤ge via Haiku."""
+"""KI-gestützte Quellen-Vorschläge via Haiku."""
 import json
 import logging
 import re
@@ -12,8 +12,8 @@ logger = logging.getLogger("osint.source_suggester")
 async def generate_suggestions(db: aiosqlite.Connection) -> int:
-    """Generiert Quellen-VorschlÃƒÂ¤ge basierend auf Health-Checks und LÃƒÂ¼ckenanalyse."""
+    """Generiert Quellen-Vorschläge basierend auf Health-Checks und Lückenanalyse."""
-    logger.info("Starte Quellen-VorschlÃƒÂ¤ge via Haiku...")
+    logger.info("Starte Quellen-Vorschläge via Haiku...")
    # 1. Aktuelle Quellen laden
    cursor = await db.execute(
@@ -33,13 +33,13 @@ async def generate_suggestions(db: aiosqlite.Connection) -> int:
    """)
    issues = [dict(row) for row in await cursor.fetchall()]
-    # 3. Alte pending-VorschlÃƒÂ¤ge entfernen (ÃƒÂ¤lter als 30 Tage)
+    # 3. Alte pending-Vorschläge entfernen (älter als 30 Tage)
    await db.execute(
        "DELETE FROM source_suggestions "
        "WHERE status = 'pending' AND created_at < datetime('now', '-30 days')"
    )
-    # 4. Quellen-Zusammenfassung fÃƒÂ¼r Haiku
+    # 4. Quellen-Zusammenfassung für Haiku
    categories = {}
    for s in sources:
        cat = s["category"]
@@ -67,7 +67,7 @@ async def generate_suggestions(db: aiosqlite.Connection) -> int:
                f"{issue['check_type']} = {issue['status']} - {issue['message']}\n"
            )
-    prompt = f"""Du bist ein OSINT-Analyst und verwaltest die Quellensammlung eines Lagebildmonitors fÃƒÂ¼r SicherheitsbehÃƒÂ¶rden.
+    prompt = f"""Du bist ein OSINT-Analyst und verwaltest die Quellensammlung eines Lagebildmonitors für Sicherheitsbehörden.
 Aktuelle Quellensammlung:{source_summary}{issues_summary}
@@ -78,13 +78,13 @@ Beachte:
 2. Fehlende wichtige OSINT-Quellen: Schlage "add_source" mit konkreter RSS-Feed-URL vor
 3. Fokus auf deutschsprachige + wichtige internationale Nachrichtenquellen
 4. Nur Quellen vorschlagen, die NICHT bereits vorhanden sind
-5. Maximal 5 VorschlÃƒÂ¤ge
+5. Maximal 5 Vorschläge
 Antworte NUR mit einem JSON-Array. Jedes Element:
 {{
  "type": "add_source|deactivate_source|fix_url|remove_source",
  "title": "Kurzer Titel",
-  "description": "BegrÃƒÂ¼ndung",
+  "description": "Begründung",
  "priority": "low|medium|high",
  "source_id": null,
  "data": {{
@@ -104,7 +104,7 @@ Nur das JSON-Array, kein anderer Text."""
        json_match = re.search(r'\[.*\]', response, re.DOTALL)
        if not json_match:
-            logger.warning("Keine VorschlÃƒÂ¤ge von Haiku erhalten (kein JSON)")
+            logger.warning("Keine Vorschläge von Haiku erhalten (kein JSON)")
            return 0
        suggestions = json.loads(json_match.group(0))
@@ -164,14 +164,14 @@ Nur das JSON-Array, kein anderer Text."""
        await db.commit()
        logger.info(
-            f"Quellen-VorschlÃƒÂ¤ge: {count} neue VorschlÃƒÂ¤ge generiert "
+            f"Quellen-Vorschläge: {count} neue Vorschläge generiert "
            f"(Haiku: {usage.input_tokens} in / {usage.output_tokens} out / "
            f"${usage.cost_usd:.4f})"
        )
        return count
    except Exception as e:
-        logger.error(f"Fehler bei Quellen-VorschlÃƒÂ¤gen: {e}", exc_info=True)
+        logger.error(f"Fehler bei Quellen-Vorschlägen: {e}", exc_info=True)
        return 0
@@ -218,7 +218,7 @@ async def apply_suggestion(
                    (url,),
                )
                if await cursor.fetchone():
-                    result["action"] = "ÃƒÂ¼bersprungen (URL bereits vorhanden)"
+                    result["action"] = "übersprungen (URL bereits vorhanden)"
                    new_status = "rejected"
                else:
                    await db.execute(
@@ -230,7 +230,7 @@ async def apply_suggestion(
                    )
                    result["action"] = f"Quelle '{name}' angelegt"
            else:
-                result["action"] = "ÃƒÂ¼bersprungen (keine URL)"
+                result["action"] = "übersprungen (keine URL)"
                new_status = "rejected"
        elif stype == "deactivate_source":
@@ -242,7 +242,7 @@ async def apply_suggestion(
                )
                result["action"] = "Quelle deaktiviert"
            else:
-                result["action"] = "ÃƒÂ¼bersprungen (keine source_id)"
+                result["action"] = "übersprungen (keine source_id)"
        elif stype == "remove_source":
            source_id = suggestion["source_id"]
@@ -250,9 +250,9 @@ async def apply_suggestion(
                await db.execute(
                    "DELETE FROM sources WHERE id = ?", (source_id,),
                )
-                result["action"] = "Quelle gelÃƒÂ¶scht"
+                result["action"] = "Quelle gelöscht"
            else:
-                result["action"] = "ÃƒÂ¼bersprungen (keine source_id)"
+                result["action"] = "übersprungen (keine source_id)"
        elif stype == "fix_url":
            source_id = suggestion["source_id"]
@@ -264,7 +264,7 @@ async def apply_suggestion(
                )
                result["action"] = f"URL aktualisiert auf {new_url}"
            else:
-                result["action"] = "ÃƒÂ¼bersprungen (keine source_id oder URL)"
+                result["action"] = "übersprungen (keine source_id oder URL)"
    await db.execute(
        "UPDATE source_suggestions SET status = ?, reviewed_at = CURRENT_TIMESTAMP "
--- a/src/static/css/style.css
+++ b/src/static/css/style.css
@@ -549,6 +549,31 @@ a:hover {
    font-weight: 500;
 }
 .header-dropdown-action {
    display: flex;
    align-items: center;
    gap: 8px;
    width: 100%;
    background: transparent;
    border: 0;
    padding: 8px 12px;
    color: var(--text-secondary);
    font-size: 12px;
    font-family: inherit;
    cursor: pointer;
    border-radius: 6px;
    text-align: left;
    transition: background 0.15s ease, color 0.15s ease;
 }
 .header-dropdown-action:hover {
    background: var(--bg-hover, rgba(255, 255, 255, 0.04));
    color: var(--text-primary);
 }
 .header-dropdown-action svg {
    flex-shrink: 0;
    color: var(--accent);
 }
 .header-license-badge {
    display: inline-block;
    font-size: 10px;
--- a/src/static/dashboard.html
+++ b/src/static/dashboard.html
@@ -72,6 +72,11 @@
                                <span class="credits-percent" id="credits-percent"></span>
                            </div>
                        </div>
                        <div class="credits-divider"></div>
                        <button class="header-dropdown-action" type="button" onclick="AIDisclaimer && AIDisclaimer.show()">
                            <svg xmlns="http://www.w3.org/2000/svg" width="14" height="14" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round" stroke-linejoin="round" aria-hidden="true"><circle cx="12" cy="12" r="10"/><path d="M12 16v-4"/><path d="M12 8h.01"/></svg>
                            <span>Über KI-Inhalte</span>
                        </button>
                    </div>
                </div>
                <div class="header-license-warning" id="header-license-warning"></div>
@@ -118,8 +123,14 @@
                <div id="archived-incidents" aria-live="polite" style="display:none;"></div>
            </div>
            <div class="sidebar-sources-link">
-                <button class="btn btn-secondary btn-full btn-small" onclick="App.openSourceManagement()">Quellen verwalten</button>
+                <button class="btn btn-secondary btn-full btn-small" onclick="App.openSourceManagement()" title="Quellen verwalten">
-                <button class="btn btn-secondary btn-full btn-small sidebar-feedback-btn" onclick="App.openFeedback()">Feedback senden</button>
+                    <svg xmlns="http://www.w3.org/2000/svg" width="14" height="14" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round" stroke-linejoin="round" aria-hidden="true"><ellipse cx="12" cy="5" rx="9" ry="3"/><path d="M3 5v14c0 1.66 4.03 3 9 3s9-1.34 9-3V5"/><path d="M3 12c0 1.66 4.03 3 9 3s9-1.34 9-3"/></svg>
                    <span>Quellen</span>
                </button>
                <button class="btn btn-secondary btn-full btn-small sidebar-feedback-btn" onclick="App.openFeedback()" title="Feedback senden">
                    <svg xmlns="http://www.w3.org/2000/svg" width="14" height="14" viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="2" stroke-linecap="round" stroke-linejoin="round" aria-hidden="true"><rect width="20" height="16" x="2" y="4" rx="2"/><path d="m22 7-10 5L2 7"/></svg>
                    <span>Feedback</span>
                </button>
                <!-- Tutorial-Einstieg temporaer deaktiviert (Ueberarbeitung) - reaktivieren durch Entfernen der Kommentarzeichen:
                <button class="btn btn-secondary btn-full btn-small" onclick="Tutorial.start()" title="Interaktiven Rundgang starten">Rundgang starten</button>
                -->
@@ -738,5 +749,6 @@
    </div>
    <script src="/static/js/update-system.js"></script>
    <script src="/static/js/ai-disclaimer.js"></script>
 </body>
 </html>
--- a/src/static/js/ai-disclaimer.js
+++ b/src/static/js/ai-disclaimer.js
@@ -0,0 +1,195 @@
 /**
 * AI-Hallucination-Disclaimer fuer den AegisSight Monitor.
 *
 * Zeigt:
 *   1) Beim ersten Besuch (oder bei neuem v-Bump) ein Modal mit Hinweisen
 *      zur Fehlbarkeit von KI-Modellen.
 *   2) Im Header-User-Dropdown immer einen Eintrag "Ueber KI-Inhalte",
 *      ueber den der User das Modal jederzeit erneut oeffnen kann.
 *
 * Persistenz:
 *   localStorage 'aegis_ai_disclaimer_seen' -> Versionsstring (z.B. "v1").
 *   Wenn die Version sich aendert (Wortlaut-Update), erscheint das Modal
 *   beim naechsten Login erneut.
 */
 (function () {
    'use strict';
    const STORAGE_KEY = 'aegis_ai_disclaimer_seen';
    const CURRENT_VERSION = 'v1';
    // ---- DOM-Helpers (analog zu update-system.js) ----
    function el(tag, attrs, ...children) {
        const e = document.createElement(tag);
        for (const k in (attrs || {})) {
            if (k === 'class') e.className = attrs[k];
            else if (k === 'html') e.innerHTML = attrs[k];
            else if (k.startsWith('on')) e.addEventListener(k.slice(2), attrs[k]);
            else e.setAttribute(k, attrs[k]);
        }
        for (const c of children) {
            if (c == null) continue;
            e.appendChild(typeof c === 'string' ? document.createTextNode(c) : c);
        }
        return e;
    }
    function injectStyles() {
        if (document.getElementById('aegis-aidisc-styles')) return;
        const css = `
        #aegis-aidisc-overlay {
            position: fixed; inset: 0; background: rgba(0,0,0,0.55); z-index: 99998;
            backdrop-filter: blur(3px);
            display: flex; align-items: center; justify-content: center; padding: 24px;
            animation: aegis-aidisc-fade 0.25s ease;
        }
        @keyframes aegis-aidisc-fade { from { opacity: 0; } to { opacity: 1; } }
        #aegis-aidisc-modal {
            background: var(--bg-card);
            color: var(--text-primary);
            border-radius: 14px;
            border: 1px solid var(--border);
            box-shadow: 0 24px 80px rgba(0,0,0,0.4);
            font-family: 'Inter', -apple-system, sans-serif;
            max-width: 580px; width: 100%; max-height: 85vh; overflow: hidden;
            display: flex; flex-direction: column;
        }
        #aegis-aidisc-modal header {
            padding: 22px 28px 18px; border-bottom: 1px solid var(--border);
            display: flex; align-items: center; gap: 12px;
        }
        #aegis-aidisc-modal header svg { color: var(--accent); flex-shrink: 0; }
        #aegis-aidisc-modal h2 { margin: 0; color: var(--accent); font-size: 1.25rem; font-weight: 700; }
        #aegis-aidisc-modal .body { padding: 18px 28px; overflow-y: auto; line-height: 1.55; }
        #aegis-aidisc-modal .body p { margin: 0 0 12px; color: var(--text-primary); font-size: 0.94rem; }
        #aegis-aidisc-modal .body strong { color: var(--accent); }
        #aegis-aidisc-modal .body ul { margin: 8px 0 14px; padding-left: 22px; }
        #aegis-aidisc-modal .body li { margin-bottom: 6px; color: var(--text-secondary); font-size: 0.92rem; }
        #aegis-aidisc-modal .footnote {
            margin-top: 10px; padding-top: 12px; border-top: 1px solid var(--border);
            color: var(--text-tertiary); font-size: 0.82rem;
        }
        #aegis-aidisc-modal footer {
            padding: 14px 28px 20px; border-top: 1px solid var(--border);
            display: flex; justify-content: flex-end; gap: 10px;
        }
        #aegis-aidisc-modal footer button {
            background: var(--accent); color: #fff; border: 0; padding: 10px 22px;
            border-radius: 6px; font: inherit; font-size: 0.92rem; font-weight: 600;
            cursor: pointer;
        }
        #aegis-aidisc-modal footer button:hover { background: var(--accent-hover); }
        #aegis-aidisc-modal footer button.secondary {
            background: transparent; color: var(--text-secondary); border: 1px solid var(--border);
        }
        #aegis-aidisc-modal footer button.secondary:hover {
            background: var(--bg-hover, rgba(255,255,255,0.04)); color: var(--text-primary);
        }`;
        document.head.appendChild(el('style', { id: 'aegis-aidisc-styles', html: css }));
    }
    // ---- Modal-Aufbau ----
    function buildModal(opts) {
        const isFromUser = !!(opts && opts.fromUserAction);
        // Lucide info-Icon (gleiches Pattern wie .info-icon im Repo)
        const headerIcon = el('span', {
            html: '<svg xmlns="http://www.w3.org/2000/svg" width="22" height="22" '
                + 'viewBox="0 0 24 24" fill="none" stroke="currentColor" stroke-width="2" '
                + 'stroke-linecap="round" stroke-linejoin="round">'
                + '<circle cx="12" cy="12" r="10"/>'
                + '<path d="M12 16v-4"/><path d="M12 8h.01"/></svg>'
        });
        const body = el('div', { class: 'body' });
        body.appendChild(el('p', null,
            'Der AegisSight Monitor nutzt Künstliche Intelligenz '
            + 'zur Analyse, Übersetzung und Zusammenfassung von Nachrichten.'));
        const warn = el('p');
        warn.innerHTML = '<strong>KI-Modelle können Fehler machen</strong> '
            + '(sogenannte „Halluzinationen"): erfundene Details, falsche Verbindungen oder '
            + 'ungenaue Zusammenfassungen sind möglich, auch wenn der Text plausibel klingt.';
        body.appendChild(warn);
        body.appendChild(el('p', null, 'Wir empfehlen daher:'));
        body.appendChild(el('ul', null,
            el('li', null, 'Wichtige Informationen mit den verlinkten Quellen verifizieren'),
            el('li', null, 'Bei kritischen Entscheidungen die Originalartikel prüfen'),
            el('li', null, 'Faktenchecks als Hinweis verstehen, nicht als endgültige Wahrheit')
        ));
        body.appendChild(el('p', { class: 'footnote' },
            'Diesen Hinweis findest du jederzeit wieder im Menü oben rechts unter „Über KI-Inhalte".'));
        const closeAndStore = () => {
            try { localStorage.setItem(STORAGE_KEY, CURRENT_VERSION); } catch (e) {}
            overlay.remove();
            document.removeEventListener('keydown', escHandler);
        };
        const closeOnly = () => {
            overlay.remove();
            document.removeEventListener('keydown', escHandler);
        };
        const footer = el('footer', null);
        if (!isFromUser) {
            footer.appendChild(el('button', { class: 'secondary', onclick: closeOnly }, 'Später nochmal'));
        }
        footer.appendChild(el('button', { onclick: closeAndStore }, 'Verstanden'));
        const overlay = el('div', { id: 'aegis-aidisc-overlay' },
            el('div', { id: 'aegis-aidisc-modal' },
                el('header', null, headerIcon, el('h2', null, 'Hinweis zu KI-generierten Inhalten')),
                body,
                footer
            )
        );
        function escHandler(ev) {
            if (ev.key === 'Escape' && document.getElementById('aegis-aidisc-overlay')) {
                // ESC = wie "Verstanden" beim erstmaligen Anzeigen, sonst nur schliessen
                if (isFromUser) closeOnly(); else closeAndStore();
            }
        }
        overlay.addEventListener('click', (ev) => {
            if (ev.target === overlay) {
                if (isFromUser) closeOnly(); else closeAndStore();
            }
        });
        document.addEventListener('keydown', escHandler);
        return overlay;
    }
    function show(opts) {
        if (document.getElementById('aegis-aidisc-overlay')) return;
        injectStyles();
        document.body.appendChild(buildModal(opts));
    }
    function init() {
        // Nur auf der Dashboard-Seite zeigen, nicht auf der Login-Seite
        if (!document.body || document.body.classList.contains('login-page')) return;
        injectStyles();
        let seenVersion = '';
        try { seenVersion = localStorage.getItem(STORAGE_KEY) || ''; } catch (e) {}
        if (seenVersion !== CURRENT_VERSION) {
            // Etwas verzoegern, damit Hauptdashboard sichtbar ist bevor Modal kommt
            setTimeout(() => show({ fromUserAction: false }), 600);
        }
    }
    // Globaler Zugriff zum manuellen Oeffnen aus dem Header-Dropdown
    window.AIDisclaimer = {
        show: () => show({ fromUserAction: true }),
        VERSION: CURRENT_VERSION,
    };
    if (document.readyState === 'loading') {
        document.addEventListener('DOMContentLoaded', init);
    } else {
        init();
    }
 })();
--- a/src/static/js/app.js
+++ b/src/static/js/app.js
@@ -523,7 +523,7 @@ const App = {
                    let text = 'Nur Lesezugriff';
                    const reason = user.read_only_reason;
                    if (reason === 'budget_exceeded') {
-                        text = 'Token-Budget aufgebraucht – nur Lesezugriff. Bitte Verwaltung kontaktieren.';
+                        text = 'Token-Budget aufgebraucht – nur Lesezugriff. Für Aufstockung oder Upgrade bitte info@aegis-sight.de kontaktieren.';
                    } else if (reason === 'expired') {
                        text = 'Lizenz abgelaufen – nur Lesezugriff';
                    } else if (reason === 'no_license') {
@@ -618,6 +618,10 @@ const App = {
                    const inc = this.incidents.find(i => i.id === id);
                    const isFirst = inc && !inc.has_summary;
                    UI.showProgress('queued', { queue_position: idx + 1 }, id, isFirst);
                    // Pipeline-Reset auch nach F5: aktive Lage in Queue -> Icons grau
                    if (id === this.currentIncidentId && typeof Pipeline !== 'undefined' && Pipeline.beginQueue) {
                        Pipeline.beginQueue(id);
                    }
                });
            }
@@ -1926,6 +1930,11 @@ async handleRefresh() {
            this._updateRefreshButton(true);
            // showProgress called via handleStatusUpdate
            const result = await API.refreshIncident(this.currentIncidentId);
            // Pipeline auf "pending" setzen, damit alte gruene Haekchen nicht
            // faelschlich "schon fertig" suggerieren waehrend die Lage in der Queue steht
            if (typeof Pipeline !== 'undefined' && Pipeline.beginQueue) {
                Pipeline.beginQueue(this.currentIncidentId);
            }
            if (result && result.status === 'skipped') {
                UI.showToast('Aktualisierung ist in der Warteschlange und wird ausgefuehrt, sobald die aktuelle Recherche abgeschlossen ist.', 'info');
            } else {
--- a/src/static/js/components.js
+++ b/src/static/js/components.js
@@ -354,9 +354,22 @@ const UI = {
        const minBtn = document.getElementById('progress-popup-minimize');
        if (minBtn) minBtn.style.display = state.isFirst ? 'none' : '';
-        // Title
+        // Title - haengt von Status ab (queued = wartet, cancelling = bricht ab, sonst laeuft)
        const titleEl = document.getElementById('progress-popup-title');
-        if (titleEl) titleEl.textContent = state.isFirst ? 'Erste Recherche l\u00e4uft' : 'Aktualisierung l\u00e4uft';
+        if (titleEl) {
            let title;
            if (status === 'queued') {
                const pos = (state && state._queuePos) ? ' (#' + state._queuePos + ')' : '';
                title = 'In Warteschlange' + pos;
            } else if (status === 'cancelling') {
                title = 'Wird abgebrochen\u2026';
            } else if (state.isFirst) {
                title = 'Erste Recherche l\u00e4uft';
            } else {
                title = 'Aktualisierung l\u00e4uft';
            }
            titleEl.textContent = title;
        }
        // Multi-pass info
        const passEl = document.getElementById('progress-popup-pass');
--- a/src/static/js/pipeline.js
+++ b/src/static/js/pipeline.js
@@ -19,6 +19,7 @@ const Pipeline = {
    _incidentId: null,
    _definition: null,        // PIPELINE_STEPS vom Backend
    _stateByKey: {},          // step_key -> {status, count_value, count_secondary, pass_number}
    _snapshotState: null,     // deep-copy von _stateByKey vor Refresh-Start (fuer Cancel-Restore)
    _isResearch: false,
    _passTotal: 1,
    _lastRefreshHeader: null,
@@ -42,10 +43,11 @@ const Pipeline = {
        if (this._wsBound) return;
        if (typeof WS !== 'undefined' && WS.on) {
            WS.on('pipeline_step', (msg) => this._onWsStep(msg));
-            // Bei Refresh-Complete den finalen Stand neu laden, damit Zahlen gefroren sichtbar bleiben
+            // Erfolg: API-State neu laden (finaler Stand sichtbar)
-            WS.on('refresh_complete', (msg) => this._onRefreshDone(msg));
+            WS.on('refresh_complete', (msg) => this._onRefreshDoneSuccess(msg));
-            WS.on('refresh_cancelled', (msg) => this._onRefreshDone(msg));
+            // Cancel/Error: vor-Refresh-Snapshot zurueckspielen, damit Pipeline nicht im Mix-Zustand stehen bleibt
-            WS.on('refresh_error', (msg) => this._onRefreshDone(msg));
+            WS.on('refresh_cancelled', (msg) => this._onRefreshDoneCancel(msg));
            WS.on('refresh_error', (msg) => this._onRefreshDoneError(msg));
            this._wsBound = true;
        }
        // Hover-Tooltip-Element vorbereiten
@@ -68,6 +70,7 @@ const Pipeline = {
    async bindToIncident(incidentId) {
        this._incidentId = incidentId;
        this._stateByKey = {};
        this._snapshotState = null;  // Snapshot ist immer lagen-spezifisch
        this._isResearch = false;
        this._passTotal = 1;
        this._lastRefreshHeader = null;
@@ -101,6 +104,20 @@ const Pipeline = {
            this._render();
            this._renderMini();
            // Edge-Case: Lage ist gerade in Queue (z.B. via Lagen-Wechsel beim
            // Klick in der Sidebar). API liefert den LETZTEN gespeicherten Stand
            // (alles done = gruen), aber tatsaechlich wartet ein neuer Refresh.
            // -> beginQueue() selbst ausloesen, damit Icons grau zeigen.
            try {
                if (typeof App !== 'undefined' && App._refreshingIncidents
                    && App._refreshingIncidents.has(incidentId)
                    && typeof UI !== 'undefined' && UI._progressState
                    && UI._progressState[incidentId]
                    && UI._progressState[incidentId].step === 'queued') {
                    this.beginQueue(incidentId);
                }
            } catch (e) { /* tolerant */ }
        } catch (e) {
            console.warn('Pipeline laden fehlgeschlagen:', e);
            this._renderEmpty('Pipeline-Daten konnten nicht geladen werden.');
@@ -166,14 +183,65 @@ const Pipeline = {
        }
    },
-    _onRefreshDone(msg) {
+    /**
     * Wird vom Frontend gerufen, wenn ein Refresh angestossen wurde (queued).
     * Macht einen Snapshot des aktuellen Pipeline-Stands (zur spaeteren Wiederherstellung
     * bei Cancel/Error) und setzt dann alle Steps auf "pending" - damit der User sieht:
     * "neuer Refresh laeuft an, alte gruene Haekchen sind nicht mehr aktuell".
     */
    beginQueue(incidentId) {
        if (this._incidentId !== incidentId) return;          // andere Lage offen
        if (!this._definition) return;                        // noch keine Pipeline-Definition geladen
        // Aktuellen Stand sichern (deep-copy). Bei Mehrfach-Refresh ohne Cancel
        // dazwischen wird der Snapshot bewusst ueberschrieben - er soll immer
        // der "Stand kurz vor diesem Refresh" sein.
        this._snapshotState = JSON.parse(JSON.stringify(this._stateByKey));
        // Alle Steps auf pending setzen
        this._definition.forEach(s => {
            if (this._stateByKey[s.key]) {
                this._stateByKey[s.key].status = 'pending';
            } else {
                this._stateByKey[s.key] = { status: 'pending', count_value: null, count_secondary: null, pass_number: 1 };
            }
        });
        this._render();
        this._renderMini();
    },
    /** Restauriert den letzten Snapshot. Rueckgabe: true bei Erfolg, false wenn keiner da war. */
    _restoreSnapshot() {
        if (!this._snapshotState) return false;
        this._stateByKey = this._snapshotState;
        this._snapshotState = null;
        this._render();
        this._renderMini();
        return true;
    },
    _onRefreshDoneSuccess(msg) {
        if (this._incidentId == null || (msg && msg.incident_id !== this._incidentId)) return;
        this._snapshotState = null;  // verworfen, neuer Stand wird vom API geladen
        // Daten frisch nachladen, damit Header (Dauer) und finale Zahlen passen
        setTimeout(() => {
            if (this._incidentId != null) this.bindToIncident(this._incidentId);
        }, 600);
    },
    _onRefreshDoneCancel(msg) {
        if (this._incidentId == null || (msg && msg.incident_id !== this._incidentId)) return;
        if (!this._restoreSnapshot()) {
            // Kein Snapshot vorhanden (z.B. Page-Reload mitten im Refresh) -> wie bisher API-Reload
            setTimeout(() => {
                if (this._incidentId != null) this.bindToIncident(this._incidentId);
            }, 600);
        }
    },
    _onRefreshDoneError(msg) {
        // Wie Cancel: vorheriger Stand zurueck (nicht im Mix-Zustand stehenbleiben)
        this._onRefreshDoneCancel(msg);
    },
    /** Vollbild-Pipeline (Tab "Analysepipeline") als 3x3-Snake rendern. */
    _render() {
        const stage = document.getElementById('pipeline-stage');
Autor	SHA1	Nachricht	Datum
Claude Code	e83f80dbe9	fix(researcher): Lagentitel-Eigennamen als Pflicht-Keywords (Bug 2 Buckelwal-Diagnose) KEYWORD_EXTRACTION_PROMPT explizit erweitert: - Eigennamen/Tiernamen/Personennamen aus dem THEMA als ZWINGEND markiert. - Hinweis dass DE und EN identisch sein duerfen (Eigennamen). - Klar gesagt: bei spezifischen Begriffen (>=7 Zeichen) reicht 1 Treffer in RSS-Headlines (passt zu rss_parser.py adaptive Schwelle aus `a08df3d`). Code-Post-Processing (researcher.py _extract_keywords): - Nach dem Parser werden Lagentitel-Woerter (>=4 Zeichen, nicht in Stopwords) ggf. in die Keyword-Liste injiziert, falls Haiku sie weggelassen hat. - Verhindert konkret den "Buckelwal timmy"-Bug: "timmy" fehlte in Haikus Liste, damit fielen Headlines mit nur "Buckelwal" durch das min_matches. Hintergrund: Memory-Eintrag rss_match_und_keyword_bug.md, Bug 2 von 3. Bug 1 (rss_parser min_matches adaptiv) ist seit Commit `a08df3d` auf Live. Bug 3 (international=True default) bleibt offen, ist primaer UX-Frage.	2026-05-09 03:52:36 +00:00
Claude Code	d71daee581	Mojibake fix: source_suggester.py + source_health.py via ftfy Beide Files hatten Doppel-Encoded UTF-8 in Docstrings, Kommentaren und Prompt-Strings (z.B. "prÃƒÂ¼ft" statt "prüft", "VorschlÃƒÂ¤ge" statt "Vorschläge"). ftfy hat das automatisch repariert. Hauptauswirkungen: - Logs sind jetzt mit echten Umlauten lesbar - Claude/Haiku-Prompts in source_suggester.py (Quellen-Vorschlaege via KI) bekommen jetzt korrekte deutsche Umlaute - sollte bessere Antworten geben Daneben hat ftfy line-endings normalisiert, daher der grosse Diff in source_health.py - inhaltlich nur Mojibake-Reparatur. Verifiziert mit: grep -cE "Ã¤\|Ã¶\|Ã¼\|ÃŸ\|Ã„\|Ã–\|Ãœ" src/services/*.py -> 0 Treffer	2026-05-09 03:39:34 +00:00
IntelSight_Admin	1e9cca2555	Promote develop → main (2026-05-06 23:45 UTC)	2026-05-07 01:45:19 +02:00
Claude Code	f4c0c930b8	fix(orchestrator): aktive Pipeline-Schritte beim Cancel mitschliessen Beim User-Cancel wurde nur refresh_log auf cancelled gesetzt, der zuletzt aktive refresh_pipeline_steps-Eintrag blieb verwaist. Der /api/incidents/<id>/pipeline-Endpoint liefert daraus dauerhaft "Schritt X laeuft" an die UI, auch lange nach dem Cancel. - pipeline_tracker.cancel_active_steps(): neuer Bulk-Helper, setzt alle noch active-Schritte eines refresh_log_id auf cancelled mit completed_at - _mark_refresh_cancelled holt die refresh_log_id, macht das refresh_log- Update wie bisher und ruft danach cancel_active_steps auf Reproduziert bei Lage 80 (Bjoern Hoecke), refresh_log 1273. Frontend- CSS kennt status-cancelled nicht, faellt auf den neutralen Default-Style zurueck (kein Spinner mehr, kein Haken, korrekt ent-hangen).	2026-05-06 23:40:39 +00:00
IntelSight_Admin	03ee30a83e	Promote develop → main (2026-05-06 23:31 UTC)	2026-05-07 01:31:33 +02:00
Claude Code	f73c21235e	feat(translator): Feature-Flag TRANSLATOR_ENABLED zum Abschalten (siehe main)	2026-05-03 20:43:40 +00:00
Claude Code	cbfb608471	feat(translator): Feature-Flag TRANSLATOR_ENABLED zum Abschalten Ueber die ENV-Variable TRANSLATOR_ENABLED (default true) kann der Translator-Agent komplett deaktiviert werden. Wenn false: - translate_articles steigt mit return [] aus, ohne Claude-Calls - Fremdsprachige Artikel bleiben unuebersetzt (headline_de/content_de NULL) Hintergrund: Bei Lage 6 Irankonflikt sind 10.210 Artikel ohne DE-Uebersetzung aufgelaufen. Pro Refresh werden 2042 Batches sequentiell gestreamt (~25s/Batch -> 13.5h Gesamtdauer pro Refresh), was den Pipeline-Step factcheck blockiert und die Queue lahmlegt. Bis das Performance-Thema geloest ist (Parallelisierung, Relevanz-Filter, Hard-Cap), wird der Agent live deaktiviert. Zustand spaeter ueber .env wieder aktivierbar. Live-.env wurde mit TRANSLATOR_ENABLED=false ergaenzt.	2026-05-03 20:43:39 +00:00
Claude Code	9078489d0a	fix(orchestrator): Auto-Refresh nicht direkt nach Cancel/Error neu einreihen - main.py: Auto-Refresh-Filter beruecksichtigt jetzt auch cancelled und error - orchestrator.py: Queue-Cancels schreiben jetzt einen cancelled-Eintrag ins refresh_log via _log_queued_cancellation Wirkung: Nach Cancel oder Error startet die Lage erst beim naechsten regulaeren Slot wieder. refresh_mode bleibt unveraendert. (Identisch zu Commit auf main, develop nachgezogen.)	2026-05-03 19:30:04 +00:00
Claude Code	e517de7404	fix(orchestrator): Auto-Refresh nicht direkt nach Cancel/Error neu einreihen Der Auto-Refresh-Scheduler hat seinen letzten relevanten refresh_log-Eintrag bisher mit Filter status IN (completed, running) gesucht. Cancelled- und Error-Laeufe wurden ignoriert, der davor liegende Completed wurde genommen. Ergebnis: Direkt nach Cancel oder Error wurde der Slot als faellig gesehen und nach 60 Sekunden wieder eingereiht (Endlos-Loop bei Iran-Konflikt heute, 4x error in Folge ohne Pause). - main.py: Filter erweitert auf status IN (completed, running, cancelled, error) - orchestrator.py: Queue-Cancels schreiben jetzt auch einen cancelled-Eintrag ins refresh_log via _log_queued_cancellation (vorher: stiller Discard, kein Fingerabdruck im Log -> Auto-Refresh erkannte den Cancel nie) Wirkung: Nach Cancel oder Error startet die Lage erst beim naechsten regulaeren Slot wieder. refresh_mode bleibt unveraendert.	2026-05-03 19:30:02 +00:00
IntelSight_Admin	07c3fed9c8	Promote develop → main (2026-05-03 15:21 UTC)	2026-05-03 17:21:40 +02:00
IntelSight_Admin	24d7500152	Release-Notes: Übersichtlichere Navigation in der Seitenleiste	2026-05-03 17:21:37 +02:00
Claude Code	f0fe35b279	Sidebar Feedback-Button: mail-Icon (Brief) statt message-square	2026-05-03 15:14:59 +00:00
Claude Code	fb6e9fff19	Sidebar: Quellen+Feedback-Buttons mit Lucide-Icons + kuerzerem Text Quellen verwalten -> Quellen (mit database-Icon) Feedback senden -> Feedback (mit message-square-Icon) Tooltip behaelt den vollen Text fuer Mouseover.	2026-05-03 15:14:05 +00:00
IntelSight_Admin	6a24d0b51d	Promote develop → main (2026-05-03 14:30 UTC)	2026-05-03 16:30:36 +02:00
Claude Code	b1a0e97a34	Pipeline: bei Lagen-Wechsel auf bereits-queued Lage automatisch beginQueue Wenn der User in der Sidebar auf eine Lage klickt, die schon in Queue wartet, ruft bindToIncident() die API auf und kriegt den letzten gespeicherten Pipeline-Stand (alles done = gruen). Das ist falsch fuer queued-Status. Fix: nach API-Load pruefen, ob die Lage in App._refreshingIncidents ist UND in UI._progressState mit step=queued -> beginQueue() selbst ausloesen. Damit zeigt die Pipeline grau, sobald man auf die queued-Lage wechselt.	2026-05-03 14:27:20 +00:00
Claude Code	77797f6027	Refresh-Modal: Titel je nach Status (queued/cancelling/laeuft) Bisher hing der Titel nur an state.isFirst -> stand auch "Aktualisierung laeuft" wenn die Lage tatsaechlich noch in der Queue wartete. Jetzt: - queued -> "In Warteschlange" (mit Position #N falls vorhanden) - cancelling -> "Wird abgebrochen…" - isFirst -> "Erste Recherche laeuft" - sonst -> "Aktualisierung laeuft"	2026-05-03 14:18:17 +00:00
Claude Code	dc51ecafe8	Pipeline-Snapshot: Mini-Pipeline auch zuruecksetzen beginQueue() und _restoreSnapshot() haben bisher nur _render() aufgerufen, aber NICHT _renderMini(). Daher blieben die kleinen Pipeline-Icons im "Aktualisierung laeuft"-Modal gruen, obwohl die Lage in Queue war. Fix: an beiden Stellen auch _renderMini() aufrufen.	2026-05-03 14:15:27 +00:00
Claude Code	31fa17465a	Pipeline-Icons: Snapshot/Restore bei Queue + Cancel Vorher: - Lage refreshen -> Lage geht in Queue, aber Pipeline-Icons bleiben gruen mit Haekchen vom letzten Refresh (suggeriert faelschlich "alles fertig") - Cancel/Error -> Pipeline bleibt im Mix-Zustand (teils active, teils pending) Nachher: - pipeline.beginQueue(id): macht Snapshot des aktuellen _stateByKey und setzt alle Steps auf pending. Ausgeloest aus app.js handleRefresh() und _restoreRefreshingState() (auch nach F5). - _onRefreshDoneSuccess: Snapshot verwerfen + API-Reload (wie bisher). - _onRefreshDoneCancel: Snapshot zurueckspielen -> vorheriger gruener Stand sichtbar. - _onRefreshDoneError: gleiches Verhalten wie Cancel. - bindToIncident: Snapshot mitloeschen (lagen-spezifisch). - Bei zweitem Refresh ohne Cancel dazwischen wird Snapshot bewusst ueberschrieben.	2026-05-03 14:10:56 +00:00
IntelSight_Admin	eaffd70575	Promote develop → main (2026-05-03 13:47 UTC)	2026-05-03 15:47:34 +02:00
Claude Code	2a654cc882	AI-Disclaimer: Modell-Name (Claude/Anthropic) aus Text entfernt	2026-05-03 13:42:35 +00:00
Claude Code	6293cef91e	Banner-Text + AI-Disclaimer-Modal + Translator-Robustheit #28 Banner-Text bei Token-Budget aufgebraucht: - middleware/license_check.py + static/js/app.js: Statt "Bitte Verwaltung kontaktieren" jetzt konkreter Upgrade-Pfad mit info@aegis-sight.de. #29 AI-Hallucination-Disclaimer: - Neue static/js/ai-disclaimer.js (analog zu update-system.js): IIFE-Modul, localStorage-versioniert (aegis_ai_disclaimer_seen=v1), inline-CSS mit Theme-Variablen, Modal mit Lucide-Info-Icon. - Wird beim ersten Login einmalig gezeigt; ueber Header-User-Dropdown Eintrag "Ueber KI-Inhalte" jederzeit erneut oeffenbar. - dashboard.html: Script-Tag + Dropdown-Button mit Lucide-SVG. - style.css: kleiner Stil-Block fuer .header-dropdown-action. Translator-Robustheit (Bonus): - agents/translator.py: Parser akzeptiert jetzt auch von Claude wrapped Antworten ({{translations: [...]}}, {{items: [...]}}, einzelnes Object). Behebt Wrapper-Bug der gestern beim Backfill 75% der Calls fehlschlagen liess. - Prompt deutlicher: "flaches JSON-Array, kein Wrapper".	2026-05-03 13:29:19 +00:00
IntelSight_Admin	46864c5457	Promote develop → main (2026-05-03 00:07 UTC)	2026-05-03 02:07:08 +02:00
Claude Code	a6f36be9c6	Translator-Agent: dedizierter Haiku-Pass fuer fehlende DE-Uebersetzungen Bisher haben translations als Teil der Analyzer-JSON-Antwort gelebt ("translations": [...]). Bei vielen Artikeln pro Refresh hat das LLM die Translations regelmaessig weggelassen (Output-Token-Druck), insbesondere content_de (lange Texte werden zuerst gestrichen). Folge: viele englische Artikel ohne deutsche Headline/Inhalt im Frontend. Aenderungen: - Neuer Agent src/agents/translator.py: * translate_articles_batch / translate_articles * Nutzt CLAUDE_MODEL_FAST (Haiku) - billig * Batch-Size 5 (mit Reserve gegen Output-Truncate) * Robustes JSON-Parsing: Markdown-Codefence, Truncate-Fallback, extrahiert auch unvollstaendige Antworten * Idempotent: Caller filtert auf fehlende headline_de/content_de - analyzer.py: translations aus 4 Prompt-Templates entfernt (adhoc/research x analyze/enhance) und Fallback-Return-Dict bereinigt -> Analyzer-Output wird kompakter und zuverlaessiger - orchestrator.py: * Alter Translation-INSERT-Block entfernt (analysis.translations wird nicht mehr genutzt) * Nach Analyse + db.commit + cancel-check neuer Translator-Call: SELECT WHERE language!=de AND (headline_de OR content_de fehlt), translate_articles, normalize_german_umlauts, COALESCE-UPDATE * Vor post_refresh_qc -> normalize_umlaut_articles greift auch frische Uebersetzungen * Failure-tolerant: Translator-Fehler bricht Refresh nicht ab Backfill: migrations/migrate_translations_2026-05-03.py im Verwaltungs-Repo.	2026-05-03 00:04:59 +00:00
IntelSight_Admin	1f4d7b1837	Promote develop → main (2026-05-03 00:02 UTC)	2026-05-03 02:02:20 +02:00
Claude Code	98c9da64b0	Umlaut-Normalisierung an drei Stellen + auch articles im QC Fix fuer ASCII-Umlaute in Headlines/Inhalten (Gespraeche statt Gespraeche). Zwei Quellen des Problems: 1. Quellen wie dpa-AFX, Telegram TASS/RIA liefern Headlines schon ASCII-fiziert 2. LLM-Uebersetzungen drift en gelegentlich zu ae/oe/ue trotz Prompt Aenderungen: - rss_parser.py: nach html_to_text auch normalize_german_umlauts auf title und summary anwenden (sicher, hunspell-Dict ignoriert englische Woerter wie Boeing/Business) - orchestrator.py:1418 Translation-INSERT: headline_de und content_de durch normalize_german_umlauts schicken (LLM-Drift abfangen) - post_refresh_qc.py: neue Funktion normalize_umlaut_articles als Sicher- heitsnetz analog zu normalize_umlaut_fields. Behandelt headline_de und content_de aller Artikel des Incidents; bei language=de zusaetzlich headline und content_original. Wird in run_post_refresh_qc nach normalize_umlaut_fields aufgerufen. Backfill: migrations/migrate_umlauts_2026-05-03.py (im Verwaltungs-Repo)	2026-05-02 23:26:19 +00:00
Claude Code	307f0a1868	RSS-Parser: HTML aus summary strippen vor Speicherung Ursache des Bugs: feedparser.entry.summary liefert bei vielen Quellen (Guardian, AP, Sueddeutsche, Golem, Bellingcat, ...) HTML-kodierten Text (<p>, <a>, <ul>, ...). Der Parser hat diesen 1:1 in articles.content_original und content_de gespeichert. Folge: - UI rendert HTML-Tags als Text in Timeline-Karten - KI-Agenten (analyzer, entity_extractor, factchecker) bekommen HTML-Muell als Analyse-Input -> schwaechere Ergebnisse - _is_german-Sprachheuristik wird durch Tags verzerrt - 1000-Zeichen-Cap wird durch Tags + Tracking-URLs verbraucht Fix: html_to_text aus feeds/transcript_extractors/_common.py wiederverwenden, strippt Tags + decodiert HTML-Entities (inkl. dt. Umlaute) + normalisiert Whitespace. Wird auf summary direkt nach entry.get angewandt -> betrifft sowohl Match-Logik (text-Variable) als auch INSERT (content_original/de). Backfill-Migration: migrations/migrate_html_strip_2026-05-03.py im Verwaltungs-Repo, behandelt bestehende DB-Eintraege rueckwirkend.	2026-05-02 23:13:32 +00:00