Zwei-Phasen-Faktencheck + parallele Analyse/Faktencheck-Ausführung

- Neuer Zwei-Phasen-Faktencheck: Haiku-Triage identifiziert betroffene Fakten, dann parallele Opus-Verifikation pro thematischer Gruppe (max 8 Fakten/Gruppe) - Analyse und Faktencheck laufen jetzt parallel via asyncio.gather - Snapshot-Erstellung vor parallele Verarbeitung verschoben - Fallback auf Standard-Faktencheck bei Triage-Fehler - Erwartete Verbesserung: ~19 Min -> ~8 Min pro Refresh bei gleichbleibender Qualität Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2026-03-09 20:16:45 +01:00
Commit 1f3b3cb858
--- a/src/agents/factchecker.py
+++ b/src/agents/factchecker.py
@@ -1,9 +1,10 @@
 """Factchecker-Agent: Prüft Fakten gegen mehrere unabhängige Quellen."""
 import asyncio
 import json
 import logging
 import re
 from difflib import SequenceMatcher
-from agents.claude_client import call_claude, ClaudeUsage
+from agents.claude_client import call_claude, ClaudeUsage, UsageAccumulator
 logger = logging.getLogger("osint.factchecker")
@@ -167,6 +168,140 @@ Jedes Element hat:
 Antworte NUR mit dem JSON-Array."""
 # --- Zwei-Phasen-Faktencheck: Prompt-Templates ---
 TRIAGE_PROMPT_TEMPLATE = """Du bist ein Triage-System für Faktenchecks eines OSINT-Lagemonitoring-Systems.
 AUSGABESPRACHE: {output_language}
 BESTEHENDE FAKTENAUSSAGEN ({fact_count} Stück):
 {existing_facts_text}
 NEUE NACHRICHTENARTIKEL ({article_count} Stück):
 {articles_text}
 AUFGABE:
 Analysiere die neuen Artikel und identifiziere:
 1. BETROFFENE BESTEHENDE FAKTEN: Welche der bestehenden Fakten könnten durch die neuen Artikel
   betroffen sein? (neue Bestätigung, Widerlegung, neue Evidenz, Status-Update nötig)
 2. NEUE FAKTENAUSSAGEN: Welche neuen prüfbaren Faktenaussagen enthalten die Artikel,
   die noch nicht in den bestehenden Fakten erfasst sind? (3-5 neue Claims)
 3. GRUPPIERUNG: Gruppiere verwandte Fakten thematisch für die parallele Batch-Verarbeitung.
   Verwandte Fakten MÜSSEN in derselben Gruppe sein. Max {max_per_group} Fakten pro Gruppe.
 WICHTIG:
 - Sei GRÜNDLICH — übersehe keine semantischen Verbindungen
 - Auch indirekte Verbindungen beachten (diplomatisch <-> militärisch <-> wirtschaftlich)
 - Alle developing/unconfirmed/unverified Fakten IMMER einbeziehen
 - Max {max_per_group} Fakten pro Gruppe (teile große Gruppen auf)
 Antworte AUSSCHLIESSLICH als JSON:
 {{{{
  "affected_fact_ids": [int, ...],
  "new_claims": ["Prüfbare Faktenaussage als vollständiger Satz", ...],
  "groups": [
    {{{{
      "id": 1,
      "theme": "Themenbezeichnung",
      "fact_ids": [int, ...],
      "new_claim_indices": [int, ...]
    }}}}
  ],
  "total_affected": int,
  "reasoning": "Kurze Begründung"
 }}}}"""
 VERIFY_GROUP_PROMPT_TEMPLATE = """Du prüfst Faktenaussagen gegen unabhängige Quellen in einem OSINT-Lagemonitoring-System.
 AUSGABESPRACHE: {output_language}
 WICHTIG: Verwende IMMER echte UTF-8-Umlaute (ä, ö, ü, ß) — NIEMALS Umschreibungen (ae, oe, ue, ss).
 THEMA DIESER GRUPPE: {theme}
 ZU PRÜFENDE BESTEHENDE FAKTEN:
 {facts_text}
 NEUE CLAIMS ZU PRÜFEN:
 {new_claims_text}
 KONTEXT (neue Nachrichtenartikel):
 {articles_text}
 ANWEISUNGEN:
 Für JEDE Faktenaussage (bestehend UND neu):
 1. Suche per WebSearch nach unabhängigen Bestätigungen oder Widerlegungen
 2. Bewerte den Status:
   - "confirmed": Mindestens 2 unabhängige Quellen mit verifizierter URL bestätigen
   - "unconfirmed": Nicht genug unabhängige Bestätigung
   - "contradicted": Glaubwürdige Quellen widersprechen
   - "developing": Lage noch im Fluss
 3. Dokumentiere die Evidenz mit konkreten, verifizierten URLs
 QUALITÄTSREGELN:
 - "confirmed" NUR bei mindestens 2 unabhängigen Quellen mit ECHTER URL
 - KEINE Halluzinationen — nur tatsächlich per WebSearch gefundene Quellen
 - Bestehende Evidenz BEIBEHALTEN, nur neue ergänzen
 - Jeder Claim MUSS eine konkrete Quellen-URL als Beleg enthalten
 Antworte AUSSCHLIESSLICH als JSON-Array:
 [
  {{{{
    "id": 123,
    "claim": "Die Faktenaussage...",
    "status": "confirmed|unconfirmed|contradicted|developing",
    "sources_count": 3,
    "evidence": "Bestätigt durch: Quelle1 (URL)\\nQuelle2 (URL)",
    "is_notification": false
  }}}}
 ]
 Für NEUE Fakten setze id auf null."""
 VERIFY_GROUP_RESEARCH_PROMPT_TEMPLATE = """Du prüfst Faktenaussagen gegen unabhängige Quellen in einem OSINT-Lagemonitoring-System.
 AUSGABESPRACHE: {output_language}
 WICHTIG: Verwende IMMER echte UTF-8-Umlaute (ä, ö, ü, ß) — NIEMALS Umschreibungen (ae, oe, ue, ss).
 THEMA DIESER GRUPPE: {theme}
 ZU PRÜFENDE BESTEHENDE FAKTEN:
 {facts_text}
 NEUE CLAIMS ZU PRÜFEN:
 {new_claims_text}
 KONTEXT (neue Quellen):
 {articles_text}
 ANWEISUNGEN:
 Für JEDE Faktenaussage (bestehend UND neu):
 1. Suche per WebSearch nach unabhängigen Bestätigungen oder Widerlegungen
 2. Bewerte den Status:
   - "established": 3+ unabhängige Quellen mit verifizierter URL
   - "unverified": Nicht unabhängig verifizierbar
   - "disputed": Verschiedene Positionen dokumentiert
   - "developing": Faktenlage im Fluss
 3. Dokumentiere die Evidenz mit konkreten, verifizierten URLs
 QUALITÄTSREGELN:
 - "established" NUR bei mindestens 3 unabhängigen Quellen mit ECHTER URL
 - KEINE Halluzinationen — nur tatsächlich per WebSearch gefundene Quellen
 - Bestehende Evidenz BEIBEHALTEN, nur neue ergänzen
 Antworte AUSSCHLIESSLICH als JSON-Array:
 [
  {{{{
    "id": 123,
    "claim": "Die Faktenaussage...",
    "status": "established|unverified|disputed|developing",
    "sources_count": 3,
    "evidence": "Bestätigt durch: Quelle1 (URL)\\nQuelle2 (URL)",
    "is_notification": false
  }}}}
 ]
 Für NEUE Fakten setze id auf null."""
 # --- Stopwords fuer Keyword-Extraktion ---
 _STOPWORDS = frozenset({
@@ -185,6 +320,10 @@ STATUS_PRIORITY = {
    "developing": 1,
 }
 # Zwei-Phasen-Faktencheck: Konfiguration
 MAX_FACTS_PER_VERIFY_GROUP = 8   # Max Fakten pro Verifikationsgruppe
 TWOPHASE_MIN_FACTS = 25          # Ab dieser Anzahl bestehender Fakten wird der Zwei-Phasen-Ansatz genutzt
 def normalize_claim(claim: str) -> str:
    """Normalisiert einen Claim fuer Aehnlichkeitsvergleich."""
@@ -381,6 +520,191 @@ class FactCheckerAgent:
            logger.error(f"Inkrementeller Faktencheck-Fehler: {e}")
            return [], None
    async def check_incremental_twophase(
        self,
        title: str,
        new_articles: list[dict],
        existing_facts: list[dict],
        incident_type: str = "adhoc",
    ) -> tuple[list[dict], ClaudeUsage | None]:
        """Zwei-Phasen inkrementeller Faktencheck: Haiku-Triage + parallele Opus-Verifikation.
        Phase 1: Haiku identifiziert betroffene Fakten und neue Claims (schnell, günstig)
        Phase 2: Opus verifiziert nur die betroffenen Fakten parallel per WebSearch
        Fällt bei Triage-Fehler auf den Standard-check_incremental zurück.
        """
        if not new_articles:
            logger.info("Zwei-Phasen-Faktencheck übersprungen: keine neuen Artikel")
            return [], None
        usage_acc = UsageAccumulator()
        # --- Phase 1: Triage (Haiku) ---
        logger.info(f"Zwei-Phasen-Faktencheck Phase 1: Triage ({len(existing_facts)} Fakten, {len(new_articles)} Artikel)")
        triage_facts_text = self._format_facts_for_triage(existing_facts)
        articles_text = self._format_articles_text(new_articles, max_articles=15)
        from config import OUTPUT_LANGUAGE, CLAUDE_MODEL_FAST
        triage_prompt = TRIAGE_PROMPT_TEMPLATE.format(
            output_language=OUTPUT_LANGUAGE,
            fact_count=len(existing_facts),
            existing_facts_text=triage_facts_text,
            article_count=len(new_articles),
            articles_text=articles_text,
            max_per_group=MAX_FACTS_PER_VERIFY_GROUP,
        )
        try:
            triage_result, triage_usage = await call_claude(
                triage_prompt, tools=None, model=CLAUDE_MODEL_FAST
            )
            if triage_usage:
                usage_acc.add(triage_usage)
        except Exception as e:
            logger.warning(f"Triage fehlgeschlagen, Fallback auf Standard-Faktencheck: {e}")
            return await self.check_incremental(title, new_articles, existing_facts, incident_type)
        # Triage-Ergebnis parsen
        triage = self._parse_triage_response(triage_result)
        if not triage:
            logger.warning("Triage-Antwort nicht parsbar, Fallback auf Standard-Faktencheck")
            return await self.check_incremental(title, new_articles, existing_facts, incident_type)
        affected_ids = set(triage.get("affected_fact_ids", []))
        new_claims = triage.get("new_claims", [])
        groups = triage.get("groups", [])
        if not groups:
            logger.warning("Triage hat keine Gruppen identifiziert, Fallback auf Standard-Faktencheck")
            return await self.check_incremental(title, new_articles, existing_facts, incident_type)
        logger.info(
            f"Triage: {len(affected_ids)} betroffene Fakten, {len(new_claims)} neue Claims, {len(groups)} Gruppen"
        )
        # --- Phase 2: Parallele Verifikation (Opus) ---
        fact_lookup = {f["id"]: f for f in existing_facts}
        async def _verify_one_group(group: dict) -> tuple[list[dict], ClaudeUsage | None]:
            """Verifiziert eine einzelne Faktengruppe."""
            group_fact_ids = group.get("fact_ids", [])
            group_new_indices = group.get("new_claim_indices", [])
            theme = group.get("theme", "Allgemein")
            group_facts = [fact_lookup[fid] for fid in group_fact_ids if fid in fact_lookup]
            group_claims = [new_claims[i] for i in group_new_indices if i < len(new_claims)]
            if not group_facts and not group_claims:
                return [], None
            # Fakten formatieren (mit Evidenz für Kontext)
            facts_text = self._format_facts_for_verify(group_facts) if group_facts else "Keine bestehenden Fakten in dieser Gruppe."
            new_claims_text = "\n".join(f"- {c}" for c in group_claims) if group_claims else "Keine neuen Claims."
            if incident_type == "research":
                template = VERIFY_GROUP_RESEARCH_PROMPT_TEMPLATE
            else:
                template = VERIFY_GROUP_PROMPT_TEMPLATE
            prompt = template.format(
                output_language=OUTPUT_LANGUAGE,
                theme=theme,
                facts_text=facts_text,
                new_claims_text=new_claims_text,
                articles_text=articles_text,
            )
            try:
                result, v_usage = await call_claude(prompt)
                facts = self._parse_response(result)
                logger.info(f"Gruppe '{theme}': {len(facts)} Fakten geprüft")
                return facts, v_usage
            except TimeoutError:
                logger.error(f"Gruppe '{theme}': Timeout")
                return [], None
            except Exception as e:
                logger.error(f"Gruppe '{theme}': Fehler: {e}")
                return [], None
        logger.info(f"Zwei-Phasen-Faktencheck Phase 2: {len(groups)} Gruppen parallel verifizieren")
        # Alle Gruppen parallel starten
        group_results = await asyncio.gather(
            *(_verify_one_group(g) for g in groups)
        )
        # Ergebnisse zusammenführen
        all_facts = []
        for facts, v_usage in group_results:
            all_facts.extend(facts)
            if v_usage:
                usage_acc.add(v_usage)
        # Kombinierte Usage erstellen
        combined_usage = ClaudeUsage(
            input_tokens=usage_acc.input_tokens,
            output_tokens=usage_acc.output_tokens,
            cache_creation_tokens=usage_acc.cache_creation_tokens,
            cache_read_tokens=usage_acc.cache_read_tokens,
            cost_usd=usage_acc.total_cost_usd,
            duration_ms=0,
        )
        logger.info(
            f"Zwei-Phasen-Faktencheck abgeschlossen: {len(all_facts)} Fakten "
            f"({usage_acc.call_count} API-Calls, ${usage_acc.total_cost_usd:.4f})"
        )
        return all_facts, combined_usage
    def _format_facts_for_triage(self, facts: list[dict]) -> str:
        """Formatiert Fakten kompakt mit IDs für die Triage."""
        lines = []
        for f in facts:
            status = f.get("status", "developing")
            claim = f.get("claim", "")
            sources = f.get("sources_count", 0)
            fid = f.get("id", "?")
            lines.append(f"- [ID:{fid}] [{status}] ({sources} Quellen) {claim}")
        return "\n".join(lines)
    def _format_facts_for_verify(self, facts: list[dict]) -> str:
        """Formatiert Fakten detailliert für die Verifikation."""
        parts = []
        for f in facts:
            evidence = (f.get("evidence") or "")[:300]
            parts.append(
                f"ID: {f.get('id', '?')}\n"
                f"Status: {f.get('status', 'developing')}\n"
                f"Claim: {f.get('claim', '')}\n"
                f"Bisherige Evidenz: {evidence}\n"
                f"Quellen: {f.get('sources_count', 0)}"
            )
        return "\n---\n".join(parts)
    def _parse_triage_response(self, response: str) -> dict | None:
        """Parst die Triage-Antwort als JSON-Objekt."""
        try:
            data = json.loads(response)
            if isinstance(data, dict) and "groups" in data:
                return data
        except json.JSONDecodeError:
            pass
        match = re.search(r'\{.*\}', response, re.DOTALL)
        if match:
            try:
                data = json.loads(match.group())
                if isinstance(data, dict) and "groups" in data:
                    return data
            except json.JSONDecodeError:
                pass
        logger.warning("Konnte Triage-Antwort nicht als JSON parsen")
        return None
    def _validate_facts(self, facts: list[dict]) -> list[dict]:
        """Validiert Fakten: confirmed/established ohne URL wird herabgestuft."""
        url_pattern = re.compile(r'https?://')
--- a/src/agents/orchestrator.py
+++ b/src/agents/orchestrator.py
@@ -9,7 +9,7 @@ from typing import Optional
 from urllib.parse import urlparse, urlunparse
 from agents.claude_client import UsageAccumulator
-from agents.factchecker import find_matching_claim, deduplicate_new_facts
+from agents.factchecker import find_matching_claim, deduplicate_new_facts, TWOPHASE_MIN_FACTS
 from source_rules import (
    _detect_category,
    _extract_domain,
@@ -764,34 +764,11 @@ class AgentOrchestrator:
                except Exception as e:
                    logger.warning(f"Quellen-Statistiken konnten nicht aktualisiert werden: {e}")
-            # Schritt 3: Analyse und Zusammenfassung
+            # Schritt 3+4: Analyse und Faktencheck PARALLEL
            if new_count > 0 or not previous_summary:
                analyzer = AnalyzerAgent()
                # Inkrementelle Analyse wenn Lagebild bereits existiert und neue Artikel vorhanden
                if previous_summary and new_count > 0:
                    logger.info(f"Inkrementelle Analyse: {new_count} neue Artikel zum bestehenden Lagebild")
                    analysis, analysis_usage = await analyzer.analyze_incremental(
                        title, description, new_articles_for_analysis,
                        previous_summary, previous_sources_json, incident_type,
                    )
                else:
                    # Erstanalyse: Alle Artikel laden
                    logger.info("Erstanalyse: Alle Artikel werden analysiert")
                    cursor = await db.execute(
                        "SELECT * FROM articles WHERE incident_id = ? ORDER BY collected_at DESC",
                        (incident_id,),
                    )
                    all_articles = [dict(row) for row in await cursor.fetchall()]
                    analysis, analysis_usage = await analyzer.analyze(title, description, all_articles, incident_type)
                if analysis_usage:
                    usage_acc.add(analysis_usage)
                if analysis:
                is_first_summary = not previous_summary
-                    # Snapshot des alten Lagebilds sichern (nur wenn schon eins existiert)
+                # Snapshot des alten Lagebilds sichern BEVOR parallele Verarbeitung startet
                if previous_summary:
                    cursor = await db.execute(
                        "SELECT COUNT(*) as cnt FROM articles WHERE incident_id = ?",
@@ -811,11 +788,84 @@ class AgentOrchestrator:
                        (incident_id, previous_summary, previous_sources_json,
                         snap_articles, snap_fcs, log_id, now, tenant_id),
                    )
                    await db.commit()
-                    # sources_json aus der Analyse extrahieren und speichern
+                # Bestehende Fakten und alle Artikel vorladen (für parallele Tasks)
                cursor = await db.execute(
                    "SELECT id, claim, status, sources_count FROM fact_checks WHERE incident_id = ?",
                    (incident_id,),
                )
                existing_facts = [dict(row) for row in await cursor.fetchall()]
                # Alle Artikel vorladen für Erstanalyse/Erstcheck
                all_articles_preloaded = None
                if not previous_summary or new_count == 0:
                    cursor = await db.execute(
                        "SELECT * FROM articles WHERE incident_id = ? ORDER BY collected_at DESC",
                        (incident_id,),
                    )
                    all_articles_preloaded = [dict(row) for row in await cursor.fetchall()]
                if self._ws_manager:
                    await self._ws_manager.broadcast_for_incident({
                        "type": "status_update",
                        "incident_id": incident_id,
                        "data": {"status": "analyzing", "detail": "Analyse und Faktencheck laufen parallel...", "started_at": now_utc},
                    }, visibility, created_by, tenant_id)
                # --- Analyse-Task ---
                async def _do_analysis():
                    analyzer = AnalyzerAgent()
                    if previous_summary and new_count > 0:
                        logger.info(f"Inkrementelle Analyse: {new_count} neue Artikel zum bestehenden Lagebild")
                        return await analyzer.analyze_incremental(
                            title, description, new_articles_for_analysis,
                            previous_summary, previous_sources_json, incident_type,
                        )
                    else:
                        logger.info("Erstanalyse: Alle Artikel werden analysiert")
                        return await analyzer.analyze(title, description, all_articles_preloaded, incident_type)
                # --- Faktencheck-Task ---
                async def _do_factcheck():
                    factchecker = FactCheckerAgent()
                    if existing_facts and new_count > 0:
                        if len(existing_facts) >= TWOPHASE_MIN_FACTS:
                            logger.info(
                                f"Zwei-Phasen-Faktencheck: {new_count} neue Artikel, "
                                f"{len(existing_facts)} bestehende Fakten"
                            )
                            return await factchecker.check_incremental_twophase(
                                title, new_articles_for_analysis, existing_facts, incident_type,
                            )
                        else:
                            logger.info(
                                f"Inkrementeller Faktencheck: {new_count} neue Artikel, "
                                f"{len(existing_facts)} bestehende Fakten"
                            )
                            return await factchecker.check_incremental(
                                title, new_articles_for_analysis, existing_facts, incident_type,
                            )
                    else:
                        return await factchecker.check(title, all_articles_preloaded or [], incident_type)
                # Beide Tasks PARALLEL starten
                logger.info("Starte Analyse und Faktencheck parallel...")
                analysis_result, factcheck_result = await asyncio.gather(
                    _do_analysis(),
                    _do_factcheck(),
                )
                analysis, analysis_usage = analysis_result
                fact_checks, fc_usage = factcheck_result
                # --- Analyse-Ergebnisse verarbeiten ---
                if analysis_usage:
                    usage_acc.add(analysis_usage)
                if analysis:
                    sources = analysis.get("sources", [])
                    sources_json = json.dumps(sources, ensure_ascii=False) if sources else None
                    new_summary = analysis.get("summary", "")
                    await db.execute(
@@ -855,50 +905,16 @@ class AgentOrchestrator:
                    await db.commit()
-                # Checkpoint 2: Cancel prüfen nach Analyse
+                # Cancel-Check nach paralleler Verarbeitung
                self._check_cancelled(incident_id)
-                if self._ws_manager:
+                # --- Faktencheck-Ergebnisse verarbeiten ---
                    await self._ws_manager.broadcast_for_incident({
                        "type": "status_update",
                        "incident_id": incident_id,
                        "data": {"status": "factchecking", "detail": "Prüft Fakten gegen unabhängige Quellen...", "started_at": now_utc},
                    }, visibility, created_by, tenant_id)
                # Schritt 4: Faktencheck
                factchecker = FactCheckerAgent()
                # Bestehende Fakten laden für inkrementellen Check
                cursor = await db.execute(
                    "SELECT id, claim, status, sources_count FROM fact_checks WHERE incident_id = ?",
                    (incident_id,),
                )
                existing_facts = [dict(row) for row in await cursor.fetchall()]
                if existing_facts and new_count > 0:
                    # Inkrementeller Faktencheck: nur neue Artikel + bestehende Fakten
                    logger.info(f"Inkrementeller Faktencheck: {new_count} neue Artikel, {len(existing_facts)} bestehende Fakten")
                    fact_checks, fc_usage = await factchecker.check_incremental(
                        title, new_articles_for_analysis, existing_facts, incident_type,
                    )
                else:
                    # Erstcheck: alle Artikel
                    cursor = await db.execute(
                        "SELECT * FROM articles WHERE incident_id = ? ORDER BY collected_at DESC",
                        (incident_id,),
                    )
                    all_articles_for_fc = [dict(row) for row in await cursor.fetchall()]
                    fact_checks, fc_usage = await factchecker.check(title, all_articles_for_fc, incident_type)
                # Pre-Dedup: Duplikate aus LLM-Antwort entfernen
                fact_checks = deduplicate_new_facts(fact_checks)
                if fc_usage:
                    usage_acc.add(fc_usage)
                # Checkpoint 3: Cancel prüfen nach Faktencheck
                self._check_cancelled(incident_id)
                # Prüfen ob dies der erste Refresh ist (keine vorherigen Faktenchecks)
                is_first_refresh = len(existing_facts) == 0