AegisSight-Monitor

Autor	SHA1	Nachricht	Datum
claude-dev	a579e2c275	Neueste Entwicklungen aus Lagebild statt aus Artikel-Strom Bisher extrahierte der Generator Bullets direkt aus den neu eingesammelten Artikeln und mergte sie mit den bestehenden Developments. Das fuehrte zu zwei wiederkehrenden Problemen: 1. Off-topic Artikel, die den Keyword-Prefilter aber nicht den Topic-Filter passiert hatten, konnten als Bullet landen (die Kachel bildete dann Nebenschauplaetze des Weltgeschehens ab statt der Lage). 2. Alte Bullets blieben stehen, auch wenn sie laengst nicht mehr die 'neuesten' Entwicklungen waren — nur sehr ueberholte Eintraege fielen durch das 8-Bullet-Cap raus. Neue Logik: Der Generator nimmt das frisch erzeugte Lagebild als autoritative inhaltliche Grundlage und waehlt daraus Bullets aus, die durch eine aktuelle belegende Meldung (<~7 Tage) gestuetzt sind. Dadurch: - Thematisch sauber: Lagebild enthaelt bereits nur relevante Inhalte. - Echt 'neueste': Alte Hintergrund-Erwaehnungen im Lagebild fallen raus, weil kein aktueller Artikel sie belegt. - Klar datiert: Zeitstempel zwingend aus article.published_at der belegenden Meldung. - Kompakt: 4-6 Bullets (vorher 8), nach Zeitstempel absteigend. Kein Merge mit previous_developments mehr — bei jedem Refresh neu generiert (behebt das Drift-Problem). previous_developments bleibt nur als Fallback, falls der Generator im Einzelfall 0 Bullets parst.	2026-04-21 14:23:18 +00:00
claude-dev	60b8646fe4	Semantischer Topic-Filter gegen off-topic Keyword-Zufallstreffer Neue Artikel passieren jetzt vor DB-Speicherung einen Haiku-Relevanzfilter (AnalyzerAgent.filter_relevant_articles), der Artikel verwirft, die nur auf generische Keywords matchen, aber das Kernthema der Lage nicht inhaltlich behandeln. Bei Parsing-/API-Fehler oder 100%-Rejection: Fallback auf unveraenderte Kandidatenliste. Orchestrator trennt DB-Dedup und INSERT, damit der Filter nur auf neue Kandidaten laeuft (Kostenoptimierung). LATEST_DEVELOPMENTS-Prompt erhaelt zusaetzliche Relevanz-Gate-Regel als zweite Sicherung. Hintergrund: Incident 'Russische Militaerblogger' sammelte bisher Iran-, Nahost- und allgemeine Ukraine-Artikel ein, weil Keyword-Match ab 2 von 8 Begriffen ('iran', 'russland', 'drohne', ...) genuegt. Der semantische Filter verwirft solche Zufallstreffer.	2026-04-21 12:01:56 +00:00
claude-dev	34be98edaf	Latest-Developments: Bullet-Format Name\|URL statt nur Name Problem: Pill-Link verwies auf falschen Post, weil sources_json fuer Telegram-Kanaele viele Eintraege mit gleichem Namen aber unterschiedlichen Post-URLs hat. Der Name-Match traf den ersten Eintrag (falschen Post). Fix: Bullet-Format von {Name, Name} auf {Name\|URL, Name\|URL} erweitert. Backend-Parser loest {M<ID>} nun zu Name\|URL auf, URL kommt direkt vom articles.source_url des belegenden Artikels. Kein sources_json-Lookup noetig, keine Name-Kollision mehr moeglich. Backend (analyzer.py): - _parse_latest_developments: articles_by_id speichert (name, url) Tuple, Items werden als Name\|URL gespeichert. Uebernommene Klammer-Items mit Pipe werden akzeptiert. Legacy-Items ohne Pipe bleiben als reiner Name. - Prompt-Regel und Output-Beispiel auf {Name\|URL, Name\|URL} erweitert. Frontend (components.js): - buildPill-Aufruf vor Pipe-Split: Name und URL getrennt, wenn URL vorhanden wird Pseudo-src {name, url} uebergeben — eindeutiger Klicklink. Ohne URL Fallback auf lookupByName in sources_json (fuer Legacy-Bullets).	2026-04-18 23:19:02 +00:00
claude-dev	8a888a17a5	Live-Monitoring: Parser toleranter (Dash optional, Datum ohne zweiten Punkt) + Backfill-Script Claude Haiku 4.5 laesst gelegentlich den fuehrenden Dash oder den zweiten Datums-Punkt im Bullet-Format weg (z.B. "[18.04 21:49]" statt "- [18.04. 21:49]"). Der strikte Parser-Regex verwarf dadurch alle Bullets. - Regex akzeptiert nun Dash als optional und zweiten Datums-Punkt als optional - Parser normalisiert Datum + Zeit auf kanonisches Format "DD.MM. HH:MM" mit Zero-Padding - Frontend-Regex analog toleranter (auch fuer Altdaten-Mix) - OUTPUT-FORMAT-Hinweis im Prompt verschaerft ("JEDE Zeile beginnt mit - ") Backfill-Skript (scripts/backfill_latest_developments.py): Laedt die N neuesten Artikel einer Lage aus der DB und ruft generate_latest_developments mit previous_developments=None auf — nuetzlich nach DB-Cleanups, wenn die inkrementelle Logik zu wenige Bullets liefert. Einmaliger Run fuer Lage #66 (Militaerblogger): 8 Bullets vom 18.04. mit aufgeloesten Quellen (Spiegel, Guardian, Bloomberg, n-tv, Telegram-Kanaele).	2026-04-18 21:14:44 +00:00
claude-dev	89ab158202	Live-Monitoring: Quellen-IDs deterministisch aufloesen, Bias-Markierung raus Aenderung am Grund-Mechanismus: LLM liefert pro Bullet die Meldungs-IDs im Format {M<ID>, M<ID>}, das Backend loest die IDs gegen new_articles zu Quellen-Namen auf und schreibt {Reuters, Rybar} in die DB. Uebernommene Bullets aus previous_developments behalten ihre bestehende {Name}-Klammer. Bullets ohne Quellen-Klammer oder mit unaufloesbarer Klammer werden vom Parser verworfen — dadurch existiert "Keine Quelle" nicht mehr. Frontend: Bias-Farbcodierung (pro-RU, staatsnah) + zugehoerige Heuristik _classifyBias/_biasLabel entfernt. Kein Sonderfall-Rendering fuer leere Pills mehr.	2026-04-18 20:50:46 +00:00
claude-dev	5c95d85871	Live-Monitoring: Quellen-Namen pro Bullet (Prompt + Frontend-Parser) Der LATEST_DEVELOPMENTS-Prompt produzierte Bullets ohne Citations — das Frontend zeigte daher "Keine Quelle". Prompt ergaenzt: jedes Bullet endet mit {Quellenname1, Quellenname2} (geschweifte Klammern, exakte Schreibweise aus Quelle:-Zeile). Frontend-Parser extrahiert diese Klammer, matcht Namen case-insensitive gegen sources_json und erstellt klickbare Pills. Fallback fuer Legacy-Bullets: Inline-[N]-Citations werden weiterhin erkannt. Altbestand-Bullets ohne Marker erhalten beim naechsten Refresh Quellen.	2026-04-18 20:27:16 +00:00
claude-dev	15a650bfc9	QC: Umlaut-Normalisierung + Prompt-Ergaenzung Drei unabhaengige Schutzschichten gegen falsche Umschreibungen (ae/oe/ue/ss statt ä/ö/ü/ß) im Lagebild: 1. Prompt-Ergaenzung in INCREMENTAL_ANALYSIS_PROMPT_TEMPLATE und INCREMENTAL_BRIEFING_PROMPT_TEMPLATE (analyzer.py): explizite Priorisierung, dass die Regel "echte UTF-8-Umlaute" Vorrang vor "bestehende Formulierungen beibehalten" hat. Adressiert den Fall, dass Claude beim inkrementellen Update Altlasten weitertraegt. 2. Deterministische Normalisierung in post_refresh_qc.py: - normalize_german_umlauts(text) - Regex mit Wortgrenzen, case- preserving, Whitelist-tauglich, ~140 Eintraege im Woerterbuch abgeleitet aus den 140 Hard-Hits in Lage #6 - normalize_umlaut_fields(db, incident_id) - laedt summary und latest_developments, normalisiert, schreibt nur bei Aenderungen zurueck (idempotent) - Eingehaengt in run_post_refresh_qc() nach dem Location-Check, Fehler stoppen die Pipeline nicht (identisches Muster wie bestehende Checks) 3. scripts/bootstrap_umlaut_repair.py - Einmal-Skript zur Bestandsbereinigung der bereits gespeicherten summary-Felder. Idempotent. Beim initialen Lauf auf Produktiv-DB: 14 Lagen aktualisiert, 431 Ersetzungen insgesamt, Lage #6 von 140 auf 15 Rest-Treffer reduziert. Whitelist (leer): aktuell kein Konflikt zwischen deutschen Ziel- Woertern und englischen Fremdwoertern. Kann bei Bedarf erweitert werden ohne Schema-Aenderung. Verifikation: - py_compile OK fuer alle drei Dateien - Service-Restart ohne Errors - Unit-Tests: positive Faelle ("Oeffnung der Strasse" -> 4 Ersetzungen), Whitelist ("Boeing liefert Business-Access" -> 0 Ersetzungen), Komposita ("Wasserstrasse", "Parlamentspraesident") korrekt - Bootstrap 2x ausgefuehrt (erster Lauf 288 Ersetzungen, zweiter 143 nach Dict-Erweiterung), kumulativ 431 Architektur bleibt dormant ohne Daten-Altlasten: wenn keine Lage Umschreibungen enthaelt, arbeitet normalize_umlaut_fields in <1ms und schreibt nichts. Kein Overhead im Refresh-Pfad.	2026-04-18 14:00:00 +00:00
claude-dev	d6c541cb95	Neueste Entwicklungen: Kachel fuer adhoc-Lagen - DB-Migration: Spalte latest_developments (TEXT) in incidents - Analyzer: neuer Prompt LATEST_DEVELOPMENTS_PROMPT_TEMPLATE und Methode generate_latest_developments() liefert chronologische Bullet-Liste (max. 8, neueste oben, Zeitstempel DD.MM. HH:MM) - Orchestrator: nach Analyse+Faktencheck ein Extra-Schritt nur fuer incident_type=adhoc, der die neue Kachel fortschreibt - Analyzer-Prompts (Erst- und inkrementell): erzeugen KEINE Zusammenfassung-Sektion mehr im Lagebild (vermeidet Duplikat mit der neuen Kachel) - models.IncidentResponse um latest_developments erweitert - Frontend: Rendering der Kachel in app.js	2026-04-18 11:47:10 +00:00
claude-dev	acfc74ffe7	Standard-Opus auf claude-opus-4-7 festlegen (statt CLI-Default)	2026-04-16 22:19:26 +00:00
claude-dev	db662f4538	Zusammenfassung: Kompatibilitaet mit bestehendem ÜBERBLICK - Frontend + Backend erkennen jetzt sowohl ## ZUSAMMENFASSUNG als auch ## ÜBERBLICK als Zusammenfassungs-Sektion - Inkrementelles Prompt weist Modell an, ÜBERBLICK in ZUSAMMENFASSUNG umzubenennen und als Bullet-Points zu formatieren - Bestehende Lagen zeigen Zusammenfassung sofort in der Kachel	2026-04-11 22:12:23 +00:00
claude-dev	fa12d4cfd6	Export: Zusammenfassung-Sektion, Checkbox-Auswahl, neue Reihenfolge Research-Briefings: - Neue Sektion ZUSAMMENFASSUNG mit Bullet-Points als erstes Element - UEBERBLICK entfernt, durch ZUSAMMENFASSUNG ersetzt - Inkrementelles Briefing ebenfalls angepasst Export-System: - Zusammenfassung wird direkt aus dem Bericht extrahiert (kein separater KI-Aufruf mehr fuer Research-Lagen) - Reihenfolge: Zusammenfassung > Recherchebericht > Faktencheck > Quellen > Timeline - Sections-basiert statt scope-basiert (rueckwaertskompatibel) - Checkbox-Dialog statt Radio-Buttons im Frontend - Bereiche: Zusammenfassung, Recherchebericht, Faktencheck, Quellen, Timeline, Karte - PDF und DOCX Templates angepasst - Backend akzeptiert sections-Parameter (kommagetrennt)	2026-04-11 20:56:04 +00:00
claude-dev	f2469093ee	Revert "Feature: Analyse-Anweisungen (Direktiven) fuer Tabellen und Zusammenfassung" This reverts commit `e0bcd85d90`.	2026-04-10 19:34:25 +00:00
claude-dev	e0bcd85d90	Feature: Analyse-Anweisungen (Direktiven) fuer Tabellen und Zusammenfassung Nutzer koennen per Klick auf Chips Anweisungen zur Beschreibung hinzufuegen: Zusammenfassung, Vergleichstabelle, Zeitverlauf, Pro/Contra oder eigene Tabellen. Format: [TABELLE: ...] und [ZUSAMMENFASSUNG]. Mehrere Anweisungen moeglich. Analyzer-Prompts beachten diese Anweisungen verbindlich. Beschreibung-generieren bewahrt bestehende Direktiven. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-10 18:37:04 +00:00
claude-dev	565ce84abf	Feature: Markdown-Tabellen in Lagebildern Analyzer-Prompts erlauben jetzt Tabellen wenn Daten sich strukturiert vergleichen lassen (Produkte, Modelle, Kennzahlen etc.). Frontend parst Markdown-Tabellensyntax und rendert sie als HTML-Tabellen mit passendem Styling. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-04-10 17:41:07 +00:00
Claude Dev	f60edb42f7	Fix broken source links caused by LLM-generated letter suffixes (e.g. 1383a) The LLM occasionally generates source references with letter suffixes (e.g. [1383a], [1396b]) despite being instructed not to. This caused broken links because the sources array only contained integer nr values. Backend: Add _sanitize_sources() to strip letter suffixes after parsing and deduplicate, preferring entries with valid URLs. Frontend: Add fallback in citation renderer - when a suffix reference like [1383a] has no matching source with URL, fall back to the base number [1383]. Also cleaned up 99 broken suffix entries and 44 suffix references in the Irankonflikt incident (ID 6) database records. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-03-23 23:47:02 +01:00
Claude Dev	bbd4821011	fix: Quellenlinks mit Buchstaben-Suffix ([389a] etc.) korrekt verlinken Probleme: - Frontend-Regex matchte nur reine Zahlen, nicht [389a]-Style Refs - 17 alphanumerische Quellen im Irankonflikt blieben unverlinkt - Orchestrator-Validierung erkannte diese Refs nicht als fehlend Fixes: - Frontend: Regex erweitert auf [\d+a-z?], Vergleich mit String und Number - Orchestrator: Validierung erkennt jetzt auch alphanumerische Refs - Analyzer-Prompts: Explizite Anweisung, nur ganze Zahlen als Nr zu verwenden - 822a und 859a in Irankonflikt sources_json nachgetragen - Cache-Buster aktualisiert Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-03-16 11:34:55 +01:00
Claude Dev	aad473a568	feat: Quelleneinordnung (Bias) in Lageberichten fuer kritische Quellen Parteiische Quellen (pro-russisch, pro-iranisch, rechtsextrem etc.) werden jetzt im Lagebericht-Fliesstext als solche gekennzeichnet, damit der Leser die Informationen einordnen kann. Aenderungen: - Orchestrator reichert Artikel mit source_bias aus der sources-Tabelle an - Analyzer zeigt Einordnung im Artikel-Kontext fuer den Claude-Prompt - Alle 4 Prompt-Templates enthalten neue Regel zur Quellenkennzeichnung Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-03-16 10:53:36 +01:00
Claude Dev	a5a10cb46f	Wörterlimit aus Analyse-Prompts entfernt Lagebilder sollen so ausführlich wie nötig erstellt werden. Alle 4 Templates (Analyse, Briefing, inkrementell) angepasst. Inkrementelle Analyse behält nun alle Themenabschnitte bei statt aggressiv zu kürzen.	2026-03-14 21:44:57 +01:00
Claude Dev	08aad935c9	refactor: Quellen-Merge vom KI-Prompt in Python-Code verlagern Claude liefert bei der Analyse nur noch neue Quellen statt alle bisherigen zu wiederholen. Der Merge mit bestehenden Quellen passiert deterministisch im Code. Spart Tokens und verhindert das versehentliche Vergessen von Quellen. Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-12 19:08:13 +01:00
claude-dev	91d412a797	fix: Robuster JSON-Parser fuer Analyse-Antworten Analyse-Antworten von Claude wurden bei langen Outputs nicht korrekt geparst, wodurch das Lagebild-Briefing eingefroren blieb. Neuer Parser mit 4-stufigem Fallback: direktes Parsen, Regex-Extraktion, Reparatur abgeschnittenes JSON, Regex-Fallback fuer Summary. Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-11 10:34:30 +01:00
claude-dev	61ca1f54f9	fix: Keine Gedankenstriche (em/en-dash) in Lageberichten Regel in alle 4 Analyse-Prompt-Templates eingefuegt: Claude soll keine Gedankenstriche verwenden, sondern Kommas, Doppelpunkte oder neue Saetze. Bestehende Dashes in DB (Summary + 76 Snapshots) bereinigt. Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-10 07:37:03 +01:00
claude-dev	6b11d643b9	Fix: Analyse-Parser erkennt jetzt Markdown-Code-Fences Claude-Antworten mit ```json ... ``` Wrapping werden korrekt geparst. Verhindert den Verlust von Analyse-Ergebnissen bei inkrementellen Refreshes. Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-09 20:55:08 +01:00
claude-dev	7734eefd35	Dynamische Keyword-Extraktion fuer RSS-Filterung + min_matches-Fix - researcher.py: Neuer dedizierter Haiku-Call extract_dynamic_keywords() analysiert die letzten 30 Headlines und generiert 5 DE+EN Begriffspaare - orchestrator.py: Dynamische Keywords vor Feed-Selektion aus DB-Headlines - rss_parser.py: min_matches auf max 2 gedeckelt (vorher n/2, bei 10 Keywords = 5) - analyzer.py: Fettdruck-Anweisungen entfernt Vorher: 0 RSS-Treffer (min_matches=5 unerreichbar) Nachher: 22 RSS-Treffer (Tagesschau 11, Al Jazeera 5, BBC 4, NYT 2) Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-07 23:12:17 +01:00
claude-dev	d274a9c9b6	Fix: Echte UTF-8-Umlaute in KI-generierten Inhalten erzwingen - Claude CLI Umgebung: LANG=C.UTF-8, LC_ALL=C.UTF-8 setzen - Alle 10 Agent-Prompts: Explizite Anweisung für echte Umlaute (ä,ö,ü,ß) statt Umschreibungen (ae,oe,ue,ss) - Betrifft: Researcher, Analyzer, Factchecker (jeweils initial + inkrementell) Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-05 17:28:36 +01:00
claude-dev	3d9a827bc8	Inkrementelle Analyse + Token-Optimierung + Relevanz-Scoring TOKEN-OPTIMIERUNG: - Inkrementelle Analyse: Folge-Refreshes senden nur noch das bisherige Lagebild + neue Artikel an Claude (statt alle Artikel erneut). Spart ~60-70% Tokens bei Lagen mit vielen Artikeln. - Inkrementeller Faktencheck: Bestehende Fakten als Zusammenfassung, nur neue Artikel werden vollstaendig geprueft. - Modell-Steuerung: Feed-Selektion nutzt jetzt Haiku (CLAUDE_MODEL_FAST) statt Opus. Spart ~50-70% bei Feed-Auswahl. - Set-basierte DB-Deduplizierung: Bestehende URLs/Headlines einmal in Sets geladen statt N*M einzelne DB-Queries pro Artikel. INHALTLICHE VERBESSERUNGEN: - Relevanz-Scoring: Artikel nach Keyword-Dichte (40%), Quellen-Reputation (30%), Inhaltstiefe (20%), RSS-Score (10%). - Flexibles RSS-Matching: min. Haelfte der Keywords statt alle. RSS-Artikel bekommen einen relevance_score. - Fuzzy Claim-Matching: SequenceMatcher (0.7) statt exakter String-Vergleich. Verhindert Duplikat-Akkumulation. - Translation-Fix: Nur gueltige DB-IDs (isinstance int). - Researcher: WebFetch fuer Top-Artikel, erweiterte Zusammenfassungen. DATEIEN: - config.py: CLAUDE_MODEL_FAST - claude_client.py: model-Parameter - researcher.py: Haiku Feed-Selektion, erweiterte Prompts - analyzer.py: Inkrementelle Analyse + analyze_incremental() - factchecker.py: Inkrementeller Check + Fuzzy-Matching - orchestrator.py: Set-Dedup, Relevanz-Scoring, inkrementeller Flow - rss_parser.py: Flexibles Keyword-Matching + relevance_score	2026-03-04 20:22:47 +01:00
claude-dev	71296edb97	Großes Cleanup: Bugs fixen, Features fertigstellen, toten Code entfernen Bugs behoben: - handleEdit() async keyword hinzugefügt (E-Mail-Checkboxen funktionieren jetzt) - parseUTC() Funktion definiert (Fortschritts-Timer nutzt Server-Startzeit) - Status cancelling wird im Frontend korrekt angezeigt Features fertiggestellt: - Sidebar: Lagen nach Typ getrennt (adhoc/research) mit Zählern - Quellen-Bearbeiten: Edit-Button pro Quelle, Formular vorausfüllen - Lizenz-Info: Org-Name und Lizenzstatus im Header angezeigt Toter Code entfernt: - 5 verwaiste Dateien gelöscht (alte rss_parser, style.css, components.js, layout.js, setup_users) - 6 ungenutzte Pydantic Models entfernt - Ungenutzte Funktionen/Imports in auth.py, routers, agents, config - Tote API-Methoden, Legacy-UI-Methoden, verwaiste WS-Handler - Abgeschlossene DB-Migrationen aufgeräumt Sonstiges: - requirements.txt: passlib[bcrypt] durch bcrypt ersetzt - Umlaute korrigiert (index.html) - CSS: incident-type-label → incident-type-badge, .login-success hinzugefügt - Schließen statt Schliessen im Feedback-Modal	2026-03-04 18:45:38 +01:00
claude-dev	8312d24912	Initial commit: AegisSight-Monitor (OSINT-Monitoringsystem)	2026-03-04 17:53:18 +01:00

27 Commits