AegisSight-Monitor

Autor	SHA1	Nachricht	Datum
Claude Dev	f60edb42f7	Fix broken source links caused by LLM-generated letter suffixes (e.g. 1383a) The LLM occasionally generates source references with letter suffixes (e.g. [1383a], [1396b]) despite being instructed not to. This caused broken links because the sources array only contained integer nr values. Backend: Add _sanitize_sources() to strip letter suffixes after parsing and deduplicate, preferring entries with valid URLs. Frontend: Add fallback in citation renderer - when a suffix reference like [1383a] has no matching source with URL, fall back to the base number [1383]. Also cleaned up 99 broken suffix entries and 44 suffix references in the Irankonflikt incident (ID 6) database records. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-03-23 23:47:02 +01:00
Claude Dev	bbd4821011	fix: Quellenlinks mit Buchstaben-Suffix ([389a] etc.) korrekt verlinken Probleme: - Frontend-Regex matchte nur reine Zahlen, nicht [389a]-Style Refs - 17 alphanumerische Quellen im Irankonflikt blieben unverlinkt - Orchestrator-Validierung erkannte diese Refs nicht als fehlend Fixes: - Frontend: Regex erweitert auf [\d+a-z?], Vergleich mit String und Number - Orchestrator: Validierung erkennt jetzt auch alphanumerische Refs - Analyzer-Prompts: Explizite Anweisung, nur ganze Zahlen als Nr zu verwenden - 822a und 859a in Irankonflikt sources_json nachgetragen - Cache-Buster aktualisiert Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-03-16 11:34:55 +01:00
Claude Dev	aad473a568	feat: Quelleneinordnung (Bias) in Lageberichten fuer kritische Quellen Parteiische Quellen (pro-russisch, pro-iranisch, rechtsextrem etc.) werden jetzt im Lagebericht-Fliesstext als solche gekennzeichnet, damit der Leser die Informationen einordnen kann. Aenderungen: - Orchestrator reichert Artikel mit source_bias aus der sources-Tabelle an - Analyzer zeigt Einordnung im Artikel-Kontext fuer den Claude-Prompt - Alle 4 Prompt-Templates enthalten neue Regel zur Quellenkennzeichnung Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-03-16 10:53:36 +01:00
Claude Dev	a5a10cb46f	Wörterlimit aus Analyse-Prompts entfernt Lagebilder sollen so ausführlich wie nötig erstellt werden. Alle 4 Templates (Analyse, Briefing, inkrementell) angepasst. Inkrementelle Analyse behält nun alle Themenabschnitte bei statt aggressiv zu kürzen.	2026-03-14 21:44:57 +01:00
Claude Dev	08aad935c9	refactor: Quellen-Merge vom KI-Prompt in Python-Code verlagern Claude liefert bei der Analyse nur noch neue Quellen statt alle bisherigen zu wiederholen. Der Merge mit bestehenden Quellen passiert deterministisch im Code. Spart Tokens und verhindert das versehentliche Vergessen von Quellen. Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-12 19:08:13 +01:00
claude-dev	91d412a797	fix: Robuster JSON-Parser fuer Analyse-Antworten Analyse-Antworten von Claude wurden bei langen Outputs nicht korrekt geparst, wodurch das Lagebild-Briefing eingefroren blieb. Neuer Parser mit 4-stufigem Fallback: direktes Parsen, Regex-Extraktion, Reparatur abgeschnittenes JSON, Regex-Fallback fuer Summary. Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-11 10:34:30 +01:00
claude-dev	61ca1f54f9	fix: Keine Gedankenstriche (em/en-dash) in Lageberichten Regel in alle 4 Analyse-Prompt-Templates eingefuegt: Claude soll keine Gedankenstriche verwenden, sondern Kommas, Doppelpunkte oder neue Saetze. Bestehende Dashes in DB (Summary + 76 Snapshots) bereinigt. Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-10 07:37:03 +01:00
claude-dev	6b11d643b9	Fix: Analyse-Parser erkennt jetzt Markdown-Code-Fences Claude-Antworten mit ```json ... ``` Wrapping werden korrekt geparst. Verhindert den Verlust von Analyse-Ergebnissen bei inkrementellen Refreshes. Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-09 20:55:08 +01:00
claude-dev	7734eefd35	Dynamische Keyword-Extraktion fuer RSS-Filterung + min_matches-Fix - researcher.py: Neuer dedizierter Haiku-Call extract_dynamic_keywords() analysiert die letzten 30 Headlines und generiert 5 DE+EN Begriffspaare - orchestrator.py: Dynamische Keywords vor Feed-Selektion aus DB-Headlines - rss_parser.py: min_matches auf max 2 gedeckelt (vorher n/2, bei 10 Keywords = 5) - analyzer.py: Fettdruck-Anweisungen entfernt Vorher: 0 RSS-Treffer (min_matches=5 unerreichbar) Nachher: 22 RSS-Treffer (Tagesschau 11, Al Jazeera 5, BBC 4, NYT 2) Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-07 23:12:17 +01:00
claude-dev	d274a9c9b6	Fix: Echte UTF-8-Umlaute in KI-generierten Inhalten erzwingen - Claude CLI Umgebung: LANG=C.UTF-8, LC_ALL=C.UTF-8 setzen - Alle 10 Agent-Prompts: Explizite Anweisung für echte Umlaute (ä,ö,ü,ß) statt Umschreibungen (ae,oe,ue,ss) - Betrifft: Researcher, Analyzer, Factchecker (jeweils initial + inkrementell) Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-05 17:28:36 +01:00
claude-dev	3d9a827bc8	Inkrementelle Analyse + Token-Optimierung + Relevanz-Scoring TOKEN-OPTIMIERUNG: - Inkrementelle Analyse: Folge-Refreshes senden nur noch das bisherige Lagebild + neue Artikel an Claude (statt alle Artikel erneut). Spart ~60-70% Tokens bei Lagen mit vielen Artikeln. - Inkrementeller Faktencheck: Bestehende Fakten als Zusammenfassung, nur neue Artikel werden vollstaendig geprueft. - Modell-Steuerung: Feed-Selektion nutzt jetzt Haiku (CLAUDE_MODEL_FAST) statt Opus. Spart ~50-70% bei Feed-Auswahl. - Set-basierte DB-Deduplizierung: Bestehende URLs/Headlines einmal in Sets geladen statt N*M einzelne DB-Queries pro Artikel. INHALTLICHE VERBESSERUNGEN: - Relevanz-Scoring: Artikel nach Keyword-Dichte (40%), Quellen-Reputation (30%), Inhaltstiefe (20%), RSS-Score (10%). - Flexibles RSS-Matching: min. Haelfte der Keywords statt alle. RSS-Artikel bekommen einen relevance_score. - Fuzzy Claim-Matching: SequenceMatcher (0.7) statt exakter String-Vergleich. Verhindert Duplikat-Akkumulation. - Translation-Fix: Nur gueltige DB-IDs (isinstance int). - Researcher: WebFetch fuer Top-Artikel, erweiterte Zusammenfassungen. DATEIEN: - config.py: CLAUDE_MODEL_FAST - claude_client.py: model-Parameter - researcher.py: Haiku Feed-Selektion, erweiterte Prompts - analyzer.py: Inkrementelle Analyse + analyze_incremental() - factchecker.py: Inkrementeller Check + Fuzzy-Matching - orchestrator.py: Set-Dedup, Relevanz-Scoring, inkrementeller Flow - rss_parser.py: Flexibles Keyword-Matching + relevance_score	2026-03-04 20:22:47 +01:00
claude-dev	71296edb97	Großes Cleanup: Bugs fixen, Features fertigstellen, toten Code entfernen Bugs behoben: - handleEdit() async keyword hinzugefügt (E-Mail-Checkboxen funktionieren jetzt) - parseUTC() Funktion definiert (Fortschritts-Timer nutzt Server-Startzeit) - Status cancelling wird im Frontend korrekt angezeigt Features fertiggestellt: - Sidebar: Lagen nach Typ getrennt (adhoc/research) mit Zählern - Quellen-Bearbeiten: Edit-Button pro Quelle, Formular vorausfüllen - Lizenz-Info: Org-Name und Lizenzstatus im Header angezeigt Toter Code entfernt: - 5 verwaiste Dateien gelöscht (alte rss_parser, style.css, components.js, layout.js, setup_users) - 6 ungenutzte Pydantic Models entfernt - Ungenutzte Funktionen/Imports in auth.py, routers, agents, config - Tote API-Methoden, Legacy-UI-Methoden, verwaiste WS-Handler - Abgeschlossene DB-Migrationen aufgeräumt Sonstiges: - requirements.txt: passlib[bcrypt] durch bcrypt ersetzt - Umlaute korrigiert (index.html) - CSS: incident-type-label → incident-type-badge, .login-success hinzugefügt - Schließen statt Schliessen im Feedback-Modal	2026-03-04 18:45:38 +01:00
claude-dev	8312d24912	Initial commit: AegisSight-Monitor (OSINT-Monitoringsystem)	2026-03-04 17:53:18 +01:00

13 Commits