AegisSight-Monitor

Autor	SHA1	Nachricht	Datum
claude-dev	5e19736a25	Per-User Domain-Ausschlüsse + Grundquellen-Schutz - Neue Tabelle user_excluded_domains für benutzerspezifische Ausschlüsse - Domain-Ausschlüsse wirken nur für den jeweiligen User, nicht org-weit - user_id wird durch die gesamte Pipeline geschleust (Orchestrator → Researcher → RSS-Parser) - Grundquellen (is_global) können nicht mehr bearbeitet/gelöscht werden im Frontend - Grundquelle-Badge bei globalen Quellen statt Edit/Delete-Buttons - Filter Von mir ausgeschlossen im Quellen-Modal Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-08 14:30:21 +01:00
claude-dev	7734eefd35	Dynamische Keyword-Extraktion fuer RSS-Filterung + min_matches-Fix - researcher.py: Neuer dedizierter Haiku-Call extract_dynamic_keywords() analysiert die letzten 30 Headlines und generiert 5 DE+EN Begriffspaare - orchestrator.py: Dynamische Keywords vor Feed-Selektion aus DB-Headlines - rss_parser.py: min_matches auf max 2 gedeckelt (vorher n/2, bei 10 Keywords = 5) - analyzer.py: Fettdruck-Anweisungen entfernt Vorher: 0 RSS-Treffer (min_matches=5 unerreichbar) Nachher: 22 RSS-Treffer (Tagesschau 11, Al Jazeera 5, BBC 4, NYT 2) Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-07 23:12:17 +01:00
claude-dev	5ae61a1379	Geoparsing von spaCy auf Haiku umgestellt - geoparsing.py: Komplett-Rewrite (spaCy NER + Nominatim -> Haiku + geonamescache) - orchestrator.py: incident_context an geoparse_articles, category in INSERT - incidents.py: incident_context aus DB laden und an Geoparsing uebergeben - public_api.py: Locations aggregiert im Lagebild-Endpoint - components.js: response-Kategorie neben retaliation (beide akzeptiert) - requirements.txt: spaCy und geopy entfernt Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-07 22:00:40 +01:00
claude-dev	1c7adafa70	Fix: Progress-Timer zeigte negative Zahlen (-58:-10) Ursache: Server sendete started_at als Lokalzeit (Europe/Berlin), aber der Client interpretierte es als UTC via parseUTC(). Bei UTC+1 lag die Startzeit dadurch 1 Stunde in der Zukunft. - orchestrator.py: started_at in WebSocket-Nachrichten als echtes UTC (ISO 8601 mit Z-Suffix) senden, DB-Timestamps bleiben Lokalzeit - components.js: elapsed auf min. 0 clampen als Sicherheitsnetz Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-07 10:51:33 +01:00
claude-dev	f7809ccc77	Fix: TimeoutError wird nicht mehr verschluckt - Retry greift jetzt - researcher.py/factchecker.py: TimeoutError wird nach oben durchgereicht statt vom breiten except Exception geschluckt zu werden - orchestrator.py: Built-in TimeoutError zu TRANSIENT_ERRORS hinzugefuegt (war nur asyncio.TimeoutError, aber claude_client wirft TimeoutError) - config.py: CLAUDE_TIMEOUT von 300s auf 420s erhoeht Vorher: Timeout fuehrte zu "0 Artikel" ohne Retry (8 Timeouts seit 28.02.) Nachher: Timeout loest bis zu 3 Retries aus (sofort, +2min, +5min) Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-07 10:48:48 +01:00
claude-dev	a69352575d	Fix: Komplett auf Europe/Berlin + DB-Migration + Timer-Fix - ALLE Timestamps einheitlich Europe/Berlin (kein UTC mehr) - DB-Migration: 1704 bestehende Timestamps von UTC nach Berlin konvertiert - Auto-Refresh Timer Fix: ORDER BY id DESC statt completed_at DESC (verhindert falsche Sortierung bei gemischten Timestamp-Formaten) - started_at statt completed_at fuer Timer-Vergleich (konsistenter) - Manuelle Refreshes werden bei Intervall-Pruefung beruecksichtigt - Debug-Logging fuer Auto-Refresh Entscheidungen - astimezone() fuer Timestamps mit Offset-Info Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-07 02:56:51 +01:00
claude-dev	a8e9f34ff8	Fix: UTC fuer interne Timer, Berlin nur fuer Anzeige Korrektur: Alle DB-Timestamps (refresh_log, created_at, updated_at, auth, notifications) bleiben UTC fuer korrekte Timer-Vergleiche. Europe/Berlin nur fuer angezeigte Werte (Exporte, Prompts, API). Verhindert zu fruehes Ausloesen des Auto-Refresh-Timers. Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-07 02:40:02 +01:00
claude-dev	706d0b49d6	Fix: Alle Timestamps einheitlich auf Europe/Berlin Zeitzone Inkonsistenz behoben: Manche Timestamps wurden in UTC, andere in Berlin-Zeit gespeichert. Das fuehrte zu Fehlern beim Auto-Refresh und Faktencheck, da Zeitvergleiche falsche Ergebnisse lieferten. Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-07 02:37:30 +01:00
claude-dev	32f0281a96	Refactor: Email statt Username als Anzeige-Identifier - Header zeigt volle Email statt Username - Lagen-Karten/Sidebar zeigen Email-Prefix (vor dem @) als Ersteller - Feedback-Emails nutzen Email-Prefix statt Username - Login/Notification-Emails nutzen Email-Prefix als Anrede - DB-Queries holen email statt username für Ersteller-Anzeige Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-05 18:55:24 +01:00
claude-dev	536e7f585b	Feat: Claude-Keywords für RSS-Suche, Jahreszahlen-Filter, strikteres Matching - rss_researcher liefert jetzt Keywords zurück, die direkt für RSS-Suche genutzt werden - Neue _clean_search_words() filtert rein-numerische Begriffe (Jahreszahlen etc.) - Matching-Schwelle aufgerundet: bei 3 Keywords müssen mindestens 2 matchen Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-05 18:36:08 +01:00
claude-dev	7672bbcad6	Domain-Balance vor Haiku entfernt — Feeds sollen alle verfügbar bleiben Die Feed-Vorfilterung (max 3 pro Domain) vor der Haiku-Selektion war falsch: Alle thematischen Feeds (z.B. Guardian World, Politics, Middle East) sollen Haiku zur Auswahl stehen. Die Quellenvielfalt wird stattdessen durch den Prompt (QUELLENVIELFALT-Regel) und den Artikel-Cap nach dem RSS-Fetch (max 10 Artikel/Domain) sichergestellt. Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-04 23:28:37 +01:00
claude-dev	ff4c54d9a8	Quellenvielfalt sicherstellen: Domain-Cap + Balance + Discovery-Verbesserungen - config.py: MAX_FEEDS_PER_DOMAIN=3, MAX_ARTICLES_PER_DOMAIN_RSS=10 - rss_parser.py: _apply_domain_cap() begrenzt Artikel pro Domain nach RSS-Fetch - orchestrator.py: Domain-Balance vor Feed-Selektion (max 3 Feeds/Domain), Domain-Cap in Background-Discovery - source_rules.py: article_count in get_feeds_with_metadata(), Content-Hash in _validate_feed() für Duplikat-Erkennung bei Discovery - researcher.py: QUELLENVIELFALT-Regel im Haiku Feed-Selektions-Prompt - DB: 52 WordPress-Redirect-Duplikate deaktiviert (netzpolitik.org, bashinho.de) Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-04 23:25:04 +01:00
claude-dev	4bfc626067	Kartenfeature: Geoparsing + Leaflet-Karte im Dashboard - Neues Geoparsing-Modul (spaCy NER + geonamescache/Nominatim) - article_locations-Tabelle mit Migration - Pipeline-Integration nach Artikel-Speicherung - API-Endpunkt GET /incidents/{id}/locations - Leaflet.js + MarkerCluster im Dashboard-Grid - Theme-aware Kartenkacheln (CartoDB dark / OSM light) - Gold-Akzent MarkerCluster, Popup mit Artikelliste Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-04 22:04:07 +01:00
claude-dev	3d9a827bc8	Inkrementelle Analyse + Token-Optimierung + Relevanz-Scoring TOKEN-OPTIMIERUNG: - Inkrementelle Analyse: Folge-Refreshes senden nur noch das bisherige Lagebild + neue Artikel an Claude (statt alle Artikel erneut). Spart ~60-70% Tokens bei Lagen mit vielen Artikeln. - Inkrementeller Faktencheck: Bestehende Fakten als Zusammenfassung, nur neue Artikel werden vollstaendig geprueft. - Modell-Steuerung: Feed-Selektion nutzt jetzt Haiku (CLAUDE_MODEL_FAST) statt Opus. Spart ~50-70% bei Feed-Auswahl. - Set-basierte DB-Deduplizierung: Bestehende URLs/Headlines einmal in Sets geladen statt N*M einzelne DB-Queries pro Artikel. INHALTLICHE VERBESSERUNGEN: - Relevanz-Scoring: Artikel nach Keyword-Dichte (40%), Quellen-Reputation (30%), Inhaltstiefe (20%), RSS-Score (10%). - Flexibles RSS-Matching: min. Haelfte der Keywords statt alle. RSS-Artikel bekommen einen relevance_score. - Fuzzy Claim-Matching: SequenceMatcher (0.7) statt exakter String-Vergleich. Verhindert Duplikat-Akkumulation. - Translation-Fix: Nur gueltige DB-IDs (isinstance int). - Researcher: WebFetch fuer Top-Artikel, erweiterte Zusammenfassungen. DATEIEN: - config.py: CLAUDE_MODEL_FAST - claude_client.py: model-Parameter - researcher.py: Haiku Feed-Selektion, erweiterte Prompts - analyzer.py: Inkrementelle Analyse + analyze_incremental() - factchecker.py: Inkrementeller Check + Fuzzy-Matching - orchestrator.py: Set-Dedup, Relevanz-Scoring, inkrementeller Flow - rss_parser.py: Flexibles Keyword-Matching + relevance_score	2026-03-04 20:22:47 +01:00
claude-dev	71296edb97	Großes Cleanup: Bugs fixen, Features fertigstellen, toten Code entfernen Bugs behoben: - handleEdit() async keyword hinzugefügt (E-Mail-Checkboxen funktionieren jetzt) - parseUTC() Funktion definiert (Fortschritts-Timer nutzt Server-Startzeit) - Status cancelling wird im Frontend korrekt angezeigt Features fertiggestellt: - Sidebar: Lagen nach Typ getrennt (adhoc/research) mit Zählern - Quellen-Bearbeiten: Edit-Button pro Quelle, Formular vorausfüllen - Lizenz-Info: Org-Name und Lizenzstatus im Header angezeigt Toter Code entfernt: - 5 verwaiste Dateien gelöscht (alte rss_parser, style.css, components.js, layout.js, setup_users) - 6 ungenutzte Pydantic Models entfernt - Ungenutzte Funktionen/Imports in auth.py, routers, agents, config - Tote API-Methoden, Legacy-UI-Methoden, verwaiste WS-Handler - Abgeschlossene DB-Migrationen aufgeräumt Sonstiges: - requirements.txt: passlib[bcrypt] durch bcrypt ersetzt - Umlaute korrigiert (index.html) - CSS: incident-type-label → incident-type-badge, .login-success hinzugefügt - Schließen statt Schliessen im Feedback-Modal	2026-03-04 18:45:38 +01:00
claude-dev	8312d24912	Initial commit: AegisSight-Monitor (OSINT-Monitoringsystem)	2026-03-04 17:53:18 +01:00

16 Commits