AegisSight-Monitor

Autor	SHA1	Nachricht	Datum
Claude Code	f22c8dbc61	fix: removepaywalls.com -> removepaywall.com (Singular ist die echte Domain) User-Korrektur: die echte Service-Domain heisst removepaywall.com (Singular). removepaywalls.com (Plural) liefert HTTP 403 - vermutlich nicht der gleiche Service oder gar nicht mehr existent. Betrifft: - services/source_health.py: REMOVEPAYWALLS_PREFIX-Konstante (Phase 18) - agents/researcher.py: Claude-Prompts fuer Paywall-Hinweise (zwei Stellen) Verifiziert mit curl: removepaywall.com -> 200, removepaywalls.com -> 403.	2026-05-09 05:00:11 +00:00
Claude Code	8af0fa07c8	feat(source_health): fetch_strategy + Retry mit Googlebot/removepaywalls (Phase 18) Pro Quelle ein Feld sources.fetch_strategy (default \| googlebot \| paywall \| skip): - default: normaler UA, Retry mit Googlebot bei 403/406/429. - googlebot: direkt mit Googlebot-UA (fuer SEO-freundliche Sites). - paywall: Anfrage via removepaywalls.com (fuer Spiegel+/SZ+/FT etc.). - skip: Health-Check ueberspringen (bekannte unerreichbare Quellen wie Login-only). Pre-Flagging in der Migration: FT/WSJ/NZZ/Handelsblatt/WiWo -> paywall, Rheinische Post/Verfassungsschutz -> googlebot. (Test mit den vier prominent fehlerhaften Quellen zeigt: FT/RP/Verfassungsschutz sind besonders streng, gehen auch nicht ueber Googlebot/removepaywalls durch. Fuer milder restriktive Quellen wirkt der Retry-Mechanismus.)	2026-05-09 04:56:06 +00:00
Claude Code	1ee6c4ddf1	fix(source_health): URL-Schema vor httpx.get sicherstellen Telegram-Quellen mit url=t.me/kanal (ohne https:// Prefix) liessen httpx mit "ValueError: unknown url type" crashen. Fix: vor dem Request https:// vorne anhaengen wenn kein Schema vorhanden ist. Beobachtet auf Live: 110 Health-Errors, davon einige Telegram-Kanaele mit "ValueError: unknown url type:" als Fehlermeldung.	2026-05-09 04:45:18 +00:00
Claude Code	72b306d90c	fix(source_health): tenant-faehig + History (Phase 2 in den Monitor ziehen) Phase 2 hatte die Verbesserungen nur in der Verwaltung (src/shared/services/source_health.py). Der Daily-Health-Check laeuft aber im Monitor-Backend (Cron 04:00 UTC) und nutzte deshalb weiter den alten Code - Folge: - Tenant-Quellen wurden NIE gecheckt (0 Eintraege in source_health_checks fuer tenant_id IS NOT NULL). - source_health_history blieb leer. Diese Aenderung holt die Phase-2-Logik in den Monitor: - services/source_health.py: Verwaltung-Version 1:1 uebernommen (tenant_id-Filter weg + History-Save vor DELETE + UA/Timeout aus config). - config.py: HEALTH_CHECK_USER_AGENT + HEALTH_CHECK_TIMEOUT_S ergaenzt. Manueller Test auf Staging-Monitor: 283 Quellen geprueft, 253 Issues, 61 davon Tenant-Quellen. History 0 -> 458 Eintraege. Damit ist die shared/-LOCKED-FILES-Markierung in der Verwaltung obsolet - beide Repos haben jetzt den gleichen Code.	2026-05-09 04:43:01 +00:00
Claude Code	0e578a38a0	fix(incidents): international-Default auf False (Bug 3 Buckelwal-Diagnose) Beim Anlegen einer neuen Lage ist der Schalter "Internationale Quellen einbeziehen" ab jetzt standardmaessig DEAKTIVIERT. Hintergrund: Bei lokalen DACH-Ereignissen (Tier-/Personenstoryen wie "Buckelwal timmy") hat der "international=True"-Default zu schlechteren Treffern gefuehrt, weil Claude in Deutsch UND Englisch suchte und die englische Berichterstattung haeufig fehlt. Excluded-Sources- und Boulevard-Filter haben das Problem zusaetzlich verschaerft. Aenderungen: - src/models.py IncidentCreate.international_sources: bool=True -> False (nur das Pydantic-Default beim Create-Endpoint - IncidentResponse/Incident bleiben True, weil das die DB-Werte bestehender Lagen reflektiert) - src/static/dashboard.html: <input id="inc-international" checked> -> ohne checked (UI-Default ist jetzt unchecked, User muss bewusst aktivieren fuer internationale Lagen) - Tooltip-Text ergaenzt: "Deaktiviert (Standard): ... empfohlen fuer DACH-Lagen." Bestandslagen sind nicht betroffen - DB-Schema-Default INTEGER DEFAULT 1 bleibt unveraendert, fuer alle existierenden Lagen behaelt international seinen aktuellen Wert. Damit ist die Buckelwal-Diagnose komplett geloest: - Bug 1 (rss_parser min_matches adaptiv) seit `a08df3d` auf main - Bug 2 (Eigennamen-Pflicht-Keywords) seit `e83f80d` auf main - Bug 3 (international-Default) jetzt auf develop, gleich Cherry-pick auf main	2026-05-09 04:20:58 +00:00
Claude Code	5a123ef3b8	fix(researcher): Lagentitel-Eigennamen als Pflicht-Keywords (Bug 2 Buckelwal-Diagnose) KEYWORD_EXTRACTION_PROMPT explizit erweitert: - Eigennamen/Tiernamen/Personennamen aus dem THEMA als ZWINGEND markiert. - Hinweis dass DE und EN identisch sein duerfen (Eigennamen). - Klar gesagt: bei spezifischen Begriffen (>=7 Zeichen) reicht 1 Treffer in RSS-Headlines (passt zu rss_parser.py adaptive Schwelle aus `a08df3d`). Code-Post-Processing (researcher.py _extract_keywords): - Nach dem Parser werden Lagentitel-Woerter (>=4 Zeichen, nicht in Stopwords) ggf. in die Keyword-Liste injiziert, falls Haiku sie weggelassen hat. - Verhindert konkret den "Buckelwal timmy"-Bug: "timmy" fehlte in Haikus Liste, damit fielen Headlines mit nur "Buckelwal" durch das min_matches. Hintergrund: Memory-Eintrag rss_match_und_keyword_bug.md, Bug 2 von 3. Bug 1 (rss_parser min_matches adaptiv) ist seit Commit `a08df3d` auf Live. Bug 3 (international=True default) bleibt offen, ist primaer UX-Frage.	2026-05-09 03:52:36 +00:00
Claude Code	897e56997c	Mojibake fix: source_suggester.py + source_health.py via ftfy Beide Files hatten Doppel-Encoded UTF-8 in Docstrings, Kommentaren und Prompt-Strings (z.B. "prÃƒÂ¼ft" statt "prüft", "VorschlÃƒÂ¤ge" statt "Vorschläge"). ftfy hat das automatisch repariert. Hauptauswirkungen: - Logs sind jetzt mit echten Umlauten lesbar - Claude/Haiku-Prompts in source_suggester.py (Quellen-Vorschlaege via KI) bekommen jetzt korrekte deutsche Umlaute - sollte bessere Antworten geben Daneben hat ftfy line-endings normalisiert, daher der grosse Diff in source_health.py - inhaltlich nur Mojibake-Reparatur. Verifiziert mit: grep -cE "Ã¤\|Ã¶\|Ã¼\|ÃŸ\|Ã„\|Ã–\|Ãœ" src/services/*.py -> 0 Treffer	2026-05-09 03:35:13 +00:00
Claude Code	ff8a0531a4	fix(external_reputation): generische Plattform-Domains (t.me, twitter.com, ...) ignorieren False positive bei sync_eu_disinfo: t.me wurde als Quelle markiert, weil EUvsDisinfo anonyme Telegram-Posts unter der Plattform-Domain aggregiert. Eine Allowlist von Plattform-Domains schliesst diese Falle aus. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-07 19:44:07 +00:00
Claude Code	5fc2467559	feat(sources): externer Reputations-Layer (IFCN + EUvsDisinfo) Externe Datenquellen (kostenlos, Open Data) ergaenzen die LLM-geschaetzte Reliability-Achse mit objektiven Signalen: - IFCN-Signatories (raw.githubusercontent.com/IFCN/verified-signatories): Plain-Text-Liste anerkannter Faktencheck-Organisationen. - EUvsDisinfo (Zenodo CSV): Pro-Kreml-Desinformations-Datenbank. Schema-Erweiterung: - ifcn_signatory, eu_disinfo_listed, eu_disinfo_case_count, eu_disinfo_last_seen, external_data_synced_at. Service src/services/external_reputation.py: - sync_ifcn_signatories(), sync_eu_disinfo(), apply_reputation_overrides(), sync_all() mit Domain-Normalisierung (lowercase, ohne www., ohne Schema). Reliability-Override-Regeln (laufen nach Approve und manuellem Sync): - ifcn_signatory=1 -> reliability=sehr_hoch - eu_disinfo_case_count >= 5 -> reliability=sehr_niedrig - eu_disinfo_case_count >= 1 -> Reliability eine Stufe runter (max niedrig) API: POST /api/sources/external-reputation/sync (Admin, BackgroundTask). Filter: ?ifcn_signatory=true, ?eu_disinfo_listed=true. UI: - Filter-Dropdown "Externe Reputation" im Quellen-Modal. - Badges: gruenes "IFCN" und rotes "EU-Desinfo (n)". - Tooltip macht Reliability-Quelle transparent: "(IFCN-Faktenchecker)", "(EU-Desinfo, n Faelle)" oder "(LLM-Schaetzung)". - "Externe Daten syncen"-Button im Review-Toolbar (Admin-only). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-07 19:40:30 +00:00
Claude Code	48a60d7579	feat(sources): Review-Queue-UI fuer LLM-Klassifikations-Vorschlaege (Admin) - Tab-Schalter im Quellen-Modal: "Quellenliste" vs. "Klassifikations-Review" (Review-Tab nur fuer org_admin sichtbar, mit Pending-Counter-Badge). - Review-Karten zeigen Diff aktueller Wert -> LLM-Vorschlag pro Achse, Konfidenz-Indikator (gruen/gelb/rot), LLM-Begruendung, Buttons fuer Uebernehmen / Verwerfen / Neu klassifizieren. - Toolbar: Konfidenz-Filter, "Klassifikation starten" (Bulk im Hintergrund), "Alle >= 0.85 genehmigen" (Bulk-Approve). - API-Wrapper in api.js fuer alle 6 neuen Endpoints + erweiterte listSources-Filter. - Backend-Endpoint POST /api/sources/classification/bulk-approve (Admin-only). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-07 19:00:47 +00:00
Claude Code	62ba38ae46	feat(sources): LLM-Klassifikator + Review-API + Bulk-Migrationsskript - src/services/source_classifier.py: classify_source(db, id) ruft Haiku mit strukturiertem Prompt (4 Achsen + state_affiliated + country + Konfidenz) und schreibt Vorschlaege in proposed_-Spalten. bulk_classify(db, limit) iteriert sequenziell ueber unklassifizierte Quellen. - API-Endpoints (alle hinter Auth, globale Quellen nur fuer org_admin): - GET /api/sources/classification/stats - GET /api/sources/classification/queue - POST /api/sources/{id}/classification/approve (proposed_ -> echte Felder) - POST /api/sources/{id}/classification/reject (proposed_* loeschen) - POST /api/sources/{id}/classification/reclassify (sofort, ~3-5s) - POST /api/sources/classification/bulk-classify (BackgroundTask) - scripts/migrate_sources_classification.py: CLI-Wrapper fuer Bulk-Migration zur einmaligen Erstbestueckung aller Bestandsquellen. Sample-Test auf Staging steht aus. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-07 18:46:54 +00:00
Claude Code	715af17ac3	feat(sources): UI fuer Quellen-Klassifikation (Filter, Badges, Edit-Form) - Quellen-Modal: 4 neue Filter (Politik, Medientyp, Reliability, Alignment). - Edit-Form: Selects fuer political_orientation/media_type/reliability, Multi-Select-Chips fuer alignments, Toggle state_affiliated, Country-Code-Input. - renderSourceGroup: Politik-Badge mit DACH-Farbskala (rot=L, blau=R), Reliability-Punkt (gruen→rot), Alignment-Tags, state-affiliated-Indikator. Tooltip um alle 4 Achsen erweitert. - CSS-Block fuer alle neuen Badge-/Chip-Styles. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-07 18:37:09 +00:00
Claude Code	f8e2f73bc0	feat(sources): strukturierte Klassifikation (Politik/Medientyp/Reliability/Alignments) - Neue sources-Spalten: political_orientation (7+2 Stufen), media_type (20), reliability (5+1), state_affiliated, country_code, classification_source, classified_at sowie proposed_*-Spalten fuer LLM-Vorschlaege. - Neue source_alignments-Tabelle fuer Mehrfach-Tagging geopolitischer Naehe (prorussisch, proiranisch, prowestlich, ...). - API-Filter: ?political_orientation, ?media_type, ?reliability, ?state_affiliated, ?alignment. - create/update_source nehmen alignments[] entgegen und setzen classification_source automatisch auf 'manual' bei Klassifikations-Edits. Backwards-kompatibel: bestehendes bias/language/category bleibt unveraendert, Default fuer Bestandsquellen ist classification_source = 'legacy'. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-07 18:21:45 +00:00
Claude Code	7f220a9b65	feat(orchestrator): Faktencheck vor Lagebild mit Fallback (sequenziell) Bislang liefen factcheck + analyze parallel via asyncio.gather. Folge: Lagebild konnte Aussagen treffen, die der Faktencheck im selben Refresh als contradicted markiert. Inkonsistenz zwischen Lagebild-Tab und Faktencheck- Tab; im PDF/DOCX-Export schon kritisch. Variante 1 aus der Diskussion: strikt sequenziell, mit Fallback bei Faktencheck-Fail (Refresh bricht NICHT ab, Lagebild laeuft dann ohne Faktenkontext wie bisher, ein Logeintrag dokumentiert den Fallback). Aenderungen: - analyzer.build_fact_context_block(): neuer Helper, baut den GEPRUEFTE-FAKTEN-Block aus existing_facts + neuen/aktualisierten Fakten. Status-Domaenen adhoc/research vereinheitlicht zu Bestaetigt / Umstritten / Unbestaetigt / Entwicklung. Max 20 Fakten, sortiert nach Status-Prioritaet desc und sources_count desc. Bei leerer Eingabe leerer String -> Fallback-Pfad. - analyzer.analyze() / analyze_incremental(): neuer Optional-Parameter fact_context_block (default leer, Backward-Compat). 4 Prompt-Templates bekommen {fact_context_block}-Platzhalter sowie eine AUSSAGE-DISZIPLIN- Sektion: bestaetigte Fakten als Geruest, Umstrittenes explizit machen, Unbestaetigtes klar einordnen, kein Spekulieren ueber ungedecktes. - orchestrator: asyncio.gather durch sequenzielle Logik ersetzt. Faktencheck zuerst, Pipeline-Step 6 done direkt nach dem Aufruf (count_value ist Schaetzung; finale DB-Zahlen stehen spaeter). Lagebild danach (Step 7) mit fact_context_block. _do_analysis-Closure um den Parameter erweitert, kein toter Inline-Block. - spaeteres _pipe_done(factcheck) entfernt -- der Step wird jetzt frueher geschlossen, der spaetere Persistierungsblock laesst ihn unberuehrt. UI-Pipeline zeigt automatisch sequenzielle Aktivitaet statt beide Steps gleichzeitig -- keine Frontend-Aenderung noetig. Latenz pro Refresh steigt um die factcheck-Dauer. Bewusst akzeptiert: Konsistenz vor Geschwindigkeit.	2026-05-07 00:13:39 +00:00
Claude Code	f4c0c930b8	fix(orchestrator): aktive Pipeline-Schritte beim Cancel mitschliessen Beim User-Cancel wurde nur refresh_log auf cancelled gesetzt, der zuletzt aktive refresh_pipeline_steps-Eintrag blieb verwaist. Der /api/incidents/<id>/pipeline-Endpoint liefert daraus dauerhaft "Schritt X laeuft" an die UI, auch lange nach dem Cancel. - pipeline_tracker.cancel_active_steps(): neuer Bulk-Helper, setzt alle noch active-Schritte eines refresh_log_id auf cancelled mit completed_at - _mark_refresh_cancelled holt die refresh_log_id, macht das refresh_log- Update wie bisher und ruft danach cancel_active_steps auf Reproduziert bei Lage 80 (Bjoern Hoecke), refresh_log 1273. Frontend- CSS kennt status-cancelled nicht, faellt auf den neutralen Default-Style zurueck (kein Spinner mehr, kein Haken, korrekt ent-hangen).	2026-05-06 23:40:39 +00:00
Claude Code	f73c21235e	feat(translator): Feature-Flag TRANSLATOR_ENABLED zum Abschalten (siehe main)	2026-05-03 20:43:40 +00:00
Claude Code	9078489d0a	fix(orchestrator): Auto-Refresh nicht direkt nach Cancel/Error neu einreihen - main.py: Auto-Refresh-Filter beruecksichtigt jetzt auch cancelled und error - orchestrator.py: Queue-Cancels schreiben jetzt einen cancelled-Eintrag ins refresh_log via _log_queued_cancellation Wirkung: Nach Cancel oder Error startet die Lage erst beim naechsten regulaeren Slot wieder. refresh_mode bleibt unveraendert. (Identisch zu Commit auf main, develop nachgezogen.)	2026-05-03 19:30:04 +00:00
IntelSight_Admin	24d7500152	Release-Notes: Übersichtlichere Navigation in der Seitenleiste	2026-05-03 17:21:37 +02:00
Claude Code	f0fe35b279	Sidebar Feedback-Button: mail-Icon (Brief) statt message-square	2026-05-03 15:14:59 +00:00
Claude Code	fb6e9fff19	Sidebar: Quellen+Feedback-Buttons mit Lucide-Icons + kuerzerem Text Quellen verwalten -> Quellen (mit database-Icon) Feedback senden -> Feedback (mit message-square-Icon) Tooltip behaelt den vollen Text fuer Mouseover.	2026-05-03 15:14:05 +00:00
Claude Code	b1a0e97a34	Pipeline: bei Lagen-Wechsel auf bereits-queued Lage automatisch beginQueue Wenn der User in der Sidebar auf eine Lage klickt, die schon in Queue wartet, ruft bindToIncident() die API auf und kriegt den letzten gespeicherten Pipeline-Stand (alles done = gruen). Das ist falsch fuer queued-Status. Fix: nach API-Load pruefen, ob die Lage in App._refreshingIncidents ist UND in UI._progressState mit step=queued -> beginQueue() selbst ausloesen. Damit zeigt die Pipeline grau, sobald man auf die queued-Lage wechselt.	2026-05-03 14:27:20 +00:00
Claude Code	77797f6027	Refresh-Modal: Titel je nach Status (queued/cancelling/laeuft) Bisher hing der Titel nur an state.isFirst -> stand auch "Aktualisierung laeuft" wenn die Lage tatsaechlich noch in der Queue wartete. Jetzt: - queued -> "In Warteschlange" (mit Position #N falls vorhanden) - cancelling -> "Wird abgebrochen…" - isFirst -> "Erste Recherche laeuft" - sonst -> "Aktualisierung laeuft"	2026-05-03 14:18:17 +00:00
Claude Code	dc51ecafe8	Pipeline-Snapshot: Mini-Pipeline auch zuruecksetzen beginQueue() und _restoreSnapshot() haben bisher nur _render() aufgerufen, aber NICHT _renderMini(). Daher blieben die kleinen Pipeline-Icons im "Aktualisierung laeuft"-Modal gruen, obwohl die Lage in Queue war. Fix: an beiden Stellen auch _renderMini() aufrufen.	2026-05-03 14:15:27 +00:00
Claude Code	31fa17465a	Pipeline-Icons: Snapshot/Restore bei Queue + Cancel Vorher: - Lage refreshen -> Lage geht in Queue, aber Pipeline-Icons bleiben gruen mit Haekchen vom letzten Refresh (suggeriert faelschlich "alles fertig") - Cancel/Error -> Pipeline bleibt im Mix-Zustand (teils active, teils pending) Nachher: - pipeline.beginQueue(id): macht Snapshot des aktuellen _stateByKey und setzt alle Steps auf pending. Ausgeloest aus app.js handleRefresh() und _restoreRefreshingState() (auch nach F5). - _onRefreshDoneSuccess: Snapshot verwerfen + API-Reload (wie bisher). - _onRefreshDoneCancel: Snapshot zurueckspielen -> vorheriger gruener Stand sichtbar. - _onRefreshDoneError: gleiches Verhalten wie Cancel. - bindToIncident: Snapshot mitloeschen (lagen-spezifisch). - Bei zweitem Refresh ohne Cancel dazwischen wird Snapshot bewusst ueberschrieben.	2026-05-03 14:10:56 +00:00
Claude Code	2a654cc882	AI-Disclaimer: Modell-Name (Claude/Anthropic) aus Text entfernt	2026-05-03 13:42:35 +00:00
Claude Code	6293cef91e	Banner-Text + AI-Disclaimer-Modal + Translator-Robustheit #28 Banner-Text bei Token-Budget aufgebraucht: - middleware/license_check.py + static/js/app.js: Statt "Bitte Verwaltung kontaktieren" jetzt konkreter Upgrade-Pfad mit info@aegis-sight.de. #29 AI-Hallucination-Disclaimer: - Neue static/js/ai-disclaimer.js (analog zu update-system.js): IIFE-Modul, localStorage-versioniert (aegis_ai_disclaimer_seen=v1), inline-CSS mit Theme-Variablen, Modal mit Lucide-Info-Icon. - Wird beim ersten Login einmalig gezeigt; ueber Header-User-Dropdown Eintrag "Ueber KI-Inhalte" jederzeit erneut oeffenbar. - dashboard.html: Script-Tag + Dropdown-Button mit Lucide-SVG. - style.css: kleiner Stil-Block fuer .header-dropdown-action. Translator-Robustheit (Bonus): - agents/translator.py: Parser akzeptiert jetzt auch von Claude wrapped Antworten ({{translations: [...]}}, {{items: [...]}}, einzelnes Object). Behebt Wrapper-Bug der gestern beim Backfill 75% der Calls fehlschlagen liess. - Prompt deutlicher: "flaches JSON-Array, kein Wrapper".	2026-05-03 13:29:19 +00:00
Claude Code	a6f36be9c6	Translator-Agent: dedizierter Haiku-Pass fuer fehlende DE-Uebersetzungen Bisher haben translations als Teil der Analyzer-JSON-Antwort gelebt ("translations": [...]). Bei vielen Artikeln pro Refresh hat das LLM die Translations regelmaessig weggelassen (Output-Token-Druck), insbesondere content_de (lange Texte werden zuerst gestrichen). Folge: viele englische Artikel ohne deutsche Headline/Inhalt im Frontend. Aenderungen: - Neuer Agent src/agents/translator.py: * translate_articles_batch / translate_articles * Nutzt CLAUDE_MODEL_FAST (Haiku) - billig * Batch-Size 5 (mit Reserve gegen Output-Truncate) * Robustes JSON-Parsing: Markdown-Codefence, Truncate-Fallback, extrahiert auch unvollstaendige Antworten * Idempotent: Caller filtert auf fehlende headline_de/content_de - analyzer.py: translations aus 4 Prompt-Templates entfernt (adhoc/research x analyze/enhance) und Fallback-Return-Dict bereinigt -> Analyzer-Output wird kompakter und zuverlaessiger - orchestrator.py: * Alter Translation-INSERT-Block entfernt (analysis.translations wird nicht mehr genutzt) * Nach Analyse + db.commit + cancel-check neuer Translator-Call: SELECT WHERE language!=de AND (headline_de OR content_de fehlt), translate_articles, normalize_german_umlauts, COALESCE-UPDATE * Vor post_refresh_qc -> normalize_umlaut_articles greift auch frische Uebersetzungen * Failure-tolerant: Translator-Fehler bricht Refresh nicht ab Backfill: migrations/migrate_translations_2026-05-03.py im Verwaltungs-Repo.	2026-05-03 00:04:59 +00:00
Claude Code	98c9da64b0	Umlaut-Normalisierung an drei Stellen + auch articles im QC Fix fuer ASCII-Umlaute in Headlines/Inhalten (Gespraeche statt Gespraeche). Zwei Quellen des Problems: 1. Quellen wie dpa-AFX, Telegram TASS/RIA liefern Headlines schon ASCII-fiziert 2. LLM-Uebersetzungen drift en gelegentlich zu ae/oe/ue trotz Prompt Aenderungen: - rss_parser.py: nach html_to_text auch normalize_german_umlauts auf title und summary anwenden (sicher, hunspell-Dict ignoriert englische Woerter wie Boeing/Business) - orchestrator.py:1418 Translation-INSERT: headline_de und content_de durch normalize_german_umlauts schicken (LLM-Drift abfangen) - post_refresh_qc.py: neue Funktion normalize_umlaut_articles als Sicher- heitsnetz analog zu normalize_umlaut_fields. Behandelt headline_de und content_de aller Artikel des Incidents; bei language=de zusaetzlich headline und content_original. Wird in run_post_refresh_qc nach normalize_umlaut_fields aufgerufen. Backfill: migrations/migrate_umlauts_2026-05-03.py (im Verwaltungs-Repo)	2026-05-02 23:26:19 +00:00
Claude Code	307f0a1868	RSS-Parser: HTML aus summary strippen vor Speicherung Ursache des Bugs: feedparser.entry.summary liefert bei vielen Quellen (Guardian, AP, Sueddeutsche, Golem, Bellingcat, ...) HTML-kodierten Text (<p>, <a>, <ul>, ...). Der Parser hat diesen 1:1 in articles.content_original und content_de gespeichert. Folge: - UI rendert HTML-Tags als Text in Timeline-Karten - KI-Agenten (analyzer, entity_extractor, factchecker) bekommen HTML-Muell als Analyse-Input -> schwaechere Ergebnisse - _is_german-Sprachheuristik wird durch Tags verzerrt - 1000-Zeichen-Cap wird durch Tags + Tracking-URLs verbraucht Fix: html_to_text aus feeds/transcript_extractors/_common.py wiederverwenden, strippt Tags + decodiert HTML-Entities (inkl. dt. Umlaute) + normalisiert Whitespace. Wird auf summary direkt nach entry.get angewandt -> betrifft sowohl Match-Logik (text-Variable) als auch INSERT (content_original/de). Backfill-Migration: migrations/migrate_html_strip_2026-05-03.py im Verwaltungs-Repo, behandelt bestehende DB-Eintraege rueckwirkend.	2026-05-02 23:13:32 +00:00
Claude Code	430541f49b	STAGING_MODE Env-Flag: kein Hard-Stop, kein Org-Switcher in Staging Wenn STAGING_MODE=1 (oder true/yes) in der .env gesetzt ist: - check_license() liefert immer unlimited_budget=True -> kein Token-Budget-Hard-Stop, egal was in der DB steht. - /api/auth/me liefert is_global_admin=False -> Frontend ruft _initOrgSwitcher nicht auf, Org-Switcher-Section bleibt versteckt. Nur in ~/AegisSight-Monitor-staging/.env gesetzt; Live-.env hat das Flag nicht, daher dort unverändertes Produktiv-Verhalten.	2026-05-02 22:51:27 +00:00
Claude Code	ee83f38edf	Token-Budget Hard-Stop + Banner bei aufgebrauchtem Budget - check_license() liefert jetzt unlimited_budget, credits_total, credits_used, read_only_reason. Bei nicht-unlimited UND credits_used >= credits_total wird status=budget_exceeded, read_only=True gesetzt. - require_writable_license blockiert mit 403 + X-License-Status-Header je nach Reason. - /api/auth/me liefert read_only_reason und unlimited_budget; credits_percent_used wird nicht mehr auf 100 gekappt (echte Prozente). - Frontend: Banner-Text dynamisch je nach reason (budget_exceeded/expired/...). Refresh-Button bei read_only deaktiviert + Tooltip. Globaler 403-Handler in api.js: bei X-License-Status -> Banner + Toast aktualisieren.	2026-05-02 20:16:25 +00:00
UserIsMH	2b1e8c3632	requirements.txt: Export-Pakete dokumentiert Jinja2, weasyprint und python-docx waren auf Live manuell ins venv installiert, fehlten aber in requirements.txt — Folge: auf Staging waren sie nicht installiert, Bericht-Export warf 500 (ModuleNotFoundError). Jetzt im Repo dokumentiert, beim Aufsetzen neuer Umgebungen ist alles vollständig. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-01 23:34:58 +02:00
UserIsMH	b1f8113207	Bericht-Export: drei Verbesserungen 1. Faktencheck immer vollständig PDF-Export hatte im scope=report einen [:20]-Cap, der vollständige Faktencheck wurde nur bei scope=full gerendert. Jetzt ungekürzt überall, sortiert chronologisch absteigend (DB-Sortierung). 2. Status-Labels aus Frontend übernommen FC_STATUS_LABELS hatte nur 4 Werte; in der DB existieren aber 7+ (confirmed/unconfirmed/contradicted/developing/established/ unverified/disputed). Folge: "contradicted" und drei weitere wurden auf englisch ausgegeben. Jetzt 1:1 vom Monitor-UI: contradicted → "Widerlegt" developing → "Unklar" established → "Gesichert" unverified → "Ungeprüft" 3. Adhoc-Export: Neueste Entwicklungen statt Executive Summary Bei Live-Monitoring-Lagen ist die generische Executive Summary weniger aussagekräftig als die kompakten "Neueste Entwicklungen"- Bullets. Endpoint nutzt jetzt: - adhoc + latest_developments vorhanden → latest_developments (Markdown -> HTML konvertiert) - adhoc + leer → cached/generierte Executive Summary (Fallback) - research → unverändert Executive Summary Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-01 23:32:36 +02:00
UserIsMH	26fac0e824	Analysepipeline: Reset auf "pending" beim Refresh-Start Beim ersten Schritt (sources_review) eines neuen Refreshs werden alle nachfolgenden Schritte sichtbar auf "pending" (grau) zurückgesetzt. Vorher hingen sie weiterhin als "done" vom letzten Refresh in grün herum, während die Pipeline schon einen neuen Durchlauf zeigte. - Bedingung in pipeline.js entschärft: nicht mehr nur bei pass_number > 1 (Multi-Pass), sondern bei jedem ersten Schritt-Active - Bei Reset wird das ganze Stage neu gezeichnet (nicht nur der einzelne Block), damit die zurückgesetzten Schritte tatsächlich grau erscheinen - Greift sowohl bei normalem Refresh als auch bei Multi-Pass-Wechsel einer Research-Lage Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-01 22:06:06 +02:00
UserIsMH	62c0be64ee	Analysepipeline: Reihenfolge "Fakten prüfen" vor "Lagebild verfassen" Reihenfolge in der Pipeline-Anzeige getauscht — passt zur perspektivischen Backend-Umstellung (Faktencheck-Output soll als Kontext ins Lagebild einfließen, statt parallel zu generieren). Backend läuft aktuell noch parallel; sobald die sequenzielle Variante mit Kontext-Übergabe steht, stimmt die Anzeige mit dem realen Flow überein. Im 3x3-Snake-Layout liegt jetzt: Reihe 2: Relevanz bewerten → Orte erkennen → Fakten prüfen Reihe 3: Lagebild verfassen → Qualitätscheck → Benachrichtigen Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-01 21:59:46 +02:00
UserIsMH	8c4ef6b2cf	CATEGORY_REPUTATION: Schlüssel an aktuelle DB-Werte angepasst Die Reputation-Map nutzte veraltete Schlüssel (presseagenturen, behoerden, nachrichten_de/int), die nirgends in der DB vorkamen — die DB hat nachrichtenagentur, behoerde, oeffentlich-rechtlich, qualitaetszeitung, think-tank, regional, telegram, boulevard. Folge war ein stiller Bug: alle hochwertigen Quellen (Reuters, ZDF, tagesschau, Spiegel, FAZ, BMI etc.) bekamen den Default-Score 0.4 wie "sonstige" und wurden in der Relevanz-Sortierung nicht bevorzugt. Map jetzt vollständig auf aktuelle Kategorie-Werte: - nachrichtenagentur, behoerde: 1.00 - oeffentlich-rechtlich: 0.95 - qualitaetszeitung, think-tank: 0.85 - fachmedien: 0.80 - international: 0.75 - regional: 0.65 - telegram: 0.50 - sonstige: 0.40 - boulevard: 0.30 Test mit 200 zufälligen Artikeln aus der Live-DB: 155 besser bewertet, 0 schlechter, 45 unverändert. Stärkster Effekt bei ÖR (+0.165), Nachrichtenagenturen (+0.18), Qualitätszeitungen (+0.135). Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-01 18:52:02 +02:00
UserIsMH	ad5b723d79	Quellenübersicht: Lagebild-Quellennummer [N] statt fortlaufender Nummer Statt einer eigenen Nummerierung (1., 2., ...) wird jetzt die echte Lagebild-Quellennummer im Format [N] angezeigt — also exakt das, was im Lagebild-Text als Zitat erscheint. Match per exakter source_url, mit Quellen-Name als Fallback. Artikel ohne Match (nicht im Lagebild zitiert) bekommen einen dezenten Strich "—" mit Tooltip "Nicht im Lagebild zitiert", damit sichtbar ist welche Belege Claude überhaupt verwendet hat und welche nicht. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-01 18:04:52 +02:00
UserIsMH	51615cae62	Quellenübersicht: Detail-Liste mit Nummer, Datum und Link Aufklapp-Liste pro Quelle zeigt jetzt: 1. fortlaufende Nummer (gold, monospace) 2. Datum + Uhrzeit (klein, dezent grau, monospace) 3. Headline als Link zum Originalartikel Drei-Spalten-Grid (Nummer \| Datum \| Headline). Auf schmalem Viewport (<600px) klappt das Datum unter die Nummer. Bei research-Lagen wird published_at bevorzugt, sonst collected_at. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-01 18:01:06 +02:00
UserIsMH	a2610d0094	Quellenübersicht: Klick auf Quelle klappt Artikel-Liste auf Quellen-Boxen waren bisher reine Anzeige. Jetzt sind sie klickbar: beim Klick erscheint direkt unter der Box (über die volle Grid-Breite) eine Liste der Artikel-Headlines dieser Quelle, jede mit Link zum Originalartikel. Mutual-exclusive — Klick auf eine andere Quelle schließt die vorherige automatisch. - components.js: Item bekommt data-source, onclick + Tastatur-Support (Enter/Space), aria-expanded. - app.js: toggleSourceOverviewDetail filtert _currentArticles nach Quelle, sortiert chronologisch absteigend, fügt das Detail-Element via insertAdjacentElement direkt nach dem geklickten Item ein. - CSS: aktiver Item-Status (Glow + Tint), Detail-Block mit grid-column 1/-1 (volle Breite) + max-height 320px scrollbar bei vielen Artikeln + dezente Slide-In-Animation. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-01 17:57:48 +02:00
UserIsMH	a08df3d121	RSS-Parser: Match-Schwelle adaptiv (Bug 1 aus Buckelwal-Diagnose) Bisher musste eine Headline mindestens 2 der dynamisch generierten Suchworte enthalten, um den Match-Filter zu passieren. Bei thematisch engen Lagen (Bsp. "Buckelwal timmy") fielen damit echte Treffer wie "Transport mit Buckelwal erreicht dänische Gewässer..." durch, weil nur 1 Keyword (buckelwal) gematcht hat. Neue Heuristik: enthält der Text mindestens ein spezifisches Keyword (>=7 Zeichen, also keine kurzen Akteursnamen wie "iran" oder "trump"), reicht 1 Treffer. Bei nur kurzen, generischen Keywords gilt weiter die alte Schwelle (halb der Wörter, max. 2). Topic-Filter danach (Haiku) fängt False Positives. Damit kommen ZDF/tagesschau/n-tv-Headlines mit nur einem starken Begriff durch — der Hauptgrund, warum Lage 8 Buckelwal mit ZDF-Quelle am ersten Refresh 0 Artikel hatte. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-01 16:55:05 +02:00
UserIsMH	0a6208c289	WebSearch: eingetragene Web-Quellen via Haiku vorselektieren Bisher hatten Quellen vom Typ web_source keine praktische Wirkung auf die Recherche - sie lagen nur als Marker in der DB. Jetzt werden sie aktiv in den Recherche-Prompt eingebunden. Ablauf: 1. Vor dem Hauptaufruf an Opus prüft ein günstiger Haiku-Call alle aktiven Web-Quellen des Tenants (plus globale) und wählt die thematisch passenden aus. Leere Selektion ist ausdrücklich erlaubt. 2. Die ausgewählten Domains werden dem Recherche-Prompt als "EINGETRAGENE WEB-QUELLEN" Block beigegeben mit der Empfehlung, gezielt mit "site:domain query" zu suchen, falls thematisch passend. 3. site: ist Empfehlung, kein Zwang - Claude bleibt flexibel und ergänzt seine sonstige Recherche. - source_rules.get_feeds_with_metadata: SELECT um notes-Feld erweitert, damit der Selektor besseren Kontext zur Quelle hat. - ResearcherAgent.select_relevant_web_sources: neuer Helper analog zu select_relevant_feeds, mit Skip-Optimierung wenn ≤3 Quellen. - WEB_SOURCE_SELECTION_PROMPT: explizite Regel "lieber leer als pauschal alle", verhindert Token-Verschwendung. - ResearcherAgent.search: neuer Parameter preferred_sources, beide Templates (RESEARCH + DEEP_RESEARCH) bekommen optionalen preferred_sources_block. - Orchestrator._web_search_pipeline: Vorselektion vor researcher.search, Token-Usage in usage_acc, Logging der gewählten Domains. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-01 16:45:17 +02:00
UserIsMH	19038472cf	Ereignis-Timeline: ▼-Pfeil unter aktivem Heatmap-Balken entfernt Der Pfeil überschattete das darunter liegende Stunden-Label. Goldener Balken mit Glow + scaleY reicht als visuelles Aktiv-Signal. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-01 16:06:31 +02:00
UserIsMH	462127dc52	Ereignis-Timeline: Heatmap-Klick-Bug beheben Inline-onclick mit JSON.stringify(label) + UI.escape erzeugte bei Bucket-Labels mit Anführungszeichen oder Sonderzeichen einen kaputten HTML-Attribut-String. Klicks lösten daher gar keinen Handler aus. Statt JS-String im onclick werden Bucket-Daten jetzt als data-start/data-end/data-label-Attribute am Cell-Element gehalten. Onclick ruft App.handleStripClick(this), das die Werte sauber aus dataset liest und an openTimelineWindow weiterreicht. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-01 16:04:02 +02:00
UserIsMH	34aeb04a88	Ereignis-Timeline: Klick auf Heatmap-Balken filtert den Stream Vorher scrollte ein Klick auf einen Balken nur zur passenden Zeit- Gruppe — bei langem Stream kaum erkennbar. Jetzt filtert der Klick den Stream auf das Zeitfenster des Balkens und zeigt nur diese Einträge. - Aktiver Balken: vergrößert (scaleY 1.6) + goldener Hintergrund + starker Glow + kleiner ▼-Pfeil darunter; alle anderen Balken auf 40% Opacity gedimmt. - Banner zwischen Strip und Stream zeigt "Gefiltert auf [Label] · X Einträge" mit "Filter aufheben"-Button. - Zweiter Klick auf denselben Balken oder Banner-Button hebt den Filter auf. - Filter/Range-Buttons setzen den Strip-Window-Filter zurück (sonst inkonsistente Doppel-Filterung). - Lagen-Wechsel räumt _activeStripWindow. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-01 15:59:32 +02:00
UserIsMH	b14fe31f42	Ereignis-Timeline: Newsfeed mit Lagebericht-Sektionen + Heatmap-Strip Komplett neu gedacht: nicht mehr horizontale Karten-Kette, sondern vertikaler Newsfeed mit den vorhandenen vt-Klassen, plus dezenter Heatmap-Strip oben für die Quantitäts-Übersicht. - Heatmap-Strip oben (14 px hoch): ein Quadrat pro Tag/Stunde/Woche/ Monat je nach Spannweite, Farbintensität = Aktivität, goldener Boden-Strich bei Lagebericht. - Klick auf Heatmap-Quadrat: Stream scrollt zur passenden Zeit-Gruppe, diese flasht kurz auf. - Newsfeed darunter: vt-time-group mit Datums-Trennzeilen (Heute/Gestern/...), Lagebericht-Einträge sind durch ihre vt-snapshot Klasse prominent gegenüber Meldungs-Einträgen. - Klick auf Lagebericht: Volltext klappt inline auf (vorhandener lazyLoadSnapshotDetail-Mechanismus, kein separates Detail-Panel mehr). - Klick auf Meldung: Detail klappt inline auf. Karten-Kette, Verbindungs-Stränge, "Aktuell"-Marker, Snapshot-Detail- Panel, Window-Detail-Panel und alle zugehörigen CSS-Klassen (ht-card/ht-link/ht-now/ht-chain/ht-detail) komplett entfernt. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-01 15:51:41 +02:00
UserIsMH	ffb8dddc4f	Ereignis-Timeline: Snapshot-zentriertes Konzept Komplette Neufassung der horizontalen Timeline. Lageberichte sind die natürlichen Anker einer OSINT-Lage; Artikel werden um sie herum gruppiert. Aufbau: - Quanti-Strip oben: schmale Heatmap-Reihe (ein Quadrat pro Stunde/Tag/ Woche/Monat je nach Spannweite), Farbintensität = Aktivität. Quadrate mit Lagebericht haben goldene Unterkante. Klick auf Quadrat öffnet Detail-Panel mit allen Meldungen des Zeitfensters. - Lagebericht-Kette darunter: jede Karte zeigt Datum, Vorschau-Text aus dem Snapshot, Anzahl Meldungen + Fakten. Karten sind durch Stränge verbunden, die "X Meldungen"-Pille tragen — Klick auf Strang öffnet Liste der Meldungen zwischen den beiden Lageberichten. - "Aktuell"-Marker am rechten Ende mit pulsierendem Pin. Filter: - Alle: Strip + Kette - Meldungen: Strip + vertikaler Stream - Lageberichte: nur Karten ohne Strip/Stränge Edge-Case: Lagen ohne Lagebericht zeigen Strip + Stream als Fallback. Mobile (<900px): Kette stapelt vertikal, Strip bleibt horizontal. Alte Bar-Achse, Punkte, Bucket-Merge, Day-Markers etc. komplett entfernt — die alte Achse war für sporadische OSINT-Aktivität das falsche Pattern. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-01 15:38:09 +02:00
AegisSight Promote-UI	0edbf7e3b8	Revert "Ereignis-Timeline: Säulen, Lagebericht-Linien, Themen-Labels" This reverts commit `370bb94b26`.	2026-05-01 15:22:13 +02:00
AegisSight Promote-UI	de01ab71fc	Revert "Ereignis-Timeline: Überlappungen oben auflösen" This reverts commit `58eb1298ca`.	2026-05-01 15:22:06 +02:00
AegisSight Promote-UI	86a49e082c	Revert "Ereignis-Timeline: Lagebericht-Stempel zusammenfassen, Bar-Cap entfernen" This reverts commit `cae9c5467a`.	2026-05-01 15:21:53 +02:00
AegisSight Promote-UI	221b21cb4e	Revert "Cache-Bust: style.css und app.js Versionen erhöht" This reverts commit `30cb276ec6`.	2026-05-01 15:21:52 +02:00

1 2 3 4 5 ...

442 Commits