AegisSight-Monitor

Autor	SHA1	Nachricht	Datum
UserIsMH	b4898614c4	feat(topic-filter): Pre-Topic-Headline-Übersetzung für fremdsprachige Quellen Der Topic-Filter (Haiku) hat bisher fremdsprachige Headlines (CJK, Arabisch, Hebräisch, Kyrillisch) konservativ verworfen, weil er die Sicherheitsregel "im Zweifel NICHT relevant" auf jeden Text anwandte, den er nicht klar lesen konnte. Bei Lage 96 (Verfassungsänderung Japan) landeten so 79 von 87 Kandidaten im Papierkorb, darunter alle ja-Quellen mit Kanji-Headlines. Lösung: ein eigener kleiner Haiku-Batch-Call vor dem Topic-Filter übersetzt die Headlines (+ erste 240 Zeichen Content) fremdsprachiger Artikel ins Englische und hängt sie als article["headline_en_for_topic"] / "content_en_for_topic" an. Der Topic-Filter zeigt sie zusätzlich zum Original und beurteilt damit ja/zh/ko/ar/he/ru/fa-Artikel fair. - agents/translator.py: neue Funktion translate_headlines_for_topic_filter, unabhängig vom TRANSLATOR_ENABLED-Flag (Pflicht für korrekten Topic-Filter). - agents/analyzer.py: filter_relevant_articles zeigt Übersetzungen mit an; Prompt-Regel erweitert. - agents/orchestrator.py: Aufruf direkt vor dem Topic-Filter-Schritt. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-21 01:43:27 +02:00
IntelSight_Admin	10606dba95	Sprach-aware Keyword-Matching (#27 )	2026-05-21 00:31:29 +02:00
UserIsMH	3345743aa5	feat(rss/telegram): sprach-aware Keyword-Matching für nicht-lateinische Quellen Bisher generierte Haiku Keywords nur in DE/EN/Romaji. Japanische RSS-Feeds (z.B. MOD-GNews mit "防衛省・自衛隊の宇宙政策") matchten daher nie, weil "jieitai" ≠ "自衛隊". Arabische/persische Telegram-Channels matchten nur durch Zufall (lateinische Eigennamen in Hashtags/URLs). Drei zusammenhängende Änderungen: 1. get_feeds_with_metadata liefert primary_language pro Feed mit. 2. FEED_SELECTION_PROMPT_TEMPLATE und KEYWORD_EXTRACTION_PROMPT verlangen sprach-gruppierte Keywords ({de:[...], en:[...], ja:[...], ru:[...], ...}). "en" enthält lateinische Eigennamen (universell). Andere Sprachen werden nur gegen Feeds derselben Sprache gematcht. 3. RSS- und Telegram-Parser kombinieren pro Feed/Channel die "en"-Universalbegriffe mit den Keywords der Quellsprache. Die Spezifik-Schwelle (1-Treffer-Match) greift jetzt auch ab 3 Zeichen bei Non-ASCII (CJK, Arabisch, Kyrillisch). Backward-kompatibel: flache Keyword-Listen werden weiter akzeptiert. Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>	2026-05-21 00:29:49 +02:00
IntelSight_Admin	2cfc14b264	Promote develop → main (2026-05-17 00:40 UTC)	2026-05-17 02:40:37 +02:00
Claude Code	168fbc3987	feat(sources): PDF-Upload auch in der Endkunden-App (Kundenquelle) - POST /api/sources/upload-pdf: tenant-scoped Upload, gleiche Speicher- Konvention wie der Verwaltungs-Endpoint (<dirname(DB)>/pdfs/{sha}.pdf). Duplikat-Check beruecksichtigt globale Quellen. - dashboard.html: +PDF-Button in der Quellenverwaltungs-Toolbar + eigenes Modal modal-pdf-upload (closeModal-Quotes via '). - app.js: App.openPdfUpload + _bindPdfUploadFormOnce (Submit nur einmal binden). - api.js: API.upload(path, formData) Helper analog Verwaltung.	2026-05-16 23:57:32 +00:00
Claude Code	e68386f6bb	feat(sources): PDF-Dokumente als neuer Quellentyp pdf_document - SOURCE_TYPE_PATTERN um pdf_document erweitert - src/services/pdf_ingest.py: pdfplumber + Tesseract-OCR-Fallback, Uebersetzung nach DE+EN, ein Pool-Artikel pro PDF - Scheduler-Job pdf_ingest laeuft im Minuten-Takt und verarbeitet pdf_document-Quellen mit processed_at IS NULL - scripts/migrate_pdf_source.py: idempotente DB-Migration (sources.pdf_path/pdf_sha256/processed_at, articles.headline_en/content_en) - requirements.txt: pdfplumber, pytesseract, pdf2image, Pillow	2026-05-16 23:21:50 +00:00
IntelSight_Admin	3f97aa63e9	Promote develop → main (2026-05-13 22:38 UTC)	2026-05-14 00:38:19 +02:00
IntelSight_Admin	52a631921e	Release-Notes: Oberfläche vollständig in Ihrer Sprache verfügbar	2026-05-14 00:38:16 +02:00
Claude Code	892af55269	feat(i18n): Export-Modal + Quellenverwaltung + Chat-Widget + Stats-Bar - Export-Modal: Titel, Bereiche, Format, alle Checkboxes (Zusammenfassung, Recherchebericht / Lagebild, Faktencheck, Quellen), PDF/DOCX, Abbrechen, Exportieren. - Quellenverwaltung-Modal: Title, 8 Filter-Labels (sr-only) + 8 Alle-* Default-Optionen, Search-Placeholder + Label, + Quelle-Button, Add- Form (URL/Erkennen/Name/Kategorie/Typ/RSS-URL/Domain/Notizen + Placeholder), Speichern/Abbrechen, Loading-State. - Stats-Bar (app.js): RSS-Feeds/Web-Quellen/Ausgeschlossen-Labels. - components.js: source-excluded-badge. - Chat-Widget: Title, alle 5 Buttons mit title+aria, Input-Placeholder. - Chat-Begruessung in chat.js auf T() umgestellt. - 50+ neue i18n-Keys. Cache-Buster components.js + chat.js + app.js auf v=20260514e gebumpt.	2026-05-13 22:22:07 +00:00
Claude Code	ea630cd31b	feat(i18n): grosser Sweep -- Toasts, Confirms, Notification-Center, Map, Empty-States, Lizenz-Hinweise 29 Stellen im Frontend lokalisiert (Toasts: Lage aktualisiert/geloescht/ archiviert/wiederhergestellt, Recherche abgebrochen, Daten aktualisiert, Quelle hinzugefuegt/aktualisiert, Bericht heruntergeladen, kein RSS; Confirms: Lage loeschen, Recherche abbrechen; Button-States: Wird gestartet/abgebrochen/erstellt/gesendet, Suche Feeds, Quelle speichern; Lizenz: abgelaufen/keine/Org-deaktiviert -- Nur Lesezugriff; Notification-Center: Titel, Alle gelesen, Keine Benachrichtigungen; Empty-States: Kein Vorfall ausgewaehlt; Map: Orte einlesen + Tooltip, Keine Orte erkannt; Modal-Hint: Nur deutschsprachige Quellen). 30+ neue i18n-Keys. Cache-Buster app.js auf v=20260514c.	2026-05-13 22:16:42 +00:00
Claude Code	4fc3212e2c	fix(i18n): Notify-Summary-Toggle wird beim Lage-Edit ueberschrieben app.js:1037-1043 setzte den Text der notify-summary-Checkbox dynamisch auf Neues Lagebild / Neuer Recherchebericht und damit das data-i18n- Attribut zurueck. Jetzt ueber T() mit Forschungs-/Lagebild-Varianten. Neuer Key modal.notify.summary_research.	2026-05-13 22:09:06 +00:00
Claude Code	3a68097b4f	feat(i18n): Aktions-Buttons dynamisch + komplettes Neue-Lage/Bearbeiten-Modal - _updateRefreshButton + _updateArchiveButton (app.js) nutzen T() statt Hardcode -- Aktualisieren/Laeuft/Wiederherstellen/Archivieren/Lesemodus. - Modal-Title-Setter (Lage bearbeiten / Neue Lage anlegen) lokalisiert an drei Stellen (init / openEdit / closeModal). - updateVisibilityHint und toggleTypeDefaults: dynamischer Text via T(). - HTML: ~31 data-i18n + data-i18n-attr im modal-new (Art der Lage, Optionen, Type-Hint, Quellen-Toggles, Sichtbarkeit, Aktualisierung, Intervall-Einheiten, Aufbewahrung, E-Mail-Toggles, Abbrechen). - Cache-Buster app.js auf v=20260514a.	2026-05-13 22:05:31 +00:00
Claude Code	90f0731a86	feat(i18n): Aktionsleiste + Sidebar (Quellen, Feedback, Archiv, Stats, Empty-States) - 5 Action-Buttons im Header (Aktualisieren/Bearbeiten/Bericht exportieren/Archivieren/Loeschen) via data-i18n. - Sidebar Archiv-Section, Quellen-Button, Feedback-Button, title- Attribute via data-i18n + data-i18n-attr. - Sidebar-Stats 0 Quellen / 0 Artikel: app.js.updateSidebarStats baut die Suffixe ueber T() zusammen. - Empty-States Kein Live-Monitoring / Keine Deep-Research (inkl. eigene-Filter-Varianten) lokalisiert. - Cache-Buster app.js auf v=20260513g.	2026-05-13 22:00:00 +00:00
Claude Code	917c260298	fix(i18n): Tab-Labels werden dynamisch ueberschrieben -- T() statt hardcode LayoutManager.applyTypeLabels(layout.js:58-65) und App-Render (app.js:1063,1081) ueberschreiben die Tab-Texte je nach Lage-Typ. Beides nutzt jetzt T() mit DE-Fallback. Neue Keys tab.summary_short und tab.summary_report. Cache-Buster layout.js + app.js gebumpt.	2026-05-13 21:51:49 +00:00
Claude Code	a2d290df6d	feat(i18n): Tab-Buttons und Card-Titel der Lage-Ansicht lokalisieren 7 Tab-Buttons (Neueste Entwicklungen, Lagebild, Ereignis-Timeline, Geografische Verteilung, Faktencheck, Analysepipeline, Quellenuebersicht) sowie 6 Card-Titel + Map-Fullscreen-Titel bekommen data-i18n. Neue Keys tab.* und card.* in de.json + en.json. Cache-Buster app.js auf v=20260513e gebumpt.	2026-05-13 21:48:23 +00:00
Claude Code	9e3c9559d9	feat(i18n): Progress-Popup + Pipeline-Stati lokalisieren - components._getStepLabel und progress-popup-title nutzen T() fuer Erste Recherche laeuft / Aktualisierung laeuft / In Warteschlange / Wird abgebrochen. - pipeline._formatHeader / _relativeTime / _formatCount lokalisiert: Status-Texte (erledigt/laeuft/Fehler), Zeitangaben (gerade eben, vor X Min/Std/Tagen), Aktualisierung-laeuft-Header. - dashboard.html: data-i18n auf pipeline-empty, progress-popup-title, progress-check-label (4 Stueck). - Cache-Buster fuer components.js + pipeline.js auf v=20260513d.	2026-05-13 21:45:18 +00:00
Claude Code	b214249a34	fix(i18n): Beschreibung-generieren-Button + Fehler-Toasts uebersetzbar - Button-Span enhance-btn-text bekommt data-i18n. - app.js: Loading-State Wird generiert... / Generating... per T(). - Vier Fehler-Toasts (Default, 503, 429, 504) per T() lokalisiert. - Neue Keys enhance.* in de.json + en.json. - Cache-Buster app.js auf v=20260513c gebumpt.	2026-05-13 21:39:36 +00:00
Claude Code	10805dff15	fix(frontend): app.js Cache-Buster bumpen damit I18N.load() greift Bei Phase 6 wurde components.js und i18n.js gebumpt, app.js aber nicht. Browser zogen die alte app.js ohne I18N-Init aus dem Cache, sodass eng_demo-Nutzer eine deutsche Oberflaeche sahen.	2026-05-13 21:34:19 +00:00
Claude Code	cdcf5e487a	fix(auth): Org-Switcher auch auf Staging anzeigen STAGING_MODE deaktivierte bisher den Org-Switcher im Frontend, weil keine Demo-Besucher zwischen Mandanten hoppen sollten. Mit eng_demo brauchen wir aber bewussten Zugriff auf alle Sprach-Mandanten via Switcher. Der Token-Budget-Schutz (license_service._staging_mode) bleibt unveraendert.	2026-05-13 21:32:50 +00:00
Claude Code	3f0e680446	feat(frontend): Light-i18n + Org-Sprache durch /auth/me Backend: - UserMeResponse um output_language (de \| en) erweitert. - /auth/me liefert die Org-Sprache aus organization_settings. Frontend: - Neu: static/js/i18n.js mit T(key)-Helper, I18N.load(lang) und applyDom() ueber data-i18n + data-i18n-attr. - Neu: static/i18n/de.json + en.json (sichtbare Bereiche: Sidebar, Header, Modal-Titel, Faktencheck-Status, Refresh-Hinweise). - dashboard.html: i18n.js Script-Tag vor api.js, data-i18n auf den prominenten Strings (Abmelden, + Neuer Fall, Alle/Eigene, Sidebar- Sektionen, Bericht exportieren, Faktencheck-Tab, Lage anlegen). Tutorial.init() entfernt aus DOMContentLoaded. - components.js: factCheckLabels/Tooltips/ChipLabels als Getter ueber T() mit DE-Fallbacks. - app.js: vor Setup wird I18N.load(user.output_language) aufgerufen und applyDom() ausgefuehrt. Tutorial.init() laeuft nur bei lang === de. Phase 6 von 8 (eng_demo / Org-Sprache).	2026-05-13 21:14:56 +00:00
Claude Code	4e51834163	feat(emails): zweisprachige E-Mail-Templates + Notification-Texte org-relativ - email_utils/templates.magic_link_login_email + incident_notification_email nehmen jetzt lang Parameter (de \| en). - routers/auth.request_magic_link zieht Sprache aus der Org des Users und uebergibt sie ans Template. - agents/orchestrator._send_email_notifications_for_incident lokalisiert ebenfalls und gibt lang an incident_notification_email durch. - DB-Notification-Texte (refresh_summary, new_articles) sind in der Pipeline org-sprach-relativ (englische Variante: "3 new articles", etc.). Status-Change-Notifications: Codes (confirmed/contradicted) bleiben, FE uebersetzt sie in Phase 6. Phase 5 von 8 (eng_demo / Org-Sprache).	2026-05-13 21:08:32 +00:00
Claude Code	a2d4c77813	feat(backend): Lokalisierung der weiteren Pipeline-Bereiche - incidents.enhance_description: ENHANCE_PROMPT_RESEARCH/ADHOC nun pro Sprache (DE/EN), Auswahl via _enhance_template(type, org_lang_iso). - pipeline_tracker.get_pipeline_steps(lang_iso) liefert die Schritt- Definition lokalisiert. /api/incidents/{id}/pipeline reicht Org-Sprache durch. - chat._build_prompt(output_language): SYSTEM_PROMPT laesst sich per format() in Org-Sprache rendern (nur Output-Anweisung). Chat-Router zieht Sprache aus Org-Setting. - report_generator: FC_STATUS_LABELS_DE/EN + _fc_labels(lang_iso). PDF-Template bleibt vorerst deutsch (Phase 9). Bewusst draussen (Phase 4): entity_extractor (Backend-intern, keine UI), source_suggester (Admin in Verwaltung), geoparsing (liefert bereits englische Ortsnamen). Phase 4 von 8 (eng_demo / Org-Sprache).	2026-05-13 21:04:20 +00:00
Claude Code	9754dcb4ef	feat(sources): primary_language Spalte + ISO-Backfill + org-relativer Feed-Bucket - Neue Spalte sources.primary_language (ISO-2-Code) mit Backfill aus dem Freitext-Feld language (Erste Sprache vor /-Trennung). Edge-Cases wie Iran Military Magazine (English) [Farsi/Arabisch] landen als fa und koennen ueber das Verwaltungsportal manuell justiert werden. - get_source_rules(tenant_id) bestimmt die Org-Sprache und bucketed Feeds nach primary (=Org-Sprache) / international (=alle anderen) / behoerden (Kategorie behoerde). Bei tenant_id=None oder Helper-Fehler default de. - rss_parser.search_feeds unveraendert in Logik (international=False laesst weiterhin alle ausser dem international-Bucket durch), Kommentare generischer formuliert. Phase 3 von 8 (eng_demo / Org-Sprache).	2026-05-13 20:57:51 +00:00
Claude Code	f68d25dbce	feat(pipeline): output_language pro Org durch die Pipeline reichen - OUTPUT_LANGUAGE Konstante aus config.py entfernt (jetzt pro Org in organization_settings). - Orchestrator laedt output_language einmal pro Refresh aus der Org-Sprache. - researcher.search(), analyzer.analyze/.analyze_incremental/.generate_latest_developments, factchecker.check/.check_incremental/.check_incremental_twophase bekommen output_language als Parameter (Default Deutsch). - LANG_INTERNATIONAL / LANG_GERMAN_ONLY (+ Deep-Varianten) sind Funktionen, die je nach output_language die Sprachanweisung erzeugen (Deutsch \| English \| Fallback). - Sprachfilter in researcher.search ist org-relativ: bei nicht-international werden Artikel mit Sprache != output_language_iso gefiltert. Phase 2 von 8 (eng_demo / Org-Sprache). Bestandsorgs unveraendert, weil Default-Setting weiterhin de (siehe Phase-1-Migration).	2026-05-13 20:54:28 +00:00
Claude Code	d27d586003	feat(settings): organization_settings KV-Tabelle + org_settings Helper Neue Tabelle organization_settings (organization_id, key, value) als KV-Store fuer Org-spezifische Konfiguration. Erster Use-Case: output_language (de\|en). Bestandsorgs werden per Migration auf de gesetzt. Helper services/org_settings.py mit get_org_setting / set_org_setting / get_org_language / language_display. In-Memory-Cache TTL 60s. Phase 1 von 8 (eng_demo / Org-Sprache).	2026-05-13 20:46:04 +00:00
Claude (info@aegis-sight.de)	5ec4480598	fix(incidents): refresh_mode beim Edit nicht durch toggleTypeDefaults überschreiben Beim Öffnen des Bearbeiten-Dialogs einer Recherche-Lage (type=research) hat toggleTypeDefaults() den Aktualisierungs-Select hartcodiert auf manual gesetzt und damit den tatsächlichen DB-Wert im UI verdeckt. User glaubte, manuell sei gewählt, in der DB stand aber auto und die Lage lief weiter im Auto-Refresh. Fix: toggleTypeDefaults erhält einen optionalen Parameter preserveMode. handleEdit ruft mit preserveMode=true auf, damit der DB-Wert respektiert wird; bei Typ-Wechsel und Neuanlage bleibt der Default-Reset auf manual für research erhalten. Cache-Buster app.js: 20260501h -> 20260512a.	2026-05-12 21:02:04 +00:00
Claude Code	b90e47ff3f	refactor(klassifikation): Klassifikation aus Monitor entfernt — Pflege jetzt in der Verwaltung Endpoints unter /api/sources/classification/* weg, Service-Module (source_classifier, external_reputation) gelöscht. Quellen-Modal verliert Tab Klassifikations-Review, Klassifikations-Section in der Edit-Form, alle Bulk-Buttons (Sync, Klassifikation starten, Bulk-Approve). API-Methoden in api.js entfernt, alignment-Helper raus, saveSource entschlackt. Read-Only bleibt: Filter-Dropdowns über der Quellenliste (Politik, Medientyp, Reliability, Externe Reputation, Alignment) und Inline-Badges (_renderClassificationBadges + Label-Maps in components.js). Kunde sieht nur freigegebene Werte. GET /api/sources liefert weiter Klassifikations-Felder + alignments für die Anzeige; SourceCreate/SourceUpdate akzeptieren keine Klassifikations-Felder mehr. Bulk-Klassifikations-Skripte entfernt — Pflege läuft über Verwaltungs-UI.	2026-05-09 22:01:20 +00:00
IntelSight_Admin	449bfbb25b	Merge pull request 'Promote: Reihenfolge Strategie-Eskalation/Karteileichen' (#24 ) from develop into main	2026-05-09 17:44:28 +02:00
Claude	5f053a3eca	fix(source_suggester): Strategie-Eskalation vor Karteileichen ausfuehren Live-Test heute zeigte: Strategie-Eskalations-Heuristik hat keine Vorschlaege erzeugt, obwohl Verfassungsschutz und Rheinische Post beide fetch_strategy= googlebot UND status=error haben. Grund: die Karteileichen-Heuristik lief zuerst und fing diese Sources schon ein (article_count=0, weil googlebot- Workaround blockiert), sodass die Doppel-Vermeidung der Strategie- Eskalations-Stufe alles uebersprungen hat. Fix: Reihenfolge in generate_suggestions umgekehrt. Strategie-Eskalation zuerst (spezifischere Diagnose mit Begruendung "Workaround greift nicht: HTTP 403"), Karteileichen danach (generische Auffanglogik).	2026-05-09 15:43:36 +00:00
IntelSight_Admin	645ebbc610	Promote develop -> main	2026-05-09 17:26:51 +02:00
Claude	49c557205d	feat(source_suggester): Strategie-Eskalations-Heuristik Neue Funktion generate_strategy_escalation_suggestions(db) erkennt aktive Quellen, deren fetch_strategy bereits auf googlebot oder paywall eskaliert wurde, beim Reachability-Check aber weiterhin status=error melden. Beispiel: Rheinische Post hat fetch_strategy=googlebot, kriegt aber HTTP 403. -> Auch der Googlebot-UA-Workaround greift nicht. Quelle wird automatisch als deactivate-Vorschlag mit priority=high markiert. Doppel-Vermeidung wie in der Karteileichen-Heuristik: nur wenn fuer die source_id noch kein pending deactivate-Vorschlag existiert. Aufgerufen in generate_suggestions als zweite deterministische Stufe, zwischen Karteileichen-Heuristik und Haiku-Aufruf. Counter im Log gibt jetzt alle drei Quellen-Beitraege getrennt aus.	2026-05-09 15:26:05 +00:00
IntelSight_Admin	8fd2ec91aa	Promote develop -> main	2026-05-09 17:20:18 +02:00
Claude	d973dc7651	feat(source_suggester): Karteileichen-Heuristik vor Haiku-Stufe Neue Funktion generate_stale_deactivation_suggestions(db, days_threshold=60) erzeugt deactivate_source-Vorschlaege fuer aktive Quellen, die entweder - noch nie einen Artikel geliefert haben (article_count=0), oder - seit mehr als 60 Tagen stumm sind (last_seen_at < now - 60d). Reine SQL-Heuristik, kein KI-Aufruf. Wird zu Beginn von generate_suggestions ausgefuehrt, vor dem bestehenden Haiku-Lauf. Doppel-Vermeidung: existiert fuer eine source_id schon ein pending deactivate_source-Vorschlag, wird kein neuer eingefuegt. Hintergrund: Aktuell sind 106 Quellen mit Warning "Noch nie Artikel geliefert" und einige weitere mit "Letzter Artikel vor 49 Tagen" o.ae. Diese fluten den Health-Status-Tab. Mit der neuen Heuristik wandern sie automatisch in die Vorschlaege-Liste, wo der Admin sie per Klick deaktivieren kann. Schwelle 60 Tage als Konstante STALE_DEACTIVATE_THRESHOLD_DAYS oben in der Datei, falls spaeter noch justiert werden soll.	2026-05-09 15:09:32 +00:00
IntelSight_Admin	ed057fa6f5	Promote develop → main (2026-05-09 10:57 UTC)	2026-05-09 12:57:13 +02:00
Claude Code	00d7dd70fc	fix(source_health): paywall-Strategie nicht ueber removepaywall fuer Feed-URL removepaywall.com liefert HTML (Article-Renderer), nicht XML - der Feed-Validity-Check schlug daher fehl mit "Kein gueltiger RSS/Atom-Feed". Korrektur: - paywall: Feed-URL direkt mit Browser-UA laden (kein URL-Rewrite). - Bei paywall + 4xx: status=warning (erwartbar), Feed-Validity skippen. - removepaywall.com bleibt im Researcher-Prompt fuer Article-Inhalte (das ist der korrekte Use-Case).	2026-05-09 05:02:19 +00:00
Claude Code	a716726e36	fix(source_health): paywall-Strategie nicht ueber removepaywall fuer Feed-URL removepaywall.com liefert HTML (Article-Renderer), nicht XML - der Feed-Validity-Check schlug daher fehl mit "Kein gueltiger RSS/Atom-Feed". Korrektur: - paywall: Feed-URL direkt mit Browser-UA laden (kein URL-Rewrite). - Bei paywall + 4xx: status=warning (erwartbar), Feed-Validity skippen. - removepaywall.com bleibt im Researcher-Prompt fuer Article-Inhalte (das ist der korrekte Use-Case).	2026-05-09 05:02:18 +00:00
Claude Code	29c10e85cb	fix: removepaywalls.com -> removepaywall.com (Singular ist die echte Domain) User-Korrektur: die echte Service-Domain heisst removepaywall.com (Singular). removepaywalls.com (Plural) liefert HTTP 403 - vermutlich nicht der gleiche Service oder gar nicht mehr existent. Betrifft: - services/source_health.py: REMOVEPAYWALLS_PREFIX-Konstante (Phase 18) - agents/researcher.py: Claude-Prompts fuer Paywall-Hinweise (zwei Stellen) Verifiziert mit curl: removepaywall.com -> 200, removepaywalls.com -> 403.	2026-05-09 05:00:11 +00:00
Claude Code	f22c8dbc61	fix: removepaywalls.com -> removepaywall.com (Singular ist die echte Domain) User-Korrektur: die echte Service-Domain heisst removepaywall.com (Singular). removepaywalls.com (Plural) liefert HTTP 403 - vermutlich nicht der gleiche Service oder gar nicht mehr existent. Betrifft: - services/source_health.py: REMOVEPAYWALLS_PREFIX-Konstante (Phase 18) - agents/researcher.py: Claude-Prompts fuer Paywall-Hinweise (zwei Stellen) Verifiziert mit curl: removepaywall.com -> 200, removepaywalls.com -> 403.	2026-05-09 05:00:11 +00:00
Claude Code	03173eaa1a	feat(source_health): fetch_strategy + Retry mit Googlebot/removepaywalls (Phase 18) Pro Quelle ein Feld sources.fetch_strategy (default \| googlebot \| paywall \| skip): - default: normaler UA, Retry mit Googlebot bei 403/406/429. - googlebot: direkt mit Googlebot-UA (fuer SEO-freundliche Sites). - paywall: Anfrage via removepaywalls.com (fuer Spiegel+/SZ+/FT etc.). - skip: Health-Check ueberspringen (bekannte unerreichbare Quellen wie Login-only). Pre-Flagging in der Migration: FT/WSJ/NZZ/Handelsblatt/WiWo -> paywall, Rheinische Post/Verfassungsschutz -> googlebot. (Test mit den vier prominent fehlerhaften Quellen zeigt: FT/RP/Verfassungsschutz sind besonders streng, gehen auch nicht ueber Googlebot/removepaywalls durch. Fuer milder restriktive Quellen wirkt der Retry-Mechanismus.)	2026-05-09 04:56:07 +00:00
Claude Code	8af0fa07c8	feat(source_health): fetch_strategy + Retry mit Googlebot/removepaywalls (Phase 18) Pro Quelle ein Feld sources.fetch_strategy (default \| googlebot \| paywall \| skip): - default: normaler UA, Retry mit Googlebot bei 403/406/429. - googlebot: direkt mit Googlebot-UA (fuer SEO-freundliche Sites). - paywall: Anfrage via removepaywalls.com (fuer Spiegel+/SZ+/FT etc.). - skip: Health-Check ueberspringen (bekannte unerreichbare Quellen wie Login-only). Pre-Flagging in der Migration: FT/WSJ/NZZ/Handelsblatt/WiWo -> paywall, Rheinische Post/Verfassungsschutz -> googlebot. (Test mit den vier prominent fehlerhaften Quellen zeigt: FT/RP/Verfassungsschutz sind besonders streng, gehen auch nicht ueber Googlebot/removepaywalls durch. Fuer milder restriktive Quellen wirkt der Retry-Mechanismus.)	2026-05-09 04:56:06 +00:00
Claude Code	594b9cfa2c	fix(source_health): URL-Schema vor httpx.get sicherstellen Telegram-Quellen mit url=t.me/kanal (ohne https:// Prefix) liessen httpx mit "ValueError: unknown url type" crashen. Fix: vor dem Request https:// vorne anhaengen wenn kein Schema vorhanden ist. Beobachtet auf Live: 110 Health-Errors, davon einige Telegram-Kanaele mit "ValueError: unknown url type:" als Fehlermeldung.	2026-05-09 04:45:19 +00:00
Claude Code	1ee6c4ddf1	fix(source_health): URL-Schema vor httpx.get sicherstellen Telegram-Quellen mit url=t.me/kanal (ohne https:// Prefix) liessen httpx mit "ValueError: unknown url type" crashen. Fix: vor dem Request https:// vorne anhaengen wenn kein Schema vorhanden ist. Beobachtet auf Live: 110 Health-Errors, davon einige Telegram-Kanaele mit "ValueError: unknown url type:" als Fehlermeldung.	2026-05-09 04:45:18 +00:00
Claude Code	087ec547f7	fix(source_health): tenant-faehig + History (Phase 2 in den Monitor ziehen) Phase 2 hatte die Verbesserungen nur in der Verwaltung (src/shared/services/source_health.py). Der Daily-Health-Check laeuft aber im Monitor-Backend (Cron 04:00 UTC) und nutzte deshalb weiter den alten Code - Folge: - Tenant-Quellen wurden NIE gecheckt (0 Eintraege in source_health_checks fuer tenant_id IS NOT NULL). - source_health_history blieb leer. Diese Aenderung holt die Phase-2-Logik in den Monitor: - services/source_health.py: Verwaltung-Version 1:1 uebernommen (tenant_id-Filter weg + History-Save vor DELETE + UA/Timeout aus config). - config.py: HEALTH_CHECK_USER_AGENT + HEALTH_CHECK_TIMEOUT_S ergaenzt. Manueller Test auf Staging-Monitor: 283 Quellen geprueft, 253 Issues, 61 davon Tenant-Quellen. History 0 -> 458 Eintraege. Damit ist die shared/-LOCKED-FILES-Markierung in der Verwaltung obsolet - beide Repos haben jetzt den gleichen Code.	2026-05-09 04:43:02 +00:00
Claude Code	72b306d90c	fix(source_health): tenant-faehig + History (Phase 2 in den Monitor ziehen) Phase 2 hatte die Verbesserungen nur in der Verwaltung (src/shared/services/source_health.py). Der Daily-Health-Check laeuft aber im Monitor-Backend (Cron 04:00 UTC) und nutzte deshalb weiter den alten Code - Folge: - Tenant-Quellen wurden NIE gecheckt (0 Eintraege in source_health_checks fuer tenant_id IS NOT NULL). - source_health_history blieb leer. Diese Aenderung holt die Phase-2-Logik in den Monitor: - services/source_health.py: Verwaltung-Version 1:1 uebernommen (tenant_id-Filter weg + History-Save vor DELETE + UA/Timeout aus config). - config.py: HEALTH_CHECK_USER_AGENT + HEALTH_CHECK_TIMEOUT_S ergaenzt. Manueller Test auf Staging-Monitor: 283 Quellen geprueft, 253 Issues, 61 davon Tenant-Quellen. History 0 -> 458 Eintraege. Damit ist die shared/-LOCKED-FILES-Markierung in der Verwaltung obsolet - beide Repos haben jetzt den gleichen Code.	2026-05-09 04:43:01 +00:00
Claude Code	f1b55dd104	fix(incidents): international-Default auf False (Bug 3 Buckelwal-Diagnose) Beim Anlegen einer neuen Lage ist der Schalter "Internationale Quellen einbeziehen" ab jetzt standardmaessig DEAKTIVIERT. Hintergrund: Bei lokalen DACH-Ereignissen (Tier-/Personenstoryen wie "Buckelwal timmy") hat der "international=True"-Default zu schlechteren Treffern gefuehrt, weil Claude in Deutsch UND Englisch suchte und die englische Berichterstattung haeufig fehlt. Excluded-Sources- und Boulevard-Filter haben das Problem zusaetzlich verschaerft. Aenderungen: - src/models.py IncidentCreate.international_sources: bool=True -> False (nur das Pydantic-Default beim Create-Endpoint - IncidentResponse/Incident bleiben True, weil das die DB-Werte bestehender Lagen reflektiert) - src/static/dashboard.html: <input id="inc-international" checked> -> ohne checked (UI-Default ist jetzt unchecked, User muss bewusst aktivieren fuer internationale Lagen) - Tooltip-Text ergaenzt: "Deaktiviert (Standard): ... empfohlen fuer DACH-Lagen." Bestandslagen sind nicht betroffen - DB-Schema-Default INTEGER DEFAULT 1 bleibt unveraendert, fuer alle existierenden Lagen behaelt international seinen aktuellen Wert. Damit ist die Buckelwal-Diagnose komplett geloest: - Bug 1 (rss_parser min_matches adaptiv) seit `a08df3d` auf main - Bug 2 (Eigennamen-Pflicht-Keywords) seit `e83f80d` auf main - Bug 3 (international-Default) jetzt auf develop, gleich Cherry-pick auf main	2026-05-09 04:20:58 +00:00
Claude Code	0e578a38a0	fix(incidents): international-Default auf False (Bug 3 Buckelwal-Diagnose) Beim Anlegen einer neuen Lage ist der Schalter "Internationale Quellen einbeziehen" ab jetzt standardmaessig DEAKTIVIERT. Hintergrund: Bei lokalen DACH-Ereignissen (Tier-/Personenstoryen wie "Buckelwal timmy") hat der "international=True"-Default zu schlechteren Treffern gefuehrt, weil Claude in Deutsch UND Englisch suchte und die englische Berichterstattung haeufig fehlt. Excluded-Sources- und Boulevard-Filter haben das Problem zusaetzlich verschaerft. Aenderungen: - src/models.py IncidentCreate.international_sources: bool=True -> False (nur das Pydantic-Default beim Create-Endpoint - IncidentResponse/Incident bleiben True, weil das die DB-Werte bestehender Lagen reflektiert) - src/static/dashboard.html: <input id="inc-international" checked> -> ohne checked (UI-Default ist jetzt unchecked, User muss bewusst aktivieren fuer internationale Lagen) - Tooltip-Text ergaenzt: "Deaktiviert (Standard): ... empfohlen fuer DACH-Lagen." Bestandslagen sind nicht betroffen - DB-Schema-Default INTEGER DEFAULT 1 bleibt unveraendert, fuer alle existierenden Lagen behaelt international seinen aktuellen Wert. Damit ist die Buckelwal-Diagnose komplett geloest: - Bug 1 (rss_parser min_matches adaptiv) seit `a08df3d` auf main - Bug 2 (Eigennamen-Pflicht-Keywords) seit `e83f80d` auf main - Bug 3 (international-Default) jetzt auf develop, gleich Cherry-pick auf main	2026-05-09 04:20:58 +00:00
Claude Code	e83f80dbe9	fix(researcher): Lagentitel-Eigennamen als Pflicht-Keywords (Bug 2 Buckelwal-Diagnose) KEYWORD_EXTRACTION_PROMPT explizit erweitert: - Eigennamen/Tiernamen/Personennamen aus dem THEMA als ZWINGEND markiert. - Hinweis dass DE und EN identisch sein duerfen (Eigennamen). - Klar gesagt: bei spezifischen Begriffen (>=7 Zeichen) reicht 1 Treffer in RSS-Headlines (passt zu rss_parser.py adaptive Schwelle aus `a08df3d`). Code-Post-Processing (researcher.py _extract_keywords): - Nach dem Parser werden Lagentitel-Woerter (>=4 Zeichen, nicht in Stopwords) ggf. in die Keyword-Liste injiziert, falls Haiku sie weggelassen hat. - Verhindert konkret den "Buckelwal timmy"-Bug: "timmy" fehlte in Haikus Liste, damit fielen Headlines mit nur "Buckelwal" durch das min_matches. Hintergrund: Memory-Eintrag rss_match_und_keyword_bug.md, Bug 2 von 3. Bug 1 (rss_parser min_matches adaptiv) ist seit Commit `a08df3d` auf Live. Bug 3 (international=True default) bleibt offen, ist primaer UX-Frage.	2026-05-09 03:52:36 +00:00
Claude Code	5a123ef3b8	fix(researcher): Lagentitel-Eigennamen als Pflicht-Keywords (Bug 2 Buckelwal-Diagnose) KEYWORD_EXTRACTION_PROMPT explizit erweitert: - Eigennamen/Tiernamen/Personennamen aus dem THEMA als ZWINGEND markiert. - Hinweis dass DE und EN identisch sein duerfen (Eigennamen). - Klar gesagt: bei spezifischen Begriffen (>=7 Zeichen) reicht 1 Treffer in RSS-Headlines (passt zu rss_parser.py adaptive Schwelle aus `a08df3d`). Code-Post-Processing (researcher.py _extract_keywords): - Nach dem Parser werden Lagentitel-Woerter (>=4 Zeichen, nicht in Stopwords) ggf. in die Keyword-Liste injiziert, falls Haiku sie weggelassen hat. - Verhindert konkret den "Buckelwal timmy"-Bug: "timmy" fehlte in Haikus Liste, damit fielen Headlines mit nur "Buckelwal" durch das min_matches. Hintergrund: Memory-Eintrag rss_match_und_keyword_bug.md, Bug 2 von 3. Bug 1 (rss_parser min_matches adaptiv) ist seit Commit `a08df3d` auf Live. Bug 3 (international=True default) bleibt offen, ist primaer UX-Frage.	2026-05-09 03:52:36 +00:00
Claude Code	d71daee581	Mojibake fix: source_suggester.py + source_health.py via ftfy Beide Files hatten Doppel-Encoded UTF-8 in Docstrings, Kommentaren und Prompt-Strings (z.B. "prÃƒÂ¼ft" statt "prüft", "VorschlÃƒÂ¤ge" statt "Vorschläge"). ftfy hat das automatisch repariert. Hauptauswirkungen: - Logs sind jetzt mit echten Umlauten lesbar - Claude/Haiku-Prompts in source_suggester.py (Quellen-Vorschlaege via KI) bekommen jetzt korrekte deutsche Umlaute - sollte bessere Antworten geben Daneben hat ftfy line-endings normalisiert, daher der grosse Diff in source_health.py - inhaltlich nur Mojibake-Reparatur. Verifiziert mit: grep -cE "Ã¤\|Ã¶\|Ã¼\|ÃŸ\|Ã„\|Ã–\|Ãœ" src/services/*.py -> 0 Treffer	2026-05-09 03:39:34 +00:00
Claude Code	897e56997c	Mojibake fix: source_suggester.py + source_health.py via ftfy Beide Files hatten Doppel-Encoded UTF-8 in Docstrings, Kommentaren und Prompt-Strings (z.B. "prÃƒÂ¼ft" statt "prüft", "VorschlÃƒÂ¤ge" statt "Vorschläge"). ftfy hat das automatisch repariert. Hauptauswirkungen: - Logs sind jetzt mit echten Umlauten lesbar - Claude/Haiku-Prompts in source_suggester.py (Quellen-Vorschlaege via KI) bekommen jetzt korrekte deutsche Umlaute - sollte bessere Antworten geben Daneben hat ftfy line-endings normalisiert, daher der grosse Diff in source_health.py - inhaltlich nur Mojibake-Reparatur. Verifiziert mit: grep -cE "Ã¤\|Ã¶\|Ã¼\|ÃŸ\|Ã„\|Ã–\|Ãœ" src/services/*.py -> 0 Treffer	2026-05-09 03:35:13 +00:00

1 2 3 4 5 ...

558 Commits