claude-dev 731a66ac80 Quellen-Bereinigung: Duplikate, Kategorien, Domains, URLs
DB:
- 7 Duplikate deaktiviert (tagesschau Atom, Spiegel, Zeit HTTP,
  BBC/ORF/CNN Subdomain-Duplikate)
- tomshardware + medium deaktiviert (kaum OSINT-relevant)
- Kategorien korrigiert: ft.com/bloomberg→international,
  n-tv→qualitaetszeitung, diverse Tech→fachmedien
- Domain-Spalte normalisiert: feeds.bbci.co.uk→bbc.com,
  rss.sueddeutsche.de→sueddeutsche.de, on.orf.at→orf.at etc.
- Leere URLs bei web_sources gefüllt, Anzeigenamen korrigiert

Code (source_rules.py):
- _DOMAIN_ALIASES Map für Subdomain→kanonische Domain Zuordnung
- _extract_domain() nutzt Alias-Map für konsistente Gruppierung

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2026-03-04 23:35:33 +01:00
Beschreibung
OSINT-Monitoringsystem
5,8 MiB
Sprachen
Python 47.2%
JavaScript 34.6%
CSS 12.1%
HTML 6.1%