feat(sources): primary_language Spalte + ISO-Backfill + org-relativer Feed-Bucket

- Neue Spalte sources.primary_language (ISO-2-Code) mit Backfill aus dem
  Freitext-Feld language (Erste Sprache vor /-Trennung). Edge-Cases wie
  Iran Military Magazine (English) [Farsi/Arabisch] landen als fa und
  koennen ueber das Verwaltungsportal manuell justiert werden.
- get_source_rules(tenant_id) bestimmt die Org-Sprache und bucketed Feeds
  nach primary (=Org-Sprache) / international (=alle anderen) / behoerden
  (Kategorie behoerde). Bei tenant_id=None oder Helper-Fehler default de.
- rss_parser.search_feeds unveraendert in Logik (international=False
  laesst weiterhin alle ausser dem international-Bucket durch), Kommentare
  generischer formuliert.

Phase 3 von 8 (eng_demo / Org-Sprache).
Dieser Commit ist enthalten in:
Claude Code
2026-05-13 20:57:51 +00:00
Ursprung f68d25dbce
Commit 9754dcb4ef
3 geänderte Dateien mit 61 neuen und 9 gelöschten Zeilen

Datei anzeigen

@@ -33,7 +33,7 @@ class RSSParser:
Args:
search_term: Suchbegriff
international: Wenn False, nur deutsche Feeds + Behoerden (keine internationalen)
international: Wenn False, nur Feeds in der Org-Sprache + Behoerden (keine internationalen)
tenant_id: Optionale Org-ID fuer tenant-spezifische Quellen
keywords: Optionale Claude-generierte Keywords (bevorzugt gegenüber Title-Split)
"""
@@ -84,7 +84,7 @@ class RSSParser:
continue
all_articles.extend(result)
cat_info = "alle" if international else "nur deutsch + behörden"
cat_info = "alle" if international else "nur primary + behörden"
logger.info(f"RSS-Suche nach '{search_term}' ({cat_info}): {len(all_articles)} Treffer")
all_articles = self._apply_domain_cap(all_articles)
return all_articles