feat(sources): primary_language Spalte + ISO-Backfill + org-relativer Feed-Bucket
- Neue Spalte sources.primary_language (ISO-2-Code) mit Backfill aus dem Freitext-Feld language (Erste Sprache vor /-Trennung). Edge-Cases wie Iran Military Magazine (English) [Farsi/Arabisch] landen als fa und koennen ueber das Verwaltungsportal manuell justiert werden. - get_source_rules(tenant_id) bestimmt die Org-Sprache und bucketed Feeds nach primary (=Org-Sprache) / international (=alle anderen) / behoerden (Kategorie behoerde). Bei tenant_id=None oder Helper-Fehler default de. - rss_parser.search_feeds unveraendert in Logik (international=False laesst weiterhin alle ausser dem international-Bucket durch), Kommentare generischer formuliert. Phase 3 von 8 (eng_demo / Org-Sprache).
Dieser Commit ist enthalten in:
@@ -33,7 +33,7 @@ class RSSParser:
|
||||
|
||||
Args:
|
||||
search_term: Suchbegriff
|
||||
international: Wenn False, nur deutsche Feeds + Behoerden (keine internationalen)
|
||||
international: Wenn False, nur Feeds in der Org-Sprache + Behoerden (keine internationalen)
|
||||
tenant_id: Optionale Org-ID fuer tenant-spezifische Quellen
|
||||
keywords: Optionale Claude-generierte Keywords (bevorzugt gegenüber Title-Split)
|
||||
"""
|
||||
@@ -84,7 +84,7 @@ class RSSParser:
|
||||
continue
|
||||
all_articles.extend(result)
|
||||
|
||||
cat_info = "alle" if international else "nur deutsch + behörden"
|
||||
cat_info = "alle" if international else "nur primary + behörden"
|
||||
logger.info(f"RSS-Suche nach '{search_term}' ({cat_info}): {len(all_articles)} Treffer")
|
||||
all_articles = self._apply_domain_cap(all_articles)
|
||||
return all_articles
|
||||
|
||||
In neuem Issue referenzieren
Einen Benutzer sperren