From 8c4ef6b2cf7d05d32ad74767c89bbba9242df6e1 Mon Sep 17 00:00:00 2001 From: UserIsMH Date: Fri, 1 May 2026 18:52:02 +0200 Subject: [PATCH] =?UTF-8?q?CATEGORY=5FREPUTATION:=20Schl=C3=BCssel=20an=20?= =?UTF-8?q?aktuelle=20DB-Werte=20angepasst?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Die Reputation-Map nutzte veraltete Schlüssel (presseagenturen, behoerden, nachrichten_de/int), die nirgends in der DB vorkamen — die DB hat nachrichtenagentur, behoerde, oeffentlich-rechtlich, qualitaetszeitung, think-tank, regional, telegram, boulevard. Folge war ein stiller Bug: alle hochwertigen Quellen (Reuters, ZDF, tagesschau, Spiegel, FAZ, BMI etc.) bekamen den Default-Score 0.4 wie "sonstige" und wurden in der Relevanz-Sortierung nicht bevorzugt. Map jetzt vollständig auf aktuelle Kategorie-Werte: - nachrichtenagentur, behoerde: 1.00 - oeffentlich-rechtlich: 0.95 - qualitaetszeitung, think-tank: 0.85 - fachmedien: 0.80 - international: 0.75 - regional: 0.65 - telegram: 0.50 - sonstige: 0.40 - boulevard: 0.30 Test mit 200 zufälligen Artikeln aus der Live-DB: 155 besser bewertet, 0 schlechter, 45 unverändert. Stärkster Effekt bei ÖR (+0.165), Nachrichtenagenturen (+0.18), Qualitätszeitungen (+0.135). Co-Authored-By: Claude Opus 4.7 (1M context) --- src/agents/orchestrator.py | 22 ++++++++++++++-------- 1 file changed, 14 insertions(+), 8 deletions(-) diff --git a/src/agents/orchestrator.py b/src/agents/orchestrator.py index e8cc76d..72bb3a1 100644 --- a/src/agents/orchestrator.py +++ b/src/agents/orchestrator.py @@ -21,15 +21,21 @@ from source_rules import ( logger = logging.getLogger("osint.orchestrator") -# Reputations-Score nach Quellenkategorie (für Relevanz-Scoring) +# Reputations-Score nach Quellenkategorie (fuer Relevanz-Scoring). +# Keys muessen mit den tatsaechlichen DB-Werten in sources.category uebereinstimmen +# (siehe DOMAIN_CATEGORY_MAP in source_rules.py). CATEGORY_REPUTATION = { - "nachrichten_de": 0.9, - "nachrichten_int": 0.9, - "presseagenturen": 1.0, - "behoerden": 1.0, - "fachmedien": 0.8, - "international": 0.7, - "sonstige": 0.4, + "nachrichtenagentur": 1.0, # Reuters, AP, dpa, AFP — Primärquellen + "behoerde": 1.0, # BMI, BSI, Europol — offizielle Quellen + "oeffentlich-rechtlich": 0.95, # tagesschau, ZDF, ARD, BBC, ORF + "qualitaetszeitung": 0.85, # Spiegel, Zeit, FAZ, NZZ, Süddeutsche + "think-tank": 0.85, # SWP, IISS, Brookings, Chatham House + "fachmedien": 0.8, # heise, golem, netzpolitik, Handelsblatt + "international": 0.75, # CNN, Guardian, NYT, Al Jazeera, France24 + "regional": 0.65, # regionale Tageszeitungen + "telegram": 0.5, # OSINT-Kanaele — gemischte Qualitaet + "sonstige": 0.4, # unkategorisiert + "boulevard": 0.3, # Bild, Sun etc. } # Research-Modus: Automatisch 3 Durchläufe für optimale Ergebnisse