Mojibake fix: source_suggester.py + source_health.py via ftfy
Beide Files hatten Doppel-Encoded UTF-8 in Docstrings, Kommentaren und Prompt-Strings (z.B. "prüft" statt "prüft", "Vorschläge" statt "Vorschläge"). ftfy hat das automatisch repariert. Hauptauswirkungen: - Logs sind jetzt mit echten Umlauten lesbar - Claude/Haiku-Prompts in source_suggester.py (Quellen-Vorschlaege via KI) bekommen jetzt korrekte deutsche Umlaute - sollte bessere Antworten geben Daneben hat ftfy line-endings normalisiert, daher der grosse Diff in source_health.py - inhaltlich nur Mojibake-Reparatur. Verifiziert mit: grep -cE "ä|ö|ü|ß|Ä|Ö|Ü" src/services/*.py -> 0 Treffer
Dieser Commit ist enthalten in:
@@ -1,4 +1,4 @@
|
||||
"""KI-gestützte Quellen-Vorschläge via Haiku."""
|
||||
"""KI-gestützte Quellen-Vorschläge via Haiku."""
|
||||
import json
|
||||
import logging
|
||||
import re
|
||||
@@ -12,8 +12,8 @@ logger = logging.getLogger("osint.source_suggester")
|
||||
|
||||
|
||||
async def generate_suggestions(db: aiosqlite.Connection) -> int:
|
||||
"""Generiert Quellen-Vorschläge basierend auf Health-Checks und Lückenanalyse."""
|
||||
logger.info("Starte Quellen-Vorschläge via Haiku...")
|
||||
"""Generiert Quellen-Vorschläge basierend auf Health-Checks und Lückenanalyse."""
|
||||
logger.info("Starte Quellen-Vorschläge via Haiku...")
|
||||
|
||||
# 1. Aktuelle Quellen laden
|
||||
cursor = await db.execute(
|
||||
@@ -33,13 +33,13 @@ async def generate_suggestions(db: aiosqlite.Connection) -> int:
|
||||
""")
|
||||
issues = [dict(row) for row in await cursor.fetchall()]
|
||||
|
||||
# 3. Alte pending-Vorschläge entfernen (älter als 30 Tage)
|
||||
# 3. Alte pending-Vorschläge entfernen (älter als 30 Tage)
|
||||
await db.execute(
|
||||
"DELETE FROM source_suggestions "
|
||||
"WHERE status = 'pending' AND created_at < datetime('now', '-30 days')"
|
||||
)
|
||||
|
||||
# 4. Quellen-Zusammenfassung für Haiku
|
||||
# 4. Quellen-Zusammenfassung für Haiku
|
||||
categories = {}
|
||||
for s in sources:
|
||||
cat = s["category"]
|
||||
@@ -67,7 +67,7 @@ async def generate_suggestions(db: aiosqlite.Connection) -> int:
|
||||
f"{issue['check_type']} = {issue['status']} - {issue['message']}\n"
|
||||
)
|
||||
|
||||
prompt = f"""Du bist ein OSINT-Analyst und verwaltest die Quellensammlung eines Lagebildmonitors für Sicherheitsbehörden.
|
||||
prompt = f"""Du bist ein OSINT-Analyst und verwaltest die Quellensammlung eines Lagebildmonitors für Sicherheitsbehörden.
|
||||
|
||||
Aktuelle Quellensammlung:{source_summary}{issues_summary}
|
||||
|
||||
@@ -78,13 +78,13 @@ Beachte:
|
||||
2. Fehlende wichtige OSINT-Quellen: Schlage "add_source" mit konkreter RSS-Feed-URL vor
|
||||
3. Fokus auf deutschsprachige + wichtige internationale Nachrichtenquellen
|
||||
4. Nur Quellen vorschlagen, die NICHT bereits vorhanden sind
|
||||
5. Maximal 5 Vorschläge
|
||||
5. Maximal 5 Vorschläge
|
||||
|
||||
Antworte NUR mit einem JSON-Array. Jedes Element:
|
||||
{{
|
||||
"type": "add_source|deactivate_source|fix_url|remove_source",
|
||||
"title": "Kurzer Titel",
|
||||
"description": "Begründung",
|
||||
"description": "Begründung",
|
||||
"priority": "low|medium|high",
|
||||
"source_id": null,
|
||||
"data": {{
|
||||
@@ -104,7 +104,7 @@ Nur das JSON-Array, kein anderer Text."""
|
||||
|
||||
json_match = re.search(r'\[.*\]', response, re.DOTALL)
|
||||
if not json_match:
|
||||
logger.warning("Keine Vorschläge von Haiku erhalten (kein JSON)")
|
||||
logger.warning("Keine Vorschläge von Haiku erhalten (kein JSON)")
|
||||
return 0
|
||||
|
||||
suggestions = json.loads(json_match.group(0))
|
||||
@@ -164,14 +164,14 @@ Nur das JSON-Array, kein anderer Text."""
|
||||
|
||||
await db.commit()
|
||||
logger.info(
|
||||
f"Quellen-Vorschläge: {count} neue Vorschläge generiert "
|
||||
f"Quellen-Vorschläge: {count} neue Vorschläge generiert "
|
||||
f"(Haiku: {usage.input_tokens} in / {usage.output_tokens} out / "
|
||||
f"${usage.cost_usd:.4f})"
|
||||
)
|
||||
return count
|
||||
|
||||
except Exception as e:
|
||||
logger.error(f"Fehler bei Quellen-Vorschlägen: {e}", exc_info=True)
|
||||
logger.error(f"Fehler bei Quellen-Vorschlägen: {e}", exc_info=True)
|
||||
return 0
|
||||
|
||||
|
||||
@@ -218,7 +218,7 @@ async def apply_suggestion(
|
||||
(url,),
|
||||
)
|
||||
if await cursor.fetchone():
|
||||
result["action"] = "übersprungen (URL bereits vorhanden)"
|
||||
result["action"] = "übersprungen (URL bereits vorhanden)"
|
||||
new_status = "rejected"
|
||||
else:
|
||||
await db.execute(
|
||||
@@ -230,7 +230,7 @@ async def apply_suggestion(
|
||||
)
|
||||
result["action"] = f"Quelle '{name}' angelegt"
|
||||
else:
|
||||
result["action"] = "übersprungen (keine URL)"
|
||||
result["action"] = "übersprungen (keine URL)"
|
||||
new_status = "rejected"
|
||||
|
||||
elif stype == "deactivate_source":
|
||||
@@ -242,7 +242,7 @@ async def apply_suggestion(
|
||||
)
|
||||
result["action"] = "Quelle deaktiviert"
|
||||
else:
|
||||
result["action"] = "übersprungen (keine source_id)"
|
||||
result["action"] = "übersprungen (keine source_id)"
|
||||
|
||||
elif stype == "remove_source":
|
||||
source_id = suggestion["source_id"]
|
||||
@@ -250,9 +250,9 @@ async def apply_suggestion(
|
||||
await db.execute(
|
||||
"DELETE FROM sources WHERE id = ?", (source_id,),
|
||||
)
|
||||
result["action"] = "Quelle gelöscht"
|
||||
result["action"] = "Quelle gelöscht"
|
||||
else:
|
||||
result["action"] = "übersprungen (keine source_id)"
|
||||
result["action"] = "übersprungen (keine source_id)"
|
||||
|
||||
elif stype == "fix_url":
|
||||
source_id = suggestion["source_id"]
|
||||
@@ -264,7 +264,7 @@ async def apply_suggestion(
|
||||
)
|
||||
result["action"] = f"URL aktualisiert auf {new_url}"
|
||||
else:
|
||||
result["action"] = "übersprungen (keine source_id oder URL)"
|
||||
result["action"] = "übersprungen (keine source_id oder URL)"
|
||||
|
||||
await db.execute(
|
||||
"UPDATE source_suggestions SET status = ?, reviewed_at = CURRENT_TIMESTAMP "
|
||||
|
||||
In neuem Issue referenzieren
Einen Benutzer sperren