AegisSight-Monitor

AegisSight/AegisSight-Monitor

Fork 0

Commit graph

Autor	SHA1	Nachricht	Datum
Claude Code	e68386f6bb	feat(sources): PDF-Dokumente als neuer Quellentyp pdf_document - SOURCE_TYPE_PATTERN um pdf_document erweitert - src/services/pdf_ingest.py: pdfplumber + Tesseract-OCR-Fallback, Uebersetzung nach DE+EN, ein Pool-Artikel pro PDF - Scheduler-Job pdf_ingest laeuft im Minuten-Takt und verarbeitet pdf_document-Quellen mit processed_at IS NULL - scripts/migrate_pdf_source.py: idempotente DB-Migration (sources.pdf_path/pdf_sha256/processed_at, articles.headline_en/content_en) - requirements.txt: pdfplumber, pytesseract, pdf2image, Pillow	2026-05-16 23:21:50 +00:00

Autor

SHA1

Nachricht

Datum

Claude Code

e68386f6bb

feat(sources): PDF-Dokumente als neuer Quellentyp pdf_document

- SOURCE_TYPE_PATTERN um pdf_document erweitert
- src/services/pdf_ingest.py: pdfplumber + Tesseract-OCR-Fallback,
  Uebersetzung nach DE+EN, ein Pool-Artikel pro PDF
- Scheduler-Job pdf_ingest laeuft im Minuten-Takt und verarbeitet
  pdf_document-Quellen mit processed_at IS NULL
- scripts/migrate_pdf_source.py: idempotente DB-Migration
  (sources.pdf_path/pdf_sha256/processed_at, articles.headline_en/content_en)
- requirements.txt: pdfplumber, pytesseract, pdf2image, Pillow

2026-05-16 23:21:50 +00:00

1 Commits