Kaomojis-Methodik — Kuration, Klassifikation & QA
Diese Seite erklärt in Ingenieursbegriffen, wie Kaomojis über 61.000 Kaomoji kuratiert, klassifiziert und qualitativ pflegt. Wir sind kein einfacher Copy-Paste-Katalog: wir betreiben Datenmodellierung, Deduplizierung, mehrsprachige Annotation, Ranking und Übersetzungs-QA als integrierten Pipeline.
1. Ingestion
Primärquellen: öffentliche Kaomoji, die seit Langem in japanischen BBS und sozialen Medien zirkulieren, sowie Originale unserer Redaktion und überprüfte /request-Einreichungen.
Bei der Aufnahme lehnt ein automatischer Filter charakter-, marken- oder urheberrechtlich geschützte Inhalte ab.
Alle Zeichenketten werden per Unicode NFC normalisiert.
2. Deduplizierung
Jeder Kaomoji-Text wird per SHA-256 gehasht; eine UNIQUE-Beschränkung setzt dies in der DB durch.
Fast-Duplikate werden zur menschlichen Prüfung markiert.
Etwa 8 % der Kandidaten werden abgelehnt.
3. Klassifikation
Dreischichtig: Kategorie (Emotion), Event, Szene.
KI-Entwurf → redaktionelle Prüfung.
Seit Phase 122 von 7 auf 48 Emotionen erweitert.
4. Ranking
Dynamischer Score: Kopien, Favoriten, Verweildauer.
copyCount hat das höchste Gewicht.
Alle 15 Minuten neu berechnet.
5. Mehrsprachige Pipeline
Jedes Kaomoji: Verwendungsbeispiele, Keywords, Hinweise in 12 Sprachen.
Hauptsprachen durchlaufen menschliche Prüfung.
Keywords sind natürliche Suchausdrücke, keine wörtlichen Übersetzungen.
6. Übersetzungs-QA
audit-translations.mjs --strict wöchentlich. Ziel < 5 % unübersetzt.
Neue Sprache: Checkliste über 16 Dateien.
7. Infrastruktur
Stack: Astro 6 SSR + React 19 + SQLite + PM2 + Cloudflare CDN.
TTFB ~25 ms.
Sitemap: 415.000+ URLs.
8. Kontinuierliche Verbesserung
Jede Änderung als "Phase" erfasst — im April 2026 sind wir bei Phase 554.
GA4 + GSC-Analyse 5× täglich.
A/B-Tests automatisch bewertet.
Zuletzt aktualisiert: 2026-04-15 (Phase 554)