Skip to main content

Kaomojis-Methodik — Kuration, Klassifikation & QA

Diese Seite erklärt in Ingenieursbegriffen, wie Kaomojis über 61.000 Kaomoji kuratiert, klassifiziert und qualitativ pflegt. Wir sind kein einfacher Copy-Paste-Katalog: wir betreiben Datenmodellierung, Deduplizierung, mehrsprachige Annotation, Ranking und Übersetzungs-QA als integrierten Pipeline.

1. Ingestion

Primärquellen: öffentliche Kaomoji, die seit Langem in japanischen BBS und sozialen Medien zirkulieren, sowie Originale unserer Redaktion und überprüfte /request-Einreichungen.

Bei der Aufnahme lehnt ein automatischer Filter charakter-, marken- oder urheberrechtlich geschützte Inhalte ab.

Alle Zeichenketten werden per Unicode NFC normalisiert.

2. Deduplizierung

Jeder Kaomoji-Text wird per SHA-256 gehasht; eine UNIQUE-Beschränkung setzt dies in der DB durch.

Fast-Duplikate werden zur menschlichen Prüfung markiert.

Etwa 8 % der Kandidaten werden abgelehnt.

3. Klassifikation

Dreischichtig: Kategorie (Emotion), Event, Szene.

KI-Entwurf → redaktionelle Prüfung.

Seit Phase 122 von 7 auf 48 Emotionen erweitert.

4. Ranking

Dynamischer Score: Kopien, Favoriten, Verweildauer.

copyCount hat das höchste Gewicht.

Alle 15 Minuten neu berechnet.

5. Mehrsprachige Pipeline

Jedes Kaomoji: Verwendungsbeispiele, Keywords, Hinweise in 12 Sprachen.

Hauptsprachen durchlaufen menschliche Prüfung.

Keywords sind natürliche Suchausdrücke, keine wörtlichen Übersetzungen.

6. Übersetzungs-QA

audit-translations.mjs --strict wöchentlich. Ziel < 5 % unübersetzt.

Neue Sprache: Checkliste über 16 Dateien.

7. Infrastruktur

Stack: Astro 6 SSR + React 19 + SQLite + PM2 + Cloudflare CDN.

TTFB ~25 ms.

Sitemap: 415.000+ URLs.

8. Kontinuierliche Verbesserung

Jede Änderung als "Phase" erfasst — im April 2026 sind wir bei Phase 554.

GA4 + GSC-Analyse 5× täglich.

A/B-Tests automatisch bewertet.

Zuletzt aktualisiert: 2026-04-15 (Phase 554)