Jakość i operacje AI
Latency· Opóźnienie
„Ile czekasz na odpowiedź. W AI i webie to różnica między 'wow' a 'zamykam'.”
Bot AI odpowiadający 8 sekund frustruje. Streaming (odpowiedź na żywo) i szybszy model obniżają odczuwaną latencję.
Po co Ci to: Wpływa wprost na to, czy ludzie chcą używać Twojego narzędzia.
Mylone z:throughput
