Narzędzia i protokoły

Streaming output

Tryb, w którym model zwraca odpowiedź na bieżąco, token po tokenie – jak pisanie w ChatGPT. Użytkownik widzi pierwsze słowo po 200ms zamiast po 8s.

Mylone z:latency
Powiązane:LatencyAPI
Udostępnij:LinkedInX

Powiązane pojęcia

Chcesz to wdrożyć u siebie?

Uczymy AI i automatyzacji na realnych projektach – od pierwszego workflow po agentów.