Narzędzia i protokołyStreaming outputPo ludzkuW praktyceTechnicznieTryb, w którym model zwraca odpowiedź na bieżąco, token po tokenie – jak pisanie w ChatGPT. Użytkownik widzi pierwsze słowo po 200ms zamiast po 8s.Mylone z:latencyPowiązane:LatencyAPIUdostępnij:Kopiuj linkLinkedInXKopiuj definicję