API Providers Leaderboard

Compare the latency, speed, and pricing of top serverless inference providers for open-weights models.

#	Provider	Models Available	Avg TTFT (s)	Avg Speed (t/s)	Pricing Level
1	Groq	15+	0.15s	800	Medium
2	Fireworks AI	85+	0.20s	180	Low
3	OctoAI	25+	0.22s	150	Low
4	Together AI	150+	0.25s	120	Low
5	Anyscale	35+	0.28s	110	Medium
6	DeepInfra	40+	0.35s	90	Lowest