제품2026년 5월 6일 오후 10:06

GitHub Trending 'free-llm-api-resources' 누적 20,214 스타·오늘 344개… 무료 LLM API 한도 큐레이션, Gemini 3 Flash 250,000 토큰/분·Llama 4 Scout 일일 1,000 요청 정리

무료 LLM API 서비스 큐레이션 저장소 cheahjs/free-llm-api-resources가 GitHub Trending에 노출됐다. 누적 별 20,214개, 오늘 추가된 별 344개를 기록 중이며, 저장소는 "API 기반 LLM 사용에 대해 무료 액세스 또는 크레딧을 제공하는 다양한 서비스"를 정리한다고 설명한다.

메인 안내문은 "이 서비스들을 남용하지 말아 달라; 그렇지 않으면 잃을 수 있다"고 적었으며, 기존 챗봇을 리버스 엔지니어링하는 등 정당하지 않은 서비스는 명시적으로 제외한다고 밝혔다.

한 항목은 분당 20 요청, 일일 50 요청을 기본 한도로 제시하고, $10 평생 토픽업으로 일일 최대 1,000 요청까지 확장 가능하다고 표기했다. 모델은 공통 쿼터를 공유한다고 설명한다.

Gemini 3 Flash와 Gemini 2.5 Flash는 분당 250,000 토큰·일일 20 요청·분당 5 요청, Gemini 3.1 Flash-Lite는 분당 250,000 토큰·일일 500 요청·분당 15 요청을 한도로 안내했다. Gemini Robotics-ER 1.6과 1.5도 동일하게 분당 250,000 토큰 한도가 명시됐다. Gemma 3 27B·12B·4B·1B Instruct는 모두 분당 15,000 토큰·일일 14,400 요청·분당 30 요청 한도를 동일하게 적용한다고 표기했다.

Llama 4 Scout Instruct는 일일 1,000 요청·분당 30,000 토큰, Whisper Large v3와 Whisper Large v3 Turbo는 각각 분당 7,200 오디오초·일일 2,000 요청 한도가 명시됐다.

Cohere 무료 트라이얼은 분당 20 요청·월 1,000 요청에 모든 모델이 공통 월간 쿼터를 공유한다고 적시됐다. Cloudflare Workers AI는 일일 10,000 neurons 한도를 적용하고, Mistral La Plateforme는 분당 30 요청·일일 2,000 요청 한도에서 Codestral을 제공한다고 안내했다.

무료로 표기된 OpenRouter 풀에는 google/gemma-4-26b-a4b-it, openai/gpt-oss-120b·gpt-oss-20b, nvidia/nemotron-3-super-120b-a12b·nvidia/nemotron-nano-9b-v2, qwen/qwen3-coder, z-ai/glm-4.5-air 등이 포함됐다. GitHub Models 카탈로그에는 OpenAI gpt-5·gpt-5-chat(preview)·gpt-5-mini·gpt-5-nano, o1·o3·o4-mini, Phi-4·Phi-4-reasoning 시리즈, Llama 4 Maverick 17B 128E Instruct FP8, Llama 4 Scout 17B 16E Instruct, DeepSeek-R1·V3-0324, Grok 3·Grok 3 Mini 등이 등재됐다.

별도 크레딧 제공 항목으로는 1년 $0.5, 3개월 $10(Jamba 패밀리), 3개월 $10(Solar Pro/Mini), $15(전화번호 인증), $30(어떤 지원 모델이든 컴퓨트 시간 과금), 모델당 1백만 토큰, 가입 시 $5/월·결제 수단 등록 시 $30/월(Qwen) 등이 안내됐다.

GitHub Trending 'free-llm-api-resources' 누적 20,214 스타·오늘 344개… 무료 LLM API 한도 큐레이션, Gemini 3 Flash 250,000 토큰/분·Llama 4 Scout 일일 1,000 요청 정리

관련 기사