GitHub 'LearningCircuit/local-deep-research' 트렌딩… 로컬 LLM·SearXNG 기반 에이전틱 리서치 어시스턴트, SimpleQA 약 95% 정확도
<p>GitHub LearningCircuit/local-deep-research(LDR)이 트렌딩에 올랐다. 다중 LLM과 검색 엔진을 활용해 인용을 포함한 심층·에이전틱 리서치를 수행하는 AI 리서치 어시스턴트로, 사용자가 직접 통제하고 로컬에서 실행할 수 있는 것이 특징이다. 검색 가능한 자체 지식 베이스를 구축할 수 있도록 설계됐다.</p>
<p>설치 옵션은 세 가지다. Docker Run(Linux)에서는 ollama/ollama 컨테이너를 11434 포트로 실행한 뒤 gpt-oss:20b 모델을 받고, SearXNG를 8080 포트, localdeepresearch/local-deep-research를 5000 포트로 띄우면 된다. Docker Compose는 CPU 전용(전 플랫폼)과 NVIDIA GPU(Linux)용 두 가지 구성을 제공한다. pip install local-deep-research는 Windows·macOS·Linux에서 동작하며 SQLCipher 암호화는 사전 빌드된 휠로 포함돼 별도 컴파일이 필요 없다. 컨테이너 기동 약 30초 후 http://localhost:5000에서 접속할 수 있다.</p>
<p>새로 추가된 LangGraph Agent Strategy는 자율 에이전틱 리서치 모드로, LLM이 무엇을 검색할지, 어떤 전문 엔진(arXiv·PubMed·Semantic Scholar 등)을 쓸지, 언제 종합할지를 직접 결정한다. 발견된 결과에 따라 검색 엔진을 적응적으로 전환하며, 파이프라인 기반 전략보다 훨씬 더 많은 소스를 모은다는 초기 결과를 제시했다. 설정에서 langgraph-agent를 선택해 사용할 수 있다.</p>
<p>벤치마크 측면에서는 GPT-4.1-mini + SearXNG + focused-iteration 전략으로 SimpleQA에서 약 95% 정확도라는 예비 결과를 보고했다. 커뮤니티가 운영하는 LDR Benchmarks 데이터셋이 Hugging Face에 공개되어 모델·검색 엔진·전략별 정확도를 추적하며, Ollama·LM Studio·llama.cpp용 모델을 다운로드하기 전에 어떤 로컬 모델이 잘 동작하는지 확인할 수 있도록 돕는다.</p>
<p>지원 검색 소스는 학술(arXiv·PubMed·Semantic Scholar), 일반(Wikipedia·SearXNG), 기술(GitHub·Elasticsearch), 역사(Wayback Machine), 뉴스(The Guardian·Wikinews) 외에 Tavily, Google(SerpAPI 또는 Programmable Search Engine), Brave Search, 로컬 문서, LangChain Retrievers, Meta Search 등을 포함한다. 다운로드한 학술 논문·웹페이지를 암호화 라이브러리에 색인해 다음 리서치 때 자체 문서와 라이브 웹을 함께 질의할 수 있다.</p>
<p>Journal Quality System은 OpenAlex(CC0), DOAJ(CC0), Stop Predatory Journals(MIT)를 활용해 212K+ 색인된 소스의 저널 평판 자동 채점, 약탈적 저널 탐지, 품질 대시보드를 제공한다. 학술 리서치의 신뢰성 평가를 자동화하기 위한 구성이다.</p>
<p>프라이버시 측면에서는 사용자별 격리된 SQLCipher 데이터베이스를 AES-256(시그널 수준)으로 암호화하고, 비밀번호 복구가 없는 제로 지식 모델을 채택했다. Ollama와 SearXNG 조합으로 완전 로컬 실행이 가능해 데이터가 외부로 나가지 않는다. 텔레메트리·분석·트래킹·외부 스크립트가 없으며, 사용자가 명시적으로 시작한 검색 질의·LLM API 호출·Apprise 알림만 수행한다.</p>
<p>공급망 보안에서는 Docker 이미지를 Cosign으로 서명하고 SLSA provenance attestation과 SBOM을 동봉해 cosign verify localdeepresearch/local-deep-research:latest로 검증할 수 있다. 주요 기능으로는 30초~3분 Quick Summary, 상세 리서치, 보고서 생성, 문서 분석, LangChain 통합, REST API, WebSocket 기반 실시간 진행 상황, PDF·Markdown 내보내기, 일·주·커스텀 주기 자동 리서치 다이제스트, ESC·Ctrl+Shift+1~5 키보드 단축키 등을 갖췄다. LDR은 robots.txt를 준수하고 페이지 요청 시 자기 자신을 정직하게 식별하며, 별도의 우회·은닉 기법은 사용하지 않는다.</p>