목록으로
제품2026년 5월 11일 AM 05:07

AMD MI300X로 'MachinaCheck' 공개… CNC 제조 가능성 30초 자동 판정

AMD Developer Hackathon에서 공개된 다중 에이전트 시스템 'MachinaCheck'가 AMD Instinct MI300X에서 Qwen 2.5 7B Instruct를 온프레미스로 구동해 STEP CAD 파일의 CNC 제조 가능성을 자동 판정한다. 사용자가 STEP 파일과 재질·요구 공차·나사 규격 세 가지만 입력하면 약 30초 안에 제조 가능 여부, 필요 공구, 누락 항목, 사전 액션이 정리된 보고서가 나온다.

팀이 지목한 문제는 머신숍의 수작업 견적 부담이다. CNC 작업 매니저는 RFQ 한 건당 도면을 인쇄해 치수를 손으로 읽고, 작업장을 돌며 가용 공구와 장비의 공차 보유 여부를 확인한다. 이 과정에 보통 30~60분이 걸리며, 주당 10~20건의 RFQ를 받는 바쁜 공장은 실현성 분석에만 매니저 시간 5~20시간을 쓴다. 잘못 수락한 작업이 도중 중단되면 장비 시간과 부품이 폐기된다.

MI300X 선택은 기술이 아니라 사업 요건이다. 제조 고객의 STEP 파일은 NDA 대상 기밀로, 의료기기 홀 패턴이나 항공우주 부품의 포켓 형상은 수년간의 엔지니어링과 R&D 투자가 담긴 지식재산이다. 팀은 이런 데이터를 OpenAI·Anthropic 등 상용 API로 보내는 것을 기밀 위반으로 규정했다. 192GB HBM3 VRAM과 5.3 TB/s 메모리 대역폭을 갖춘 MI300X 위에서 Qwen 2.5 7B Instruct 전체를 자체 인프라로 돌려 STEP 지오메트리 단 한 바이트도 외부로 나가지 않게 했다.

파이프라인은 5개 컴포넌트로 구성된다. 첫 단계는 OpenCASCADE 기반 Python 라이브러리 cadquery를 쓰는 STEP 파서로, 원통형 홀의 지름·깊이, 평면, 챔퍼·필렛, 바운딩 박스, 부피·표면적을 수학적으로 정확히 추출한다. LLM이나 비전 모델, OCR을 거치지 않으므로 Ø6.0mm 홀은 출력에서도 정확히 Ø6.0mm로 잡힌다.

이어지는 네 개 에이전트가 작업을 분담한다. 1번 '작업 분류기'는 추출된 지오메트리와 사용자 입력을 받아 어떤 CNC 가공과 공구가 필요한지 판단한다(Steel 304는 카바이드 공구, ±0.005mm 공차는 정밀 머신 등). 2번 '공구 매처'는 LLM 없이 순수 Python으로 작업장 공구 재고 DB를 조회한다. 3번 '실현성 판단 에이전트'는 매칭 결과를 바탕으로 결정·신뢰도·이유·액션 항목·리스크 플래그·예상 셋업 시간이 담긴 구조화된 JSON을 반환한다. 4번 '보고서 생성기'는 이를 종합해 최종 권고 보고서로 묶는다. 전체는 LangChain으로 연결되고 FastAPI로 서빙된다.

vLLM 서버는 gpu-memory-utilization 0.5 설정으로 192GB 가운데 약 96GB만 점유해 여유 공간을 남긴다. 에이전트 호출의 평균 추론 지연은 3초 미만이고, 피처 50개까지의 STEP 파일 추출은 1초 미만이다. GrabCAD의 실제 STEP 파일 테스트에서 4개 에이전트 풀 파이프라인은 25~40초에 종료됐고, 검증 부품 전부에서 제조 가능성 판정이 일치했다.

팀이 정리한 교훈은 두 가지다. 첫째, LLM은 추론이 필요한 자리에만 쓴다. 공구 매칭처럼 데이터베이스 조회로 끝나는 단계에 LLM을 끼우면 느리고 비싸고 환각 위험이 커진다. 둘째, 구조화 출력 프롬프트 엔지니어링이 중요하다. Qwen이 유효한 JSON을 안정적으로 뱉도록 '원통형 홀에는 드릴, 엔드밀 아님' '지름은 정확히 일치' '나사 규격이 명시될 때만 탭 포함' 같은 규칙을 명시했다. 또 192GB VRAM이 여유로워 프로덕션에서는 Qwen 2.5 72B까지 확장해 추론 품질을 더 끌어올릴 여지가 있다고 덧붙였다.

MachinaCheck는 2026년 5월 AMD Developer Hackathon에서 Syed Muhammad Sarmad와 Sabari Doss R가 만들었다. 데모는 Hugging Face Spaces, 코드는 GitHub에 공개됐다. 스택은 Qwen 2.5 7B·AMD Instinct MI300X·ROCm·vLLM·LangChain·cadquery·FastAPI·Next.js·Hugging Face Spaces로 정리됐다.

AI인사이트 편집팀

이 기사는 AI 기술을 활용해 작성되었으며, 편집팀이 검수했습니다.

관련 기사