구글 클라우드, AI 에이전트용 지식 공유 표준 '오픈 날리지 포맷' 공개
구글 클라우드가 현대 AI 시스템이 필요로 하는 메타데이터와 맥락, 정제된 지식을 표현하는 개방형 표준 '오픈 날리지 포맷(Open Knowledge Format, OKF)'을 공개했다. 파운데이션 모델이 계속 발전해도 적절한 맥락이 없으면 정확하고 실행 가능한 결과를 내기 어렵고, 특히 에이전트 시스템을 구축할 때 이 한계가 두드러진다는 문제의식에서 출발했다. 데이터 애널리틱스·빅쿼리 테크리드 샘 맥비티와 아미르 호르마티가 소개했다.
OKF는 지난 1년 사이 등장한 'LLM 위키' 패턴을 이식 가능하고 상호운용 가능한 형식으로 공식화한 사양이다. 특정 벤더에 묶이지 않으며 에이전트와 사람 모두 다루기 쉬운 표준을 지향한다.
v0.1 버전은 지식을 YAML 프런트매터가 달린 마크다운 파일들의 디렉터리로 표현한다. 복잡한 압축 방식도, 새로운 런타임도, 필수 SDK도 없다. OKF 문서 묶음은 어떤 에디터에서나 읽히는 마크다운이고, 압축 파일로 배포하거나 깃 저장소에 올릴 수 있는 파일이며, 질의가 필요한 소수 필드(type, title, description, resource, tags, timestamp)만 YAML로 둔다. 옵시디언이나 노션, 휴고를 써봤다면 익숙한 형태다.
이런 표준이 필요한 이유는 맥락이 파편화돼 있기 때문이다. 대부분의 조직에서 모델이 쓰는 정보는 테이블 스키마, 지표의 사업적 의미, 장애 대응 런북, 시스템 간 조인 경로처럼 압도적으로 내부 지식이다. 그러나 이런 지식은 메타데이터 카탈로그, 위키와 공유 드라이브, 코드 주석과 노트북 셀, 일부 시니어 엔지니어의 머릿속 등 서로 호환되지 않는 시스템에 흩어져 있다. 벤더마다 자체 카탈로그와 SDK, 지식그래프 스키마를 제공해 지식이 제품이나 조직을 넘나들기 어렵다.
AI 연구자 안드레이 카파시는 자신의 'LLM 위키' 글에서 "LLM은 지루해하지 않고, 상호 참조 업데이트를 잊지 않으며, 한 번에 15개 파일을 건드릴 수 있다"고 적었다. 사람이 개인 위키를 포기하게 만드는 잡무가 바로 LLM이 잘하는 일이라는 것이다. 옵시디언 볼트, AGENTS.md·CLAUDE.md 계열 규약 파일, 에이전트가 작업 전 참고하는 index.md·log.md 저장소 등 비슷한 '위키로서의 지식' 패턴이 이름만 바꿔 계속 나타났지만, 서로 협력하도록 의도적으로 설계되진 않았다는 점을 OKF는 지적한다.
동작 방식은 단순하다. OKF 번들은 테이블, 데이터셋, 지표, 플레이북, 런북, API 등 개념을 담은 마크다운 파일 디렉터리다. 개념 하나가 파일 하나이며 파일 경로가 그 개념의 정체성이 된다. 개념들은 일반 마크다운 링크로 서로 연결돼, 파일시스템의 부모·자식 관계보다 풍부한 관계 그래프를 이룬다. 선택적으로 점진적 정보 공개를 위한 index.md와 변경 이력을 담는 log.md를 포함할 수 있다. v0.1 전체 사양은 한 페이지에 들어간다.
설계 원칙은 세 가지다. 첫째, 최소한의 규정만 둔다. 모든 개념에 단 하나, type 필드만 요구하고 나머지는 생산자에게 맡긴다. 둘째, 생산자와 소비자의 독립이다. 사람이 손으로 쓴 번들을 AI 에이전트가 소비하거나, 한 LLM이 합성한 번들을 다른 LLM이 질의할 수 있다. 셋째, 플랫폼이 아니라 형식이다. 특정 클라우드나 데이터베이스, 모델 제공자, 에이전트 프레임워크에 묶이지 않으며 읽고 쓰고 서비스하는 데 독점 계정이나 SDK가 필요 없는 개방 표준으로 공개했다.
구글 클라우드는 사양을 구체화하기 위해 생산과 소비 양쪽의 참조 구현도 함께 공개했다. 빅쿼리 데이터셋을 훑어 테이블과 뷰마다 OKF 개념 문서를 초안하고, 두 번째 LLM 패스로 공식 문서를 크롤링해 인용·스키마·조인 경로를 보강하는 보강 에이전트, 어떤 OKF 번들이든 백엔드 없이 자체 완결형 단일 파일로 인터랙티브 그래프를 보여주는 정적 HTML 시각화 도구, 그리고 GA4 이커머스·스택오버플로·비트코인 공개 데이터셋으로 만든 바로 열어볼 수 있는 샘플 번들 3종이다.