
법률 AI의 보이지 않는 설계도, 온톨로지(Ontology)
법률 AI를 이야기할 때 많은 분들은 먼저 판례 검색, 조문 검색, 그리고 최근 널리 쓰이는 RAG(Retrieval-Augmented Generation)를 떠올립니다. 물론 이 기술들은 중요합니다.
다만 법률 AI가 정말로 “법을 안다”고 말하려면, 단지 문서를 많이 읽는 수준을 넘어 법적 개념이 무엇인지, 그 개념들이 서로 어떤 관계를 맺는지, 그리고 어떤 요건 아래 어떤 효과가 발생하는지를 구조적으로 다룰 수 있어야 합니다. 그 토대를 만드는 것이 바로 온톨로지(Ontology)입니다.

온톨로지란 무엇인가
온톨로지는 원래 철학의 존재론에서 온 개념입니다.
그러나 정보과학과 인공지능 분야에서의 온톨로지는 철학 일반을 뜻하지 않습니다. 이 분야에서 온톨로지는 특정 영역에서 중요한 개념, 관계, 구별, 제약을 명시적으로 정의한 지식 모델을 가리킵니다.
Tom Gruber의 고전적 정의는 이를 “개념화에 대한 명시적 명세”라고 설명하며, W3C의 OWL 2 역시 온톨로지를 클래스(classes), 개체(individuals), 속성(properties), 데이터값 등을 통해 형식적으로 표현하고 추론할 수 있는 체계로 설명합니다. (Tom Gruber)
쉽게 말해, 온톨로지는 AI에게 단어를 많이 알려주는 기술이 아닙니다. 그보다 ‘사기’, ‘기망’, ‘착오’, ‘처분행위’, ‘재산상 손해’가 서로 어떻게 이어지는지를 같은 의미 체계 안에서 정의하는 기술에 가깝습니다.
법률에서는 표면적으로 비슷한 단어보다, 개념의 위계와 차이, 요건과 효과의 연결이 훨씬 중요합니다. 그래서 법률 AI에서 온톨로지는 단순 검색 보조도구가 아니라, 법적 의미를 통일하는 장치가 됩니다. (Tom Gruber)

법률에서는 왜 온톨로지가 특히 중요한가
법은 본질적으로 의의(정의, 분류, 관계), 요건, 효과, 예외의 체계입니다. 예를 들어 “자연인”과 “법인”은 같은 주체가 아니고, “소유권”과 “점유”는 밀접하지만 다른 개념이며, “무효”와 “취소”는 효과가 전혀 다릅니다.
사람은 법학교육과 실무를 통해 이런 구별을 체득하지만, 컴퓨터는 이를 별도로 구조화하지 않으면 제대로 다루기 어렵습니다. 바로 이 지점에서 온톨로지가 필요합니다.
온톨로지는 개념을 정리하는 데서 멈추지 않고, 어떤 개념이 상위 개념인지, 무엇이 무엇의 요건인지, 어떤 법적 효과가 어떤 조건 아래 연결되는지를 기계가 이해할 수 있는 형태로 정리합니다. (Springer)
실제로 법률 온톨로지는 오래전부터 법률 정보처리와 지식공학 분야에서 사용되어 왔습니다.
Breuker 등의 연구는 법적 추론에 공통으로 필요한 지식 구조를 포착하는 핵심 법률 온톨로지를 제시했고, 2019년의 체계적 문헌검토는 법률 온톨로지가 다양한 법영역과 목적에 걸쳐 축적되어 왔음을 보여줍니다.
2025년의 computational law 리뷰도 대규모 계산법학 시스템과 상호운용성을 위해 온톨로지 같은 의미 자원이 중요하다고 평가합니다. 즉, 온톨로지는 설명용 개념도가 아니라 법률 AI의 인프라입니다. (Springer)

온톨로지의 핵심 구성 요소
온톨로지의 핵심 구성 요소, 즉 클래스, 인스턴스, 속성, 관계는 그 출발점입니다.
W3C OWL 2도 기본적으로 객체를 individuals, 범주를 classes, 연결을 properties로 설명합니다.
다만 실무형 설명으로 가려면 여기에 제약(constraints)과 공리(axioms, 증명이 불필요한 그 자체로 진리로 인정되는 명제, 이론의 기초)라는 요소까지 붙여주는 것이 좋습니다. 그래야 단순 정리표가 아니라 “추론 가능한 구조”가 됩니다.
- 클래스(Class): 법적 범주입니다. 예를 들어 자연인, 법인, 계약, 판결, 재산죄, 불법행위 등이 여기에 해당합니다.
- 인스턴스(Instance / Individual): 실제 개별 대상입니다. 예를 들면 “주식회사 삼성전자”, “대법원 2023도123 판결”, “2025년 1월 10일 체결된 매매계약” 같은 구체적 객체입니다.
- 속성(Property): 개체나 개념이 가지는 특징입니다. 선고일, 시행일, 벌금형 상한, 공소시효, 계약 체결일 등이 여기에 포함됩니다.
- 관계(Relationship): 개념과 개념, 개체와 개체를 연결합니다. 예를 들어 “사기죄는 재산죄의 일종이다”, “이 판결은 이 조문을 적용한다”, “갑은 을에게 채무를 부담한다” 같은 연결입니다.
- 제약과 공리: 어떤 관계가 항상 참인지, 어떤 속성이 특정 조건에서만 허용되는지를 정합니다. 법률 AI에서 특히 중요한 부분입니다. (W3C)
여기서 중요한 것은 온톨로지가 단순한 분류표가 아니라는 점입니다. 분류표는 상하 관계를 보여줄 수 있지만, 온톨로지는 여기에 더해 속성, 관계, 제약, 논리 규칙을 담습니다. 법률 영역에서는 바로 그 차이가 결정적입니다. 왜냐하면 법은 “무엇의 종류인가”보다 “어떤 요건 아래 어떤 법적 효과가 발생하는가”가 훨씬 중요하기 때문입니다. (W3C)

RAG와 온톨로지의 차이: 대체재가 아니라 보완재
실무적으로는 두 기술을 경쟁 관계로 놓기보다 기능이 다른 보완재로 보는 편이 맞습니다.
RAG는 외부 문서를 검색해 모델에게 공급함으로써 최신 정보 접근성과 근거 제시 능력을 높이는 데 강점이 있습니다.
반면 온톨로지는 검색된 자료 안의 개념들을 같은 의미 체계로 정렬하고, 법적 관계를 구조화하는 데 강합니다.
이 구별은 매우 중요합니다. RAG는 환각을 줄이는 데 도움이 되지만, 그것만으로 충분하지는 않습니다.
RAGTruth는 RAG를 사용하더라도 모델이 검색된 내용에 의해 지지되지 않거나, 오히려 검색 문맥과 충돌하는 주장을 생성할 수 있음을 보여줍니다. CRAG 역시 RAG가 retrieved documents의 관련성에 크게 의존하기 때문에, 검색이 어긋나면 출력의 강건성이 흔들릴 수 있다고 지적합니다.
결국 법률 분야에서는 “문서를 잘 찾는 능력”과 “법적 의미를 일관되게 구조화하는 능력”을 분리해 설계해야 합니다. (ACL 앤솔로지)
그래서 더 정확한 표현은 이렇습니다.
RAG는 법령·판례·행정해석을 가져오는 층이고, 온톨로지는 그 자료 안의 법적 개념을 정렬하는 층이며, 추론 규칙은 그 위에서 결론을 도출하는 층입니다.
법률 AI는 이 세 층이 맞물릴 때 비로소 실무적으로 설득력 있는 방향으로 발전합니다. (OpenReview)

법률 온톨로지의 실제 예시: 음주운전 사건
2026년 3월 31일 기준에 따르면, 음주운전의 기준선은 혈중알코올농도 0.03% 이상이고, 0.03% 이상 0.08% 미만은 기본적으로 면허정지 구간, 0.08% 이상은 면허취소 사유에 해당합니다.
또한 음주측정 불응, 재차 위반, 사고 발생 여부에 따라 처분과 처벌 구조가 달라질 수 있습니다. 형사처벌도 혈중알코올농도 구간에 따라 달라집니다.
이를 온톨로지로 표현하면, 단순히 “음주운전”이라는 이름 아래 사건을 모아두는 것이 아닙니다. 예를 들면 다음과 같이 구성할 수 있습니다.
- 사건 클래스: 음주운전 사건
- 상위 개념: 도로교통법 위반
- 핵심 속성: 혈중알코올농도, 측정불응 여부, 사고 발생 여부, 인적 피해 여부, 재범 여부
- 법적 효과와의 관계:
- 0.03% 이상 → 음주운전 금지 기준 충족
- 0.03% 이상 0.08% 미만 → 면허정지 및 해당 형사처벌 구간 검토
- 0.08% 이상 → 면허취소 및 상향된 형사처벌 구간 검토
- 측정불응 → 별도 취소사유 및 처벌 검토
- 재범·사고·인적 피해 → 가중 또는 별도 법적 효과 검토
이렇게 설계해두면 AI는 사용자의 입력이 “혈중알코올농도 0.09%, 과거 음주 전력 1회, 사고 없음”일 때, 단순히 비슷한 사례를 검색하는 데서 그치지 않고 어떤 법적 쟁점을 어떤 순서로 검토해야 하는지를 구조적으로 제시할 수 있습니다.
다만 여기서도 주의할 점이 있습니다. 실제 사건에서는 음주 시점과 측정 시점의 간격, 위드마크 계산 가능성, 측정 절차의 적법성, 행정처분 불복 여부 같은 변수가 추가됩니다.
따라서 온톨로지는 사건을 자동 판결하는 장치가 아니라, 검토의 틀을 정밀하게 만드는 장치라고 보는 편이 맞습니다.

온톨로지의 장점과 한계
온톨로지의 장점은 분명합니다.
첫째, 개념을 통일해 용어 혼선을 줄입니다.
둘째, 법적 관계를 명시해 설명가능성을 높입니다.
셋째, 잘 설계된 범위 안에서는 추론 근거를 검토할 수 있어 검증 가능성이 좋아집니다.
이런 특성 때문에 온톨로지는 법률 문서 검색, 지식베이스, 사례 분류, 규정 준수 검토 등에서 꾸준히 활용되어 왔습니다. (Springer)
하지만 한계도 분명히 있습니다.
W3C OWL 2 Primer는 공리들이 미묘하게 상호작용할 수 있어, 그 효과를 사람이 직관적으로 모두 예측하기 어렵고 지식공학 경험이 중요하다고 설명합니다.
법률 분야는 더 복잡합니다. 법은 예외가 많고, 시간에 따라 개정되며, 조문과 판례, 일반원칙과 특칙이 얽혀 있습니다. 그래서 “온톨로지 기반 AI는 정의된 규칙 내에서만 답하므로 정확하다”라고 단정하기보다는, 잘 설계된 범위에서는 더 일관되고 검토 가능한 답을 하도록 돕는다고 표현하는 편이 더 정확합니다. (W3C)

결론: 법률 AI의 경쟁력은 문서량이 아니라 개념 구조화에서 나온다
법률 AI의 실력은 AI가 단지 더 많은 판례를 읽는 데서 나오지 않습니다.
진짜 차이는 법적 개념을 얼마나 정교하게 구조화하고, 그 구조 안에서 얼마나 일관되게 설명하고 추론하느냐에서 납니다. 온톨로지는 바로 그 구조를 만드는 기술입니다.
RAG가 법률 문서를 가져오는 기술이라면, 온톨로지는 그 문서 안의 법적 의미를 같은 언어로 정렬해 AI가 흔들리지 않게 만드는 기술입니다.

'인공지능과 법' 카테고리의 다른 글
| [연구보고] AI 판사 도입시 디지털 변론주의의 확립: 프롬프트 합의 및 메타데이터 중립성 확보 방안 (0) | 2026.03.13 |
|---|---|
| TAM/SAM/SOM 시장 분석: 재판헌법소원 심판청구서 작성 서비스 (0) | 2026.03.13 |
| Legal AI - SaaS 개발 전성시대 (1) | 2026.01.12 |
| 법률 AI 프롬프트 엔지니어링(Legal Prompt Engineering)의 주의 사항 (0) | 2026.01.09 |
| 인공지능 법률서비스 제공과 변호사법의 상관관계 (0) | 2025.11.25 |