
CodeRabbit, NVIDIA Nemotron 3 Ultra 지원 시작
해당 블로그는 Sahil Mohan Bansal 원저자의 글 'CodeRabbit now supports NVIDIA Nemotron 3 Ultra'을 번역한 것입니다. 더 나은 이해를 위해서 약간의 의역이 반영되었습니다.
요약: NVIDIA Nemotron 3 Ultra는 CodeRabbit의 셀프 호스팅 AI 코드 리뷰에서 정확하면서도 빠른 처리량을 제공합니다.
CodeRabbit이 NVIDIA Nemotron 오픈 모델 제품군에 대한 지원을 확대해, AI 코드 리뷰 워크플로에 Nemotron 3 Super와 Nemotron 3 Ultra를 추가하게 되었습니다.
Nemotron 3 Super는 컨텍스트 수집과 요약을 담당하고 Nemotron 3 Ultra는 가장 복잡한 등급을 제외한 다수의 리뷰에서 코드 리뷰 코멘트를 생성하는 데 쓰입니다. 이번에 확대된 지원은 자체 인프라에서 컨테이너 이미지를 운영하는 CodeRabbit 셀프 호스팅 고객을 대상으로 제공됩니다.
초기 평가 결과를 보면 Nemotron 3 Ultra는 주니어 등급 엔지니어링 평가에서 저희의 현재 프론티어 모델 앙상블과 동등한 수준을 보였습니다. 토큰 효율은 비슷하면서도 응답 속도는 약 2배 빨랐습니다. PR에 전달되는 리뷰 코멘트의 대부분을 만들어 내는 주력 엔진은 여전히 OpenAI와 Anthropic 모델입니다.
Super와 Ultra로 확대: 더 빠른 컨텍스트 수집과 낮은 지연
앞서 저희는 Nemotron 3 Nano와 Super 지원을 발표하면서 오픈 모델과 프론티어 모델을 섞어 쓰면 컨텍스트 수집과 PR 요약의 전체 속도를 끌어올릴 수 있다고 전한 바 있습니다. 이렇게 오픈 모델과 프론티어 모델을 혼합하면 비용 효율도 좋아집니다. 리뷰 워크플로의 각 단계를 적합한 모델 제품군으로 라우팅하기 때문입니다. PR 요약은 Nemotron이, 리뷰 코멘트는 프론티어 LLM이 맡는 식이죠.
Nemotron 제품군의 다른 모델과 마찬가지로, NVIDIA는 Ultra 역시 가중치, 학습 데이터, 학습 레시피를 함께 공개하는 진정한 오픈 모델로 출시합니다. 이 개방성 덕분에 Nemotron은 리뷰를 자체 환경 안에서 돌려야 하는 셀프 호스팅 팀에 잘 맞아 왔습니다.
Nemotron 3 Nano, Super에 더해 이제 Ultra까지 지원하면서 저희는 컨텍스트 수집, PR 요약, 그리고 리뷰 코멘트 생성의 일부 영역에 Nemotron 오픈 모델을 활용할 수 있게 되었습니다.
CodeRabbit의 AI 에이전트, 컨텍스트 보강, 지식 베이스 구성 요소를 상세히 보여 주는 기술 아키텍처 다이어그램입니다.
Nano와 Super를 넘어 Ultra가 여는 것
여러분이 풀 리퀘스트(PR)를 열면 CodeRabbit의 코드 리뷰 워크플로가 시작됩니다. 먼저 격리된 보안 샌드박스 환경에서 레포지토리 클론으로부터 코드를 분석하죠. 그와 동시에 CodeRabbit은 여러 소스에서 컨텍스트 신호를 끌어옵니다.
- 코드 및 PR 인덱스
- 린터 / 정적 애플리케이션 보안 테스트(SAST)
- 멀티 레포 코드 그래프
- 코딩 에이전트 규칙 파일
- 커스텀 리뷰 규칙과 Learnings
- 이슈 상세 정보(Plan 파일, Jira, Linear, GitHub 이슈)
- 퍼블릭 MCP 서버
- 웹 검색
이 컨텍스트 대부분은 분석 대상인 코드 diff와 함께 리뷰 코멘트를 만들기 전 PR 요약을 생성하는 데 쓰입니다. 요약은 모든 코드 리뷰의 핵심이며 리뷰 코멘트의 높은 신호 대 잡음비를 좌우하는 열쇠입니다. 저희는 리뷰 요약 과정에서 반복적으로 일어나는 컨텍스트 처리 작업에 Nemotron 3 Nano와 Super를 계속 활용합니다. 코드 리뷰에서 빼놓을 수 없는 부분이거든요.
JavaScript 함수와 변수를 표시하는 코드 에디터, 그 아래에 관련 포럼 토론이 함께 보입니다.
저희는 Nemotron 3 Ultra를 동급 프론티어 모델과 비교했습니다. 분석 결과 주니어 리뷰어 등급에서 Nemotron 3 Ultra는 다음과 같았습니다.
- 합격률과 정밀도로 측정한 리뷰 품질에서 저희의 프론티어 모델 블렌드와 동등
- 리뷰당 토큰 수가 비슷한 수준에서, 비슷한 양의 리뷰 코멘트를 생성
- 중간값 지연이 거의 50% 낮아, 프론티어 LLM만 쓸 때보다 2배 빠르게 동작
이런 결과는 사소한(trivial) 리뷰와 주니어 수준 리뷰 코멘트 양쪽에서 모두 유지됐습니다. 효율적인 오픈 모델이 더 많은 부담을 떠안을 수 있는 영역, 즉 더 빠르고 노력이 덜 드는 리뷰에서 나온 초기의 고무적인 결과입니다.
고객 입장에서 보면 품질을 양보하지 않으면서도 PR 요약, 컨텍스트 수집, 코드 리뷰가 모두 더 빨라진다는 뜻입니다.
오늘 NVIDIA가 발표한 Nemotron 오픈 모델 제품군 확대를 함께 지원하게 되어 기쁩니다. 모든 산업에 걸쳐 AI 코딩 도입을 앞당기는 데 NVIDIA와 협력하게 된 점도 무척 반갑습니다.
셀프 호스팅 인프라에서 AI 코드 리뷰를 운영하고 싶으시다면, CodeRabbit 팀에 문의해 컨테이너 이미지를 받아 보세요.
관련 글
CodeRabbit을 처음 접하신다면 CodeRabbit으로 PR 리뷰 자동화 시작하기부터 보시길 추천합니다. 오픈 모델과 멀티 레포 분석이 어떻게 맞물리는지는 멀티 레포 분석에서, 리뷰 비용을 줄이는 모델 조합 전략은 토큰맥싱을 넘어 머지맥싱으로에서 확인하실 수 있습니다.